快科技5月6日消息,上月底发布的DeepSeek V4已经成为国产最强的AI大模型,但跟美国最强的大模型相比还落后不少,此前美国的评估是落后8个月。
但落后8个月的对比是跟GPT-5.5这样的大模型相比的,后者之上实际上还有一两款大模型,只不过没有全面放开给大家使用,那就是Anthropic的Mythos大模型。
Mythos大模型在一个月前的4月8日发布,由于太过强大,Anthropic公司表示不会开放给公众使用,要先给一些互联网公司及机构开放使用,用于寻找安全漏洞,后面再说开放。
这些宣传也是A家的老套路了,实际上Mythos已经在微软及亚马逊的云平台上开放了,只不过价格比Opus还要贵很多。
至于性能,Mythos确实把AI榜单的分数再提升了一个档次,尤其是软件编程上,SWE-bench Pro(最接近真实软件工程场景的评测)上,Mythos得分77.8%,Opus 4.6是57.3%,直接提升20个百分点,比之前的Opus、GPT版本迭代提升个位数的表现已经大不同了。
Mythos为何这么强,很大可能跟参数量有关,马斯克之前暗示其参数量达到了10万亿级别,要知道V4 Pro也就1.6万亿参数量,Mythos整体规模大5倍左右。
作为对比,V4 Pro在SWE-bench Pro的得分也就是55.4分,差距相当大。
那国产的AI什么时候能追上Mythos这种级别的AI大模型?Anthropic公司的CEO Dario Amodei日前在美国的一场活动上并表示,开发出与Anthropic在网络安全领域具有同等性能的AI,美国的其他AI企业需要1-3个月,中国企业则需要半年到1年左右时间。
6-12个月的时间比之前V4 Pro落后美国顶级AI大约8个月的说法要更长一些,但考虑到Mythos的强大,这个说法倒也不算黑中国企业AI,甚至相当乐观,Anthropic虽然对中国企业很敌视,但认知也还是清醒的,没有那么无脑黑。
不论是DeepSeek还是Kimi、Qwen、智谱、MiniMax等国内AI公司,对中美之间的差距也是相当清醒的,一方面是算力和资金远不如美国顶尖企业,另一方面是高质量的世界知识数据也落后一些,这些只能靠加大投入、创新算法等来解决,是需要时间的。



