快科技3月1日消息,据国外媒体最新报道,DeepSeek计划于下周正式发布全新的多模态大语言模型V4版本。
这款备受期待的新模型将原生支持图片、视频以及文本的生成功能。这也是DeepSeek自今年1月推出R1推理模型以来的首次重大版本迭代,有望进一步填补国内低成本开源模型的需求。
然而,比技术升级更引人注目的是DeepSeek在这一版本测试阶段采取的特殊举措。据知情人士透露,DeepSeek已经向包括华为在内的国内硬件供应商提供了V4模型的测试权限。
令人意外的是,DeepSeek此次打破了行业惯例,并未向英伟达和AMD这两家全球领先的芯片供应商提供预发布版本的访问权限,这一策略在业内引发了广泛讨论。
在人工智能开发领域,开发者通常会与领先的芯片制造商共享模型预发布版,以确保软件能在主流硬件上高效运行。DeepSeek此前也曾与英伟达技术团队保持过紧密合作。
此次DeepSeek选择优先支持国产硬件,却将英伟达和AMD拒之门外,背后的策略考量非常耐人寻味。
通过这种差异化的授权方式,以华为为代表的中国芯片制造商能够获得宝贵的领先时间。他们可以提前数周针对自家处理器进行软件层面的深度优化,从而在模型适配与运行效率上占据先机。


