DeepSeek将发布V4多模态模型挑战美国AI巨头

DeepSeek将发布V4多模态模型挑战美国AI巨头

2月28日,据金融时报报道,DeepSeek将于下周发布其最新的大型语言模型V4,这是一款具备图片、视频和文本生成功能的多模态模型。距离其上次重大版本发布已超过一年,此次发布再次考验了中国在人工智能领域挑战美国竞争对手的雄心。

原生支持多模态功能

据两位知情人士透露,位于杭州的DeepSeek实验室计划发布V4模型,这是一款具备图片、视频和文本生成功能的多模态模型。DeepSeek已与中国人工智能芯片制造商华为和寒武纪合作,针对这两家公司的最新产品对V4模型进行优化。

这将是DeepSeek自2025年1月发布R1推理模型以来推出的首个重要模型。该公司声称,其构建的系统仅需极少的计算能力,即可媲美硅谷领先的人工智能模型。

DeepSeek将发布V4多模态模型挑战美国AI巨头 新闻

震动美国科技界

DeepSeek的这一举动震动了美国科技股,一些专家将其描述为人造卫星时刻,标志着中国作为人工智能强国的迅速崛起。

此后,DeepSeek发布的都是渐进式更新,而不是全新的模型,这使得阿里巴巴和Moonshot等国内竞争对手能够抢占市场对低成本开源中国模型的需求。

未与英伟达合作

据另一位知情人士透露,DeepSeek并未与英伟达合作,为其产品优化模型。英伟达继续主导着训练芯片市场,尤其是在计算密集型的预训练阶段,模型需要在此阶段吸收海量数据。

去年发布的R1版本附带了一份详细的技术报告,阐述了DeepSeek如何更高效地利用Nvidia芯片来训练和运行其模型。DeepSeek因分享其开发推理模型的训练方法而备受赞誉,这使得其他实验室能够研究并应用他们的发现。