韩媒：中国AI巨头反击，搭载华为芯片的DeepSeek R2即将亮相！

虫虫杂谈 2天前阅读数 271 #国际

5月4日，韩国媒体《今日财经》发表文章称，中国AI新创公司“DeepSeek”在发布下一代超大型语言模型“R2”之前，受到了全球AI业界的关注。

据了解，DeepSeek R2配备了先进的MoE架构，拥有1.2万亿个参数，文本处理成本比Open AI的GPT-4便宜97.3%。

值得一提的是，该模型完全采用中国自主研发的华为芯片组（昇腾 910B）进行训练，这被解读为减少对美国英伟达GPU依赖、加强中国AI产业独立性的标志性案例。

基于昇腾 910B芯片的集群可以在FP16精度下提供512 PetaFLOPS的计算性能，约为英伟达A100 GPU集群性能的91%。

DeepSeek是一家AI公司，由中国主要科技公司的工程师于2021年共同创立，并于今年1月份发布R1模型，引起了国际关注。

R1在多项基准测试中表现出超越竞争对手的性能，从而使DeepSeek声名鹊起。

R2模型配备了比其前代模型多两倍以上的参数，并包含多模态功能，有望在生成式AI领域展现出超越简单对话语言模型的可扩展性。

虽然DeepSeek R2尚未正式发布，但凭借其性能、成本竞争力以及基于国产芯片组的训练能力，预计将在国际市场上对OpenAI、谷歌的DeepMind等主要AI公司构成威胁。

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。