韩媒:中国AI巨头反击,搭载华为芯片的DeepSeek R2即将亮相!

虫虫杂谈 2天前 阅读数 271 #国际

5月4日,韩国媒体《今日财经》发表文章称,中国AI新创公司“DeepSeek”在发布下一代超大型语言模型“R2”之前,受到了全球AI业界的关注。

据了解,DeepSeek R2配备了先进的MoE架构,拥有1.2万亿个参数,文本处理成本比Open AI的GPT-4便宜97.3%。

值得一提的是,该模型完全采用中国自主研发的华为芯片组(昇腾 910B)进行训练,这被解读为减少对美国英伟达GPU依赖、加强中国AI产业独立性的标志性案例。

基于昇腾 910B芯片的集群可以在FP16精度下提供512 PetaFLOPS的计算性能,约为英伟达A100 GPU集群性能的91%。

DeepSeek是一家AI公司,由中国主要科技公司的工程师于2021年共同创立,并于今年1月份发布R1模型,引起了国际关注。

R1在多项基准测试中表现出超越竞争对手的性能,从而使DeepSeek声名鹊起。

R2模型配备了比其前代模型多两倍以上的参数,并包含多模态功能,有望在生成式AI领域展现出超越简单对话语言模型的可扩展性。

虽然DeepSeek R2尚未正式发布,但凭借其性能、成本竞争力以及基于国产芯片组的训练能力,预计将在国际市场上对OpenAI、谷歌的DeepMind等主要AI公司构成威胁。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

虫虫杂谈

虫虫杂谈

创作有趣的文章