韩媒:中国AI巨头反击,搭载华为芯片的DeepSeek R2即将亮相!
5月4日,韩国媒体《今日财经》发表文章称,中国AI新创公司“DeepSeek”在发布下一代超大型语言模型“R2”之前,受到了全球AI业界的关注。
据了解,DeepSeek R2配备了先进的MoE架构,拥有1.2万亿个参数,文本处理成本比Open AI的GPT-4便宜97.3%。
值得一提的是,该模型完全采用中国自主研发的华为芯片组(昇腾 910B)进行训练,这被解读为减少对美国英伟达GPU依赖、加强中国AI产业独立性的标志性案例。
基于昇腾 910B芯片的集群可以在FP16精度下提供512 PetaFLOPS的计算性能,约为英伟达A100 GPU集群性能的91%。
DeepSeek是一家AI公司,由中国主要科技公司的工程师于2021年共同创立,并于今年1月份发布R1模型,引起了国际关注。
R1在多项基准测试中表现出超越竞争对手的性能,从而使DeepSeek声名鹊起。
R2模型配备了比其前代模型多两倍以上的参数,并包含多模态功能,有望在生成式AI领域展现出超越简单对话语言模型的可扩展性。
虽然DeepSeek R2尚未正式发布,但凭借其性能、成本竞争力以及基于国产芯片组的训练能力,预计将在国际市场上对OpenAI、谷歌的DeepMind等主要AI公司构成威胁。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。