【DeepSeek或彻底改变AI游戏规则!中国大模型“搅动”硅谷】短短一个月

半烟评科技 2025-01-26 11:20:27

【 DeepSeek或彻底改变AI游戏规则 !中国大模型“搅动”硅谷】短短一个月内,中国AI初创公司深度求索(DeepSeek)先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。

  Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。

  此前,Alexander Wang评价说,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”

  此外,中国AI“刷屏”国外各大媒体,它们认为中国大模型的新进展为硅谷敲响了警钟。

  在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入真的是最有效的方法吗?

  1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。

这位Meta员工写道:

  “一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。

  工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。

  管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?

  DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”

  去年12月27日,DeepSeek推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)显示,DeepSeek-V3在所有模型中排名第七,在开源模型排第一。而且,DeepSeek-V3是全球前十中性价比最高的模型。

  不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型,允许所有人在遵循MIT License(注:被广泛使用的一种软件许可条款)的情况下,蒸馏R1训练其他模型。

  1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。

  在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1拔得头筹,位列第一。

  在风格控制方面,DeepSeek-R1与o1并列第一,意味着模型在理解和遵循用户指令,并按照特定风格生成内容方面表现出色。

  在高难度提示词与风格控制结合的测试中,DeepSeek-R1与o1也并列第一,进一步证明了其在复杂任务和精细化控制方面的强大能力。(每日经济新闻)

0 阅读:0
半烟评科技

半烟评科技

感谢大家的关注