一觉醒来, 中国和全世界都沉默了, 万万没想到,梁文锋又一次刷新了世界记录。 他担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际顶级学术期刊Nature封面了! 这是全球首个获同行评审的大模型!也是全球首个“同行评审”主流大模型! 这消息一传开,整个AI圈都炸了。以往,大模型研究虽热闹,但大多是企业自己吆喝,没有经过权威学术认证。DeepSeek-R1这次登上Nature封面,就像给大模型研究领域立了个标杆,让大家看到了严谨科研的力量。 先说说这模型的厉害之处。传统大模型训练,依赖人工标注数据来引导推理,成本高还效率低。DeepSeek-R1却另辟蹊径,用强化学习让模型自己摸索推理策略。就像教孩子做题,以前是大人一步步教,现在是让孩子自己尝试,找到解题思路,效果还出奇地好。在数学竞赛、编程测试里,DeepSeek-R1的表现远超同类模型,解题准确率飙升。 再看成本,DeepSeek-R1的训练费用低得惊人。据公开资料,整个训练成本加起来也就几百万美元,和OpenAI、谷歌那些动辄数千万美元的投入相比,简直是“白菜价”。花小钱办大事,这性价比,谁看了不眼红? 当然,质疑声也有。一开始,有人怀疑DeepSeek-R1用了OpenAI模型蒸馏,这就好比抄袭别人作业。好在团队正面回应,数据来源都是互联网,虽可能有GPT-4生成的内容,但绝非有意,更没专门蒸馏。还详细说明了训练流程,打消大家的疑虑。 这次论文登上Nature封面,对中国AI发展意义重大。过去,在国际AI舞台上,中国团队大多是追赶者。如今,DeepSeek-R1让世界看到中国AI的创新实力。这不仅是梁文锋和团队的荣誉,更是中国AI科研水平的一次高光时刻。 而且,论文经过8位外部专家严格评审,上百条意见逐一回应,过程公开透明。这给AI研究做了示范,让大家明白,好的科研成果不怕 scrutiny (审查),越严格的检验,越能证明价值。 各位读者你们怎么看?欢迎在评论区讨论。
刚刚, DeepSeek-R1论文登上Nature封面, 通讯作者梁文锋
【2评论】【12点赞】
风中阿灿
这就是阳谋
天涯故人
美西白皮对我们会面打压封禁,有好的方法,为什么要在世界公开?
JYYX 回复 09-18 20:50
DeepSeek是开源的,之前有人怀疑这套方法不一定那么有效(怀疑开了外挂,用蒸馏法)。现在这样可以加强信心。 开源的商业模式就是要别人来用来跟风来一起升级,原创人掌握最终版本发布权就成。最理想情况是这套东西大流行,并打造一套生态系统。
用户64xxx80
看看有多少人用再说吧。就说效果,真不好用。学术上也仅仅用了现有的方法,做了些微创新。不同的是开源了模型和推理代码,训练部分一概没有。具体以哪个模型生成的结果作为训练集,用哪些数据补充,以哪个模型做蒸馏,一概不知。个人觉得纯属炒作。有时候还拒绝生成诸如心得体会的一类东西。我不知道用什么形容,这么难用,这么没创新,难道所有人都要崇拜吗?
用户91xxx23 回复 09-19 02:21
你还是不懂用吧,真的不行也不可能引发如此轰动吧
真理就在导弹射程之内
[赞]