林俊旸,生于1993年,阿里Qwen技术负责人,最年轻的P10级技术专家。
杨植麟,生于1993年,月之暗面创始人,公司账上躺着100亿元。
姚顺雨,生于1998年,前OpenAI员工、刚上任腾讯AI首席科学家。
面对他们,刚完成公司上市,今年49岁的智谱创始人唐杰不得不感慨,长江后浪推前浪。在他边上,1953年出生的中国科学院院士张钹笑称,那我被拍了一波又一波。
在一片祥和里,中国的AI界昨天下午迎来了开年以来最强闭门会议。由清华大学基础模型北京市重点实验室发起的“AGI-Next”峰会,几乎聚集了国内这一领域最强的青年代表。从另一个角度来看,除了DeepSeek,三大开源模型的核心人员都在了。
DeepSeek的缺席也情有可原。据Theinformation透露,他们正在憋大招,可能会在春节前后发布V4版本,编程能力将有跨越式的提升。
但这并不妨碍像姚顺雨这样备受期待的天才少年们闪亮登场。

清华大学教授、智谱创始人唐杰:
Chat之战已结束,下一战是“做事”

1.范式转折点已到:随着DeepSeek等大模型的出现,纯聊天(Chat)的竞争已基本结束,下一阶段的竞争核心是“行动”(Action)与“做事情”(Doingthings)。
2.专注代码(Coding)与智能体(Agent):智谱团队经过多次争论后,将主要精力投入在Coding能力上,并认为Agent是未来关键方向之一。
3.Agent成功三要素:真实价值(解决实际问题)、成本可控、执行速度(抢出时间窗口)。
4.智能效率:创新的爆发,往往是因为对某件事投入巨大,效率却不再提升。未来我们应该定义一个衡量收益的新范式:智能效率(IntelligenceEfficiency)。提升智能上限,扩大规模(Scaling)可能是最“笨”的办法,真正的挑战在于:如何用更少的Scaling,获得同样的智能提升。
5.2026年将有新范式突破:随着学术界算力提升、工业界效率瓶颈显现,持续学习(ContinualLearning)、记忆(Memory)、多模态等领域,可能在2026年出现范式变革。
6.中国AI的机会在于环境与坚持:90后、00后更具冒险精神,呼吁为敢冒险的年轻一代提供更好的创新环境,并相信“笨笨的坚持”可能让中国团队最终走在前沿。
阿里千问大模型技术负责人林俊旸:
研究员本身就是产品经理
Agent与具身智能结合会更有意思

1.市场分化逻辑:OpenAI做ToC平台,Anthropic深度服务企业(在与金融领域客户深度交流中发现真实机会),分化是自然发生的,是顺应市场需求后的自然结果;在美国,Coding任务的Token(文本处理的最小单元)消耗量巨大,这一点目前中国市场还没达到同等量级。
2.AGI的服务本质:今天ToB也好,ToC也好,我们都是要解决真实的问题,怎么把人类世界变得更好。
3.强化学习(RL)潜力未充分释放:目前的强化学习范式尚处早期,潜力远未被充分挖掘,全球范围内仍面临基础设施等瓶颈。而下一代范式的核心在于“自主进化”与“主动性”,只是自主进化用什么技术手段、是否需要更新参数,见仁见智。
4.Agent的“模型即产品”思维:研究员本身就是产品经理,需要有产品思维,能端到端地把东西做出来。未来的Agent应该是托管式的,你给它一个模糊通用指令,它能在长周期的执行中自我决策和进化。另外,只有当AI与真实物理世界交互,才是Agent真正能长时间工作的场景。未来3-5年,Agent与具身智能的结合,会更有意思。
5.通用Agent的机会在于长尾:要不要做通用Agent?如果你是“套壳”高手,套得可以比模型公司做得更好,我觉得可以去做。否则可以留给模型公司,因为它们有算力和数据优势。
6.对中国AI发展谨慎乐观:未来3-5年中国公司引领全球的概率有多大,这是一个“危险”的问题,从概率角度谈谈中美差异:中美算力差距1-2个数量级;目前美国将更多算力投入前沿研究,中国更多用于交付;“穷则思变”,软硬件协同可能孕育新机会。再加上中国新一代人的成长和营商环境的改善,有机会但面临的困难非常大。
7.Qwen下一步发展的三个重点:
(1)构建具备视觉输出和推理能力的Omni模型,把能力真正收敛到多模态模型,不仅能接收文本、图像和语音,而且也要具备同时生成这些模态的能力。
(2)从训练模型转向训练Agent,尤其是通过多轮强化学习和环境反馈,实现面向长时任务的推理能力。
(3)把语言模型进一步转化为具备行动能力的(具身智能)Embodied模型。
腾讯“CEO/总裁办公室”首席AI科学家姚顺雨:
ToB与ToC明显分化,自主学习已在发生

1.对市场分化的两大观察:
(1)ToB与ToC的分化:ToC对智能上限要求不高,更像是“搜索引擎加强版”;ToB则呈现“越强越付费”逻辑——企业只愿意为最强的模型支付溢价,所以在ToB市场,强模型和弱模型的分化会越来越明显。
(2)垂直整合与分层模式的分化:ToC产品中,模型与产品是强耦合、紧密迭代的;而ToB场景中,趋势似乎相反:模型层专注于把模型做得越来越强,应用层则想用最好的模型赋能不同的生产力环节。
2.腾讯的双轨策略:ToC:聚焦上下文(Context)和环境信息,通过额外输入提供价值(比如问“今天吃什么”,如果加上“今天很冷”“我在哪个商圈”等信息,又或者直接把相关聊天记录丢给AI,回答的价值会完全不同);ToB:作为一家万人规模的大公司,思考的是如何先“服务好自己”,充分利用内部场景沉淀真实数据。
3.自主学习(Self-learning)的现在时:自主学习已成为非常热门的词汇,它并非单一方法论,而是高度依赖于具体的“数据与任务”的场景化实践。聊天变得个性化、像博士一样探索新科学,这些都是不同维度的自主学习。因此,自主学习这件事“已经在发生了”,但目前受限于场景和效率,是“渐变而非突变”。
4.想象力的问题:要实现真正的自主学习,现在最大的问题是想象力。我们还没定义好验证它的“任务”,是一个能赚钱的交易系统,还是解决人类未解的科学难题?我们需要先想象出它的样子。
5.2026年Agent展望:ToBAgent进入上升通道,不依赖花哨创新,靠扎实的预训练和后训练;即使模型停止进化,仅靠更好地部署现有模型到真实场景,也能带来10-100倍效率提升,对GDP产生5%-10%的影响,现在还远没到1%。
6.中国AI的优势与瓶颈:优势在于工程能力、产业化效率、人才密度;瓶颈在于算力(光刻机、软件生态)、ToB市场成熟度、国际商业环境;核心挑战,不断涌现的人才能否引领新范式,需要更多冒险精神和长期探索文化。
7.回国的感觉还是挺好的,吃得好很多。
月之暗面创始人杨植麟:
做模型本质上是在创造一种世界观

1.Kimi的技术重点:过去的2025年,月之暗面的两个技术进化主线是:提升Token效率,以在有限的数据下冲击更高的智能上限;扩展长上下文能力,以满足智能体化时代越来越长程的任务对模型的记忆能力需求。
2.智能的独特性:智能和电力不一样,它不是等价交换品。你在深圳用的1度电,和在北京用的1度电,完全一样,但一个CEO产生的智能,和一个设计师、一个音乐家产生的智能,截然不同。
3.模型竞争的核心:未来的模型竞争,比的就是谁更有Taste,谁更有品味。做模型本质上是在创造一种世界观,即你觉得什么样的东西是好的,一个好的AI应该有什么样的表现,应该追求什么样的价值观。所以,你在这个模型里注入了什么,它就会涌现出什么样的智能。
4.生态多样性:不用担心未来会有单一的模型一统世界,因为智能Taste的差异是巨大的。
5.AI的安全问题:AI可能是人类探索未知的钥匙,能帮我们攻克癌症、解决能源危机、探索宇宙。虽然有风险,但放弃发展就等于放弃人类文明的上限(最后一句援引自他和Kimi的聊天记录)。