一位前谷歌DeepMind研究员直言，Gemini3虽然在网页开发上表现不错，

爱生活爱珂珂 2025-11-29 11:56:53

一位前谷歌DeepMind研究员直言，Gemini 3虽然在网页开发上表现不错，但在真正的编码工作中却常显“为测试而优化”，缺乏面对复杂真实项目时的稳定性和适应力。它在演示中光鲜亮丽，却难以胜任“战场”上的各种边缘场景。许多开发者的共鸣在于：真实编码远比基准测试复杂。模糊需求、遗留代码、依赖地狱和异常逻辑才是日常。Gemini 3在这些方面表现不佳，甚至出现误删API、无法处理文档、过度冗长等问题。相较之下，Claude、Opus等模型在实际使用中更靠谱，能更好地完成开发者需求，减少反复调试的负担。这反映出业界普遍的“基准测试与实际应用脱节”问题。模型往往为了在指定任务中拿高分而“走捷径”，缺乏对真实复杂环境的理解和适应能力。真正有价值的AI助手，应能深入代码上下文，理解含糊需求，适应多变场景，甚至能通过持续测试和反馈不断自我进化。总结来看，Gemini 3虽有潜力，但仍需从“演示王”向“实战王”转变。开发者应理性看待各种AI工具，结合自身项目实际反复验证，而非盲目追随营销榜单。未来的AI编程助手，必然是多模型优势互补、不断学习进化的智能协作体，才能真正助力复杂软件开发的突破。原文：x.com/VraserX/status/1994337305151013313

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

科研工作中，整合多领域工具进行复杂分析常常繁琐耗时。Claude Scienti

2

François Chollet指出，当前大规模深度学习模型虽不断扩展能力边界，

3

编程语言各有千秋，适合不同需求和场景：C偏底层，贴近硬件；C++强大但复杂，功能

4

[人人能懂] 从自我审视、大脑协作到效率革命今天我们要探讨一个很有意思的问题：聪

5

一位前谷歌DeepMind研究员直言，Gemini 3虽然在网页开发上表现不错，

6

视频剪辑领域的“Cursor”尚未出现，背后有深刻原因。当前没有类似VS Cod

7

社交媒体上关于AI的讨论常被简化为两种极端：一派怀疑论者认为大语言模型（LLM）

8

AI泡沫真的存在吗？随着OpenAI宣布1.4万亿美元计划、Nvidia市值一度

9

晚安～晚安

10

《What is the future of intelligence? The

热门分类

科技TOP

1

昨天小鹏科技日最出圈的就是机器人全网都在找它是披着皮的真人的证据确实相比今年4月

2

发布会还没有开，价格配置就全曝光了，荣耀手机的保密措施急需改进啊！如果爆料价格

3

为啥股价会跌？没看明白。单从步态讲小鹏机器人是全球走得最好最像人的。我平时研究临

4

科技发展真是越来越离谱啦！近日，浙江温州街头，一个人形机器人稳稳牵着机器狗遛弯，

5

【：最强Mate机皇】华为终端官宣将于11月25日举行华为Mate80系列/M

6

蹲完发布会价格环节直接惊到！标准版5499起，Pro版6999起，ProMax

7

华为Mate80系列发布会大家在看了吗，开局歌声太雅了。全系2.5D玻璃+直角中

8

小鹏机器人“猫步”惊艳全场！网友疑是真人，何小鹏四字回应暗藏玄机昨日，第七届小

9

MagicOS10迎来重大更新，升级至116版本，内容很多，有1.2GB新增

10

麒麟9030ProMax，卓易通单核跑分1131，多核4277由于是虚拟机

科技最新文章

1

华为mate80没有磁吸被吐槽？华为mate80发布后，这些喷子们又开始蠢蠢欲

2

华为Mate80RS对比Mate70RS影像有哪些升级宝子们！这次升级杀疯了！

3

一眼贵！华为Mate80ProMax金色富贵大气，太顶了！

4

用荣耀Magic8拍了两张夜景样张：一张12mm超广角，一张24m

5

刚到手的Mate80ProMAX，只买到极光青配色，金属机身要考虑信号问题，

6

华为Mate80ProMax拆解出的后盖，全金属一体成型，连同镜头Deco的弧

7

简直离谱！到底是谁在买华为Mate80Pro啊？？不开玩笑，刚上线就在抢，

8

刚到手的华为Mate80ProMAX，只买到极光青配色，也挺好看的，这个后盖

9

【华为发布智能憨憨电子宠物：399元，小艺大模型加持】11月25日，在华为全场景

10

其实华为Mate80系最厉害的不是3d人脸，也不是鸿蒙6，更不是9030Pro