一位前谷歌DeepMind研究员直言,Gemini3虽然在网页开发上表现不错,

爱生活爱珂珂 2025-11-29 11:56:53

一位前谷歌DeepMind研究员直言,Gemini 3虽然在网页开发上表现不错,但在真正的编码工作中却常显“为测试而优化”,缺乏面对复杂真实项目时的稳定性和适应力。它在演示中光鲜亮丽,却难以胜任“战场”上的各种边缘场景。许多开发者的共鸣在于:真实编码远比基准测试复杂。模糊需求、遗留代码、依赖地狱和异常逻辑才是日常。Gemini 3在这些方面表现不佳,甚至出现误删API、无法处理文档、过度冗长等问题。相较之下,Claude、Opus等模型在实际使用中更靠谱,能更好地完成开发者需求,减少反复调试的负担。这反映出业界普遍的“基准测试与实际应用脱节”问题。模型往往为了在指定任务中拿高分而“走捷径”,缺乏对真实复杂环境的理解和适应能力。真正有价值的AI助手,应能深入代码上下文,理解含糊需求,适应多变场景,甚至能通过持续测试和反馈不断自我进化。总结来看,Gemini 3虽有潜力,但仍需从“演示王”向“实战王”转变。开发者应理性看待各种AI工具,结合自身项目实际反复验证,而非盲目追随营销榜单。未来的AI编程助手,必然是多模型优势互补、不断学习进化的智能协作体,才能真正助力复杂软件开发的突破。原文:x.com/VraserX/status/1994337305151013313

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注