阿里最新开源的通义千问AI编程大模型Qwen3-Coder,编程能力直接超越了GPT4.1等西方闭源模型,登顶全球开源模型阵营,其模型能力已经可以比肩全球最强的编程模型Claude 4。 阿里巴巴刚刚发布了新一代编程大模型Qwen3—Coder,这个完全开源的模型在技术社区引起了广泛关注,作为首个采用混合专家架构的千问代码模型,它的性能表现让人印象深刻。 最强版本Qwen3—Coder—480B—A35B—Instruct拥有4800亿总参数,但只激活350亿参数,这种设计既保证了强大的能力,又控制了计算成本,模型原生支持256K上下文长度,通过YaRN技术可扩展到1M。 在代码生成能力上,这个模型表现出色,它在SWE—Bench等权威测试中创下了开源模型的新纪录,阿里官方数据显示,在代理式编程、工具调用等任务上,性能已经可以与Claude Sonnet 4相媲美。 实际使用体验确实不错,模型不仅能写代码,还具备强大的Agent能力,能够自主规划任务、调用工具、处理多步骤的复杂编程需求,这种能力在传统编程模型中比较少见。 成本优势也很明显,通过阿里云百炼平台,API调用费用相比国外同类服务有一定优势,对于需要大量使用AI编程工具的团队来说,这能够显著降低成本。 更重要的是完全开源的特性,开发者可以在本地部署使用,不用担心代码泄露的问题。这对金融、医疗等对数据安全要求较高的行业特别重要。 配套工具也比较完善,阿里同时开源了Qwen Code命令行工具,基于Gemini Code进行了优化,此外模型还兼容Claude Code、Cline等主流开发工具。 这个模型的训练很有特色,预训练阶段使用了7.5T数据,其中70%是代码,团队还用Qwen2。5—Coder对低质量数据进行了清洗和重写,提升了整体数据质量。 后训练阶段的策略也值得关注,团队没有专注于竞赛刷分,而是在真实代码任务上进行大规模强化学习,这种做法更贴近实际应用场景,提升了代码执行成功率。 Agent能力是这次的最大亮点,模型能够理解复杂的业务需求,自动调用多种工具,完成从需求分析到代码实现的全流程,在WebArena、BFCL等测试中表现突出。 对中文开发场景的支持也比较到位,模型能够处理微信小程序、支付宝SDK等国内常见的开发需求,理解中文技术文档和API。 目前模型已经在魔搭社区、HuggingFace等平台上线,全球开发者都可以免费下载使用,API服务也通过阿里云百炼提供,支持快速集成。 从GitHub的反馈看开发者对这个模型的评价普遍积极,特别是在复杂项目重构、多语言开发等场景下,效果比较明显。 学习门槛相对较低,官方提供了详细的使用文档和示例代码,即使是新手也能快速上手,社区里已经出现了不少实战教程和应用案例。 安全性方面经过了充分验证,开源的特性让代码完全透明,可以进行安全审计,模型生成的代码也经过了安全检查,避免常见的安全漏洞。 这次发布的时机也很有意思,正好在Meta LlamaCon大会前夕,这展示了中国AI公司在开源策略上的成熟度。 模型还在持续优化中,据了解后续版本将进一步提升性能,并计划接入更多开发工具,阿里内部团队和多家企业已经开始使用。 这个工具能够显著提升编程效率,无论是日常代码编写、bug修复,还是学习新技术,都能提供有效帮助。 你在实际工作中用过哪些AI编程工具?对于这种Agent能力强的编程模型,你觉得最有用的场景是什么?