云霞育儿网

性能比肩 Gemini-2.5 pro、o4-mini:阿里 Qwen 3 推理模型进化

自千问3旗舰模型发布后,阿里通义千问团队一直在努力拓展大模型的推理性能,全新开源的Qwen3-235B-A22B-Thinking-2507,在推理性能和通用能力上均实现巨大飞跃,号称可比肩Gemini-2.5pro、O4-mini等顶尖闭源模型,并创下全球开源模型SOTA最佳性能表现:

在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3推理模型实现了推理性能的再突破;

在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hardv2)、多语言能力(MultilF)等通用能力上,Qwen3推理模型也取得了显著进步;

新模型支持256K长文本理解,处理超长上下文不费力。

Qwen3-235B-A22B-Thinking-2507目前已在魔搭社区、HuggingFace开源,采用宽松的Apache2.0开源协议,人人均可免费下载商用。