性能比肩 Gemini-2.5 pro、o4-mini：阿里 Qwen 3 推理模型进化

自千问3旗舰模型发布后，阿里通义千问团队一直在努力拓展大模型的推理性能，全新开源的Qwen3-235B-A22B-Thinking-2507，在推理性能和通用能力上均实现巨大飞跃，号称可比肩Gemini-2.5pro、O4-mini等顶尖闭源模型，并创下全球开源模型SOTA最佳性能表现：

在编程（LiveCodeBench）、数学（AIME25）等核心能力上，Qwen3推理模型实现了推理性能的再突破；

在知识（SuperGPQA）、创意写作能力（WritingBench）、人类偏好对齐（Arena-Hardv2）、多语言能力（MultilF）等通用能力上，Qwen3推理模型也取得了显著进步；

新模型支持256K长文本理解，处理超长上下文不费力。

Qwen3-235B-A22B-Thinking-2507目前已在魔搭社区、HuggingFace开源，采用宽松的Apache2.0开源协议，人人均可免费下载商用。

云霞育儿网