云霞育儿网

开源Qwen一周连刷三冠实测Qwen最强推理模型卷疯了,通义千问真的卷疯了。Qw

开源Qwen一周连刷三冠实测Qwen最强推理模型

卷疯了,通义千问真的卷疯了。

Qwen3-Coder刚炸完场,就隔了一天,马上全新开源Qwen3系列最强推理模型——Qwen3-235B-A22B-Thinking-2507。

关键是,就在这短短一周里,算上前两天开源的新基础模型Qwen3-235B-A22B-Instruct-2507(非思考版),和Qwen3-Coder,通义千问是完成了一波开源三连。

官方表示,新推理模型主要提升了3方面的核心能力:

- 逻辑推理、数学、科学和编码等任务上性能显著提升;

- 能更好地遵循指令、使用工具、生成文本;

- 支持256K原生上下文,适用于高度复杂的推理任务。

开源还不算,各个出手即SOTA:接连斩获基础模型、编程模型、推理模型三项全球开源最强。

我们也简单测试了一下Qwen3-235B-A22B-Thinking-2507。

还是那道经典题:7米长的甘蔗如何通过2米高1米宽的门?

Qwen3-235B-A22B-Thinking-2507思考了43秒,最后给出的答案是:【图3】

思考过程如下:【图4】

相较之下,o4-mini的答案就简单粗暴了些。【图5】 ​​​

看来这个模型更新强度和效能提升,妥妥地引领全球了。

就问小扎慌不慌(doge)