AI2发布了Olmo 3,一套领先的完全开源大型语言模型(LLM)方案,专为推理、对话和工具调用设计。更重要的是,它不仅开放了最终模型权重,还公开了从预训练到后训练的完整训练流程,数据方案和代码,真正实现了训练过程的透明与可定制。Olmo 3家族包括:- Olmo 3-Base(7B、32B参数),具备强大的代码、数学和阅读理解基础能力;- Olmo 3-Instruct(7B),支持多轮对话和工具使用;- Olmo 3-Think(7B、32B),专注于展示推理过程的“思考”模型。核心是32B参数的Olmo 3-Think,定位合理,推理能力大幅领先7B模型,同时仍适合多数用户进行微调和深入研究。训练上,Olmo 3使用了约6万亿标记的Dolma 3预训练数据集和经过强化清洗的后训练数据,特别强调数学、代码和推理能力。其上下文窗口扩展至约65K标记,支持处理完整论文、书籍等长文本。性能表现抢眼:- Olmo 3-Think(32B)是当前最强的完全开源32B推理模型;- Olmo 3-Base领先开源对手Marin、Apertus,并可比肩Qwen 2.5与Gemma 3;- Olmo 3-Instruct(7B)在多项硬核基准上优于Qwen 2.5、Gemma 3和Llama 3.1。配套的Ai2 Playground也升级,新增“思考模式”可实时展示推理过程,“工具调用”支持JSON-schema和Asta平台工具,用户不仅能看模型输出,还能追踪其学习和推理路径,极大提升理解与定制能力。Olmo 3以Apache 2.0协议全面开源,欢迎研究者和开发者深入体验,推动开源AI迈向更高透明度与可控性。正如业内所言,开放训练流程让模型不再是单纯产品,而是协作伙伴,开启后货币经济时代的智能自主计算。✨ Try Olmo 3 in the Ai2 Playground → playground.allenai.org/?utm_source=x&utm_medium=social&utm_campaign=olmo3_launch 💻 Download: huggingface.co/collections/allenai/olmo-3-68e80f043cc0d3c867e7efc6📝 Blog: allenai.org/blog/olmo3?utm_source=x&utm_medium=social&utm_campaign=olmo3_launch📚 Technical report: allenai.org/papers/olmo3?utm_source=x&utm_medium=social&utm_campaign=olmo3_launch真正的开源力量,不只是开放结果,而是开放“如何成就结果”的全貌。未来AI,期待更多这样的透明与共享。


