AI2发布了Olmo3，一套领先的完全开源大型语言模型（LLM）方案，专为推理

AI2发布了Olmo 3，一套领先的完全开源大型语言模型（LLM）方案，专为推理、对话和工具调用设计。更重要的是，它不仅开放了最终模型权重，还公开了从预训练到后训练的完整训练流程，数据方案和代码，真正实现了训练过程的透明与可定制。Olmo 3家族包括：- Olmo 3-Base（7B、32B参数），具备强大的代码、数学和阅读理解基础能力；- Olmo 3-Instruct（7B），支持多轮对话和工具使用；- Olmo 3-Think（7B、32B），专注于展示推理过程的“思考”模型。核心是32B参数的Olmo 3-Think，定位合理，推理能力大幅领先7B模型，同时仍适合多数用户进行微调和深入研究。训练上，Olmo 3使用了约6万亿标记的Dolma 3预训练数据集和经过强化清洗的后训练数据，特别强调数学、代码和推理能力。其上下文窗口扩展至约65K标记，支持处理完整论文、书籍等长文本。性能表现抢眼：- Olmo 3-Think（32B）是当前最强的完全开源32B推理模型；- Olmo 3-Base领先开源对手Marin、Apertus，并可比肩Qwen 2.5与Gemma 3；- Olmo 3-Instruct（7B）在多项硬核基准上优于Qwen 2.5、Gemma 3和Llama 3.1。配套的Ai2 Playground也升级，新增“思考模式”可实时展示推理过程，“工具调用”支持JSON-schema和Asta平台工具，用户不仅能看模型输出，还能追踪其学习和推理路径，极大提升理解与定制能力。Olmo 3以Apache 2.0协议全面开源，欢迎研究者和开发者深入体验，推动开源AI迈向更高透明度与可控性。正如业内所言，开放训练流程让模型不再是单纯产品，而是协作伙伴，开启后货币经济时代的智能自主计算。✨ Try Olmo 3 in the Ai2 Playground → playground.allenai.org/?utm_source=x&utm_medium=social&utm_campaign=olmo3_launch 💻 Download: huggingface.co/collections/allenai/olmo-3-68e80f043cc0d3c867e7efc6📝 Blog: allenai.org/blog/olmo3?utm_source=x&utm_medium=social&utm_campaign=olmo3_launch📚 Technical report: allenai.org/papers/olmo3?utm_source=x&utm_medium=social&utm_campaign=olmo3_launch真正的开源力量，不只是开放结果，而是开放“如何成就结果”的全貌。未来AI，期待更多这样的透明与共享。

0 阅读：0