字节发布Seed-OSS-36B开源模型,长上下文架构挑战DeepSeek、通义千问 字节跳动Seed团队近日在Hugging Face推出开源大模型Seed-OSS-36B,该模型具备360亿参数,支持长达512K的上下文处理,在多项基准测试中表现领先,被视为对DeepSeek-V3、阿里通义千问等国内主流开源模型的重要挑战。 从技术架构看,Seed-OSS-36B突出超长上下文支持,适用于代码生成、长文档分析等场景,与DeepSeek采用的MLA架构类似,均致力于高效处理扩展上下文。相比国际模型如Llama 3.1和Mistral,Seed在中文优化和上下文长度上展现差异化竞争力。其优势还包括完全开源、可商用,模型规模在性能与推理成本间取得较好平衡。 路线图方面,字节此举明显加速布局开源生态,通过开放高质量模型吸引开发者,增强技术影响力,并为未来企业级AI解决方案铺路。这也预示着国内大模型竞争正从封闭走向开放,技术路线逐渐向长上下文、多模态等实用方向演进。
“中美差距究竟有多大?”DeepSeek创始人梁文锋再次语出惊人!他说:“我们经
【10评论】【14点赞】