1.5B参数小身材,靠着发散探索+精准优化的SSP训练法,竟在AIME/HMMT数学竞赛中打败671B的DeepSeek。编程测试追平250B模型,后训练成本仅$8000,要比同行省几十倍。 这一波微博AI用实力证明,做顶尖模型不靠堆参数,中小团队也能玩转最前沿。

1.5B参数小身材,靠着发散探索+精准优化的SSP训练法,竟在AIME/HMMT数学竞赛中打败671B的DeepSeek。编程测试追平250B模型,后训练成本仅$8000,要比同行省几十倍。 这一波微博AI用实力证明,做顶尖模型不靠堆参数,中小团队也能玩转最前沿。

作者最新文章
热门分类
汽车TOP
汽车最新文章