1.5B参数小身材,靠着发散探索+精准优化的SSP训练法,竟在AIME/HMMT

阿疯来聊汽车 2025-11-13 22:24:46

1.5B参数小身材,靠着发散探索+精准优化的SSP训练法,竟在AIME/HMMT数学竞赛中打败671B的DeepSeek。编程测试追平250B模型,后训练成本仅$8000,要比同行省几十倍。 这一波微博AI用实力证明,做顶尖模型不靠堆参数,中小团队也能玩转最前沿。

0 阅读:1
阿疯来聊汽车

阿疯来聊汽车

感谢大家的关注