云霞育儿网

万万没想到! 人工智能豆包做2025全国一卷, 竟然不是满分 理科考了648分,

万万没想到! 人工智能豆包做2025全国一卷, 竟然不是满分 理科考了648分,文科是683分, 一同考试的还有deepseek、国外的克劳德、openAl等,一个比一个分低。

这次豆包模型参加的考试,用的是全国新一卷和山东省自主命题卷。参赛选手包括谷歌的Gemini 2.5 Pro、OpenAI的o3、DeepSeek R1,还有Claude 4。

在五个顶级AI模型里,豆包文科排第一,理科排第二,仅次于谷歌Gemini 2.5 Pro(655分)。

看排名豆包考得确实好,但仔细看单科成绩,就能发现AI也不是全能的。

语文、英语、物理、历史、地理、政治,豆包都拿了最高分。 尤其是文科综合,它考了270分

数学超过140分,但不是最高分。数学冠军是DeepSeek R1,145分,豆包141分,排第二。

化学最高分是Gemini82分,生物是Gemini和OpenAI o3并列第一77分。豆包这两门考得一般,拖了理科总分的后腿。

其实我好奇的是,AI不是应该全对吗?怎么连化学、生物都考不好?

网上有人说是因为考试用的是网络版试卷,图片模糊,化学和生物卷子里图表多,AI“看不清图”,然后没得满分。

不过单单看成绩,这几个AI上985都没啥问题,但要是想去清华北大,就有点悬,擦边。

不过相比去年AI成绩只能上二本,今年这成绩好多了。

大家看这个分数,这回知道用哪个AI了吧,纯文字类的就用豆包 dk,理科相关的就用谷歌之类的,用对AI,解放咱们得双手!