如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

2025-06-21 10:50:11

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
广告位810*200
相关阅读
男的真的会把所有衣服从上到下都扔洗衣机吗?

男的真的会把所有衣服从上到下都扔洗衣机吗?

不信复合化学洗剂消毒杀菌,不信水流物理冲洗2小时除垢,不信7...

2025-06-28
Mac mini M4,有必要升级24G内存吗?

Mac mini M4,有必要升级24G内存吗?

这么说吧,丐版的m4性能已经几乎打平了m3pro了,m4pr...

2025-06-28
准大学生一个月2500多吗?

准大学生一个月2500多吗?

多啊,2500元一个月太多了!我家七八个读大学的至今为止没有...

2025-06-28
大家如何看待出卖身体的女生?

大家如何看待出卖身体的女生?

做酒店的多少知道一点 出来卖的,女的3个月以上,身体必出问题...

2025-06-28
如何使用  Github Pages 和 Hexo 搭建个人博客?

如何使用 Github Pages 和 Hexo 搭建个人博客?

一步步来,欢迎交流讨论! 初始化Hexo项目npm inst...

2025-06-28