主流大模型再战高考作文：「幻觉」问题戏剧性拉满！百度、腾讯考生竟是一家人？

猜您喜欢

Apple Grapples With AI Talent Exodus as Tech Giants Compete for Top Researchers

黑胶唱片卷土重来

11 小时之前

DS 爆火 100 天，创业者想拜拜梁文锋

4 月之前

文 | 大模型之家

北京时间 6 月 7 日，决定莘莘学子一生命运的高考又一次开考。而作为一年一度的「保留节目」，大模型会战高考作文题也成了检验这一年来，大模型进步情况的一次「考试」。

值得注意的是，本次高考作文题目并没有以「人工智能」相关的考题，因此大模型之家随机抽选了北京卷的考题之一，对大模型的「写作能力」进行考察。

根据下面题目完成作文，按要求作答。不少于 700 字。不透露所在区、学校及个人信息。

生活中，到处都有数字在闪耀，如比赛记分牌、新年倒计时、车站电子时刻表、智能家电显示屏等。数字闪耀之时，可能是激动的时刻，可能是收获的见证，也可能是幸福的日常……

请以「当数字闪耀时」为题，写一篇记叙文。

要求：思想健康；内容充实、合理，有细节描写；语言流畅，书写清晰。

作为一年一度的「整活」环节，大模型之家这次不仅用上了「判卷智能体」，还在今年的挑战项目里增加了大模型「检索能力」与「幻觉测试」的小问题，更加细化了大模型们「考试」的内容。

这意味着不仅要根据北京卷的考题内容作答，考验了大模型本身的创作能力，还要考验大模型是否是「一本正经地胡说八道」。

为了增加一些「挑战性」，大模型之家选择北京时间的6月7日12:30分进行提问（此时距2025年高考语文科目考试结束仅一个小时），考验的就是大模型背后的联网搜索功能，能否及时获取到关键信息，如果没能获得信息的时候，大模型的回答会不会产生幻觉。

最终评分，我们还是通过大模型之家特制的「批改高考作文智能体 Plus」进行阅卷，得出一个分数。同时根据大模型对于高考作文题的判断正确给予分数补正：

正确回答出作文题的年份和地区：+5 分
表示自己不知道（诚实奖）：+2 分
没有回答：0 分
大模型给出错误回答：-5 分（幻觉惩罚）

PROMPT：

请回答下面的作文题目是哪一年哪个地方的高考作文题？并根据下面的题目要求，完成一篇作文。

根据下面题目完成作文，按要求作答。不少于 700 字。不透露所在区、学校及个人信息。

生活中，到处都有数字在闪耀，如比赛记分牌、新年倒计时、车站电子时刻表、智能家电显示屏等。数字闪耀之时，可能是激动的时刻，可能是收获的见证，也可能是幸福的日常……

请以「当数字闪耀时」为题，写一篇记叙文。

要求：思想健康；内容充实、合理，有细节描写；语言流畅，书写清晰。

本届比赛，大模型之家选取了来自国内外 7 家主流的大模型产品，分别是：