• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
高考题,AI大模型不能解,也不敢解

高考题,AI 大模型不能解,也不敢解

2025 年 6 月 9 日
上午报名下午进厂,「果链」满产忙招工

首富不好当,现在也要靠 「老铁 666 了」

2025 年 9 月 11 日
18K金回收价格多少钱一克(2025年09月01日)

9 月 10 日螺纹钢期货仓单较上日增持 8223 吨

2025 年 9 月 11 日
14K金价格多少钱一克(2025年09月01日)

水贝黄金价格今天多少一克 (2025 年 09 月 05 日)

2025 年 9 月 11 日
特斯拉Optimus V3量产渐近 灵巧手或迎重大升级 马斯克:正在敲定设计

特斯拉 Optimus V3 量产渐近 灵巧手或迎重大升级 马斯克:正在敲定设计

2025 年 9 月 11 日
企业级AI管理平台:知识利用率提升60%,开发周期压缩50% | 创新场景

全球国际旅游客流量上半年稳步增长

2025 年 9 月 11 日
白糖:原糖价格震荡磨底 国内价格维持宽幅震荡

算力硬件板块重拾涨势,近 20 只基金单日涨超 5%

2025 年 9 月 11 日
今日黄金首饰价格多少钱一克(2025年9月4日)

50 基点超级降息要来了?美国就业数据爆雷下修,美联储恐祭出三大连环砍息

2025 年 9 月 11 日
普京:俄将对等实施对华免签政策

果链企业增资医药自动化企业;十连板牛股紧急披露:收购资金尚未到位;【并购一线】

2025 年 9 月 11 日
影响市场重大事件:创业板市值亚军易主!中际旭创首次超越东方财富;中国-上海合作组织数字经济合作先行区落地天津滨海新区

债市日报:9 月 10 日

2025 年 9 月 11 日
分红潮「逆行者」郑州银行:距离监管红线只差0.1%

甲骨文称已签约但尚未实现的合同收入 4550 亿美元,同比增 3.5 倍,股价涨 3 成,创始人成新首富|精华研报

2025 年 9 月 11 日
中际旭创市值首超东方财富,「光」含量超50% 的创业板人工智能ETF华夏(159381)涨超3%

大电池救得了增程车吗?

2025 年 9 月 11 日
收评:创业板指涨近1% 两市成交额缩量逾5000亿元

运行平稳 产业企业积极参与

2025 年 9 月 11 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 11 日 星期四
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 期货市场

高考题,AI 大模型不能解,也不敢解

3 月 之前
在 期货市场
阅读时间: 1 mins read
0 0
A A
高考题,AI大模型不能解,也不敢解


图片由AI生成

猜您喜欢

供需结构偏弱 甲醇短期或维持震荡偏弱走势

供需结构偏弱 甲醇短期或维持震荡偏弱走势

3 周 之前
0
对话量旋科技项金根:黄仁勋预测太保守,10年后将实现百万物理比特的容错量子计算机

对话量旋科技项金根:黄仁勋预测太保守,10 年后将实现百万物理比特的容错量子计算机

2 月 之前
0

图片由 AI 生成

高考,中文世界权威度和认可度最高的标准化考试,世界上最公平的大型选拔考试之一,还在如期进行中。

这项考试制度成熟、人数众多、标准统一,各科命题经过多轮审定,阅卷过程统一标准、分数精确。考试考取的分数背后,看似是对知识点和做题能力的展示,实则揭示的是其抽象逻辑、信息整合、快速运算和写作表达等能力。

尤其是逻辑思考和推理能力,是学生时期被重点训练的素养,是绩优生引以为傲的资本,进入社会用来吃饭的看家本事,而当今年大模型深度思考能力全面开花之际,想必大多数学霸会产生一种别样的复杂的心情。

当然了,高考的特殊性,使其成为了大模型能力的天然试金石。高考期间,哪家大模型解题能力强,综合评分到底可以上几本学校,成为很多人津津乐道的话题,今年类似相关的测评文章也零星出现了。

而当随机测试了下市面上主流通用大模型解答高考题时,结果却出人意料—— 这些大模型压根没有想要参加高考。

上传了高考全国卷 I 数学试题后,有的大模型显示无法上传,有的则表示无法识别。而一同被“ 禁言” 的解读的,还有往年的高考数学题。
各大主流国产模型厂商对今年高考数学题的回应

高考期间 (6 月 7 日-10 日),主流国产模型厂商对今年高考数学题的回应

事实上,不只是数学难题,国产大模型已经屏蔽掉了 K12 阶段学科 (语文、数学、英语、物理、化学、生物、历史、地理、政治) 内容的部分推理与解析能力。具体而言是,图片识题 (拍题) 功能禁用,高考真题关键词屏蔽,甚至禁止回答具体某年高考题目。
DeepSeek对高考以及高考题相关的话题限制非常严格,而给出略显详细的提示词后,会给出丰富的答案。

高考期间 (6 月 7 日-10 日),相比其他大模型应用,DeepSeek 对高考以及高考题相关的话题限制更为严格,而给出略显详细的提示词后,也会给出丰富的答案。

也就是说,在今年高考期间,主流的国产模型厂商,都主动或被动对高考采取了限制措施,这在国产大模型发展进程里还是头一回。

实际上,ChatGPT、Claude 等国外的大模型可以解答今年高考相关题目,并且以高水平完成推理过程。而大多数国产通用大模型,已经在多项技术指标上持续逼近全球顶级水平,甚至在某些垂直细分场景呈现领先的趋势,也意味着它们是具备足够的能力来解答这些题目的。

很显然,这一次功能“ 降级”,本质上是一次策略性的行为,也是平台技术治理与内容安全机制的体现。

当前,多数模型处理高考题的模式是,当识别到题干结构类似高考题 (选择题、大题、简答题),会直接返回“ 不支持” 或“ 无法识别”。而图片上传识别时,系统会直接禁掉 OCR 模块或限制调用次数。与此同时,也对“ 高考”,“ 高考真题” 等关键词自动限流。这是大模型的内容风险识别系统在发挥作用。

这一场高考期间“ 特别监管”,目前各大厂商未主动发布官方声明。而最直接的原因,恐怕是为了防止高考考试作弊。因为多数模型厂商直接在页面给出文字提示,无法支持相关功能,是“ 为了保证高考公平公正”,“ 为了确保高考的公平性”,“ 重要考试期间,换个话题试试” 等。

但事实上,目前没有公开报道显示,国内已经有利用 AI 大模型在考场作弊的案例 (国外大学已有识别学生利用 ChatGPT 作弊而被开除的案例),但确实已经存在一些大模型相关的考试虚假信息和诈骗行为,并且已经被监管部门重点关注。

这里涉及的是,今年高考前,教育部、中央网信办、公安部查处了部分商家。这些商家利用一些考生、家长的投机心理,将押题当成牟利工具,通过宣称“ 神预测”“ 精准押题”、炒作“ 名师押题”“AI 押题” 等虚假宣传手段,诱导考生、家长购买所谓的“ 高考押题卷”“ 高考猜题库”“ 备考攻略” 等。

与此同时,当 AI 大模型进入更多硬件设备而非只是手机时,与考试有关的新问题也随之浮现。今年 4 月,《央视新闻》 发出了一个疑问,“AI 眼镜成考试作弊‘ 神器’ 怎么防?” 而 Rokid 创始人、CEO 祝铭明就这一问题答复是,“ 可能最简单的方法就是屏蔽信号或者把功能关掉”。

回到高考本身,这是我国最重要的考试之一,已经纳入国家治理的重要领域,现代教育测试学的标准性和普适性,使得高考一直被看作是教育公平与社会稳定的制度性支柱。高考题目及其解析涉及国家教育考试制度,具有高度敏感性和保密等级,任何失误或越界可能被定性为破坏考试秩序。

而一旦出现泄题或作弊的情况,都会被视为国家级事件。大模型有可能被考生用于作弊,而错误解答了真实或类似的高考试题,会持续引发公众的质疑。

事实上,监管层在今年已经明令禁止 AI 技术干扰正常的高考秩序。5 月 30 日,教育部会同中央网信办、公安部发布了消息联合查处涉高考违法有害信息,重点整治的是,炒作夸大涉考不实信息,借 AI 技术生成发布涉考虚假信息,以及,干扰舆论和误导公众等行为。

在考试期间,涉及高考试题相关行为,可能被认定为是协助作弊,或者扰乱考试秩序,平台将面临监管和法律风险。主流国产大模型目前仍在“ 合规优先” 的阶段,在监管本就密集的 K12 教育领域,冒险展示技术能力,将面临政策、伦理和市场风险多重压力。

而其实,如果从技术侧考虑,模型厂商限制相关功能,也未必是全然是“ 被迫” 的行为。因为 AI 大模型的幻觉问题始终难解,同一个提问和提示词情况下,多次生成的内容也不全然一致,尤其是数理等更标准化的科目,纯属将模型能力的弱项暴露给公众。

尽管有些模型厂商已经以“ 解答高考题的准确率” 为卖点宣传自身,但是,更多厂商为避免出现“AI 答案” 和“ 官方答案” 不一致的尴尬,全部禁止作答高考题,不失为一种较为理性的决策。

不过,大模型的平台自律与避险机制,在高考结束后,就会陆续恢复对 K12 内容的部分支持,因为市场需求永远都在那里。

一个有意思的现象是,今年高考期间,“ 高考期间能用的 AI” 在社交平台上引起了小范围的讨论,而关注这一话题的,却是大学生群体。“ 正在复习的大学生天塌了”,“ 救救大学生吧”,“ 高考最大的受害者出现”,因为当前也正值大学期末考试季。

这些在社交媒体上小范围的“ 怨声载道”,段子式的调侃,说明的是,大模型已经深深地介入了大学生的学习、成长的主线任务。

不同于 K12 的解题答疑,大模型在高等教育中使用场景更为丰富,但也面临着最为激烈的争议。一些学校明令禁止使用,但随着大模型的发展,有的学校和教师也鼓励学生,以负责任的方式用 AI 辅助学习与研究,并允许在明确声明的前提下适度使用 AI。

即便如此,考试场景也是被各方排除在外的一个共识场景。

如何划定学生使用 AI 的边界,使用场景自然是核心要义。大模型可成为启发式学习伙伴,尤其是深度思考普及之后。而在考试场景中,尤其是 K12 阶段,大模型一旦越界,必然会对公平性构成实质破坏。

可以预期的是,未来一段时间,高考期间,国产大模型厂商相关功能依旧会“ 策略性限制”。但从长远来看,“AI+教育” 的变革不会停止。AI 教师已经是各大主流教育科技公司正在探索的方向之一。

教育大模型或者通用大模型的教育相关应用,正确的方向是,以启发式学习的方式,构建知识图谱导航,成为教师教学和学生学习的辅助工具,而非一次次简单答案投喂,成为考试题目的解答机器。(本文首发于钛媒体 APP,作者|李程程)

更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App

相关 文章

上午报名下午进厂,「果链」满产忙招工
行业新闻

首富不好当,现在也要靠 「老铁 666 了」

3 分 之前

首富不好当,现在也要靠 「老铁 666 了」 近日,60 岁的美特斯邦威创始人周成建一改昔日浙江首富的形象,头戴墨镜、脚踩运动鞋,在 「裁缝周成建」 抖音直播间跳起团舞,吸引...

18K金回收价格多少钱一克(2025年09月01日)
期货市场

9 月 10 日螺纹钢期货仓单较上日增持 8223 吨

22 分 之前

9 月 10 日收盘,螺纹钢期货主力合约报 3109.00 元,较前一交易日结算价下跌-23.00 元,跌幅-0.73%,持仓量录得 1867674 手,环比上一交易日增持 88...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

上午报名下午进厂,「果链」满产忙招工

首富不好当,现在也要靠 「老铁 666 了」

2025 年 9 月 11 日
18K金回收价格多少钱一克(2025年09月01日)

9 月 10 日螺纹钢期货仓单较上日增持 8223 吨

2025 年 9 月 11 日
14K金价格多少钱一克(2025年09月01日)

水贝黄金价格今天多少一克 (2025 年 09 月 05 日)

2025 年 9 月 11 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录