• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
答不上来「9.9和9.11谁大」, 周鸿祎解释大模型为什么不识数

答不上来 「9.9 和 9.11 谁大」, 周鸿祎解释大模型为什么不识数

2024 年 7 月 18 日
江苏通报1例霍乱病例

江苏通报 1 例霍乱病例

2025 年 9 月 10 日
供需基本面有一定压力 螺纹钢短期或窄幅调整运行

「抛售美国」 仍在继续!澳大利亚主权财富基金减持美国资产

2025 年 9 月 10 日
9月1日金市早评:现货黄金现上下拉锯 市场继续押注美联储9月降息

A 股成交额连续 20 个交易日超 2 万亿元,关注 A500ETF 易方达 (159361)、沪深 300ETF 易方达 (510310) 等表现

2025 年 9 月 10 日
消费力狂飙的东南亚,正成为商家「出海」的首站

消费力狂飙的东南亚,正成为商家 「出海」 的首站

2025 年 9 月 10 日
债市日报:9月3日

金大福珠宝铂金多少钱一克 (2025 年 09 月 05 日) 参考价格

2025 年 9 月 10 日
【读财报】QDII基金8月表现:平均回报2.84% 摩根基金、华夏基金、嘉实基金产品业绩领跑

【读财报】QDII 基金 8 月表现:平均回报 2.84% 摩根基金、华夏基金、嘉实基金产品业绩领跑

2025 年 9 月 10 日
A股、港股重磅!重要指数即将调整!

14 只科创债 ETF 打响发行 「闪电战」:9 月 12 日集中亮相

2025 年 9 月 10 日
科创板收盘播报:科创50指数跌1.64% 电气设备股表现活跃

告别小妞电影之后,她们真的上桌了

2025 年 9 月 10 日
「万机之母」工业母机ETF(159667)连续3日净流入超1.6亿元,政策助力,工业母机板块利好频传

影响市场重大事件:一天两发射,吉利星座 05 组卫星发射成功后,遥感四十五号卫星发射取得成功;我国 15 项人形机器人国标正在研制

2025 年 9 月 10 日
18K金回收价格多少钱一克(2025年09月01日)

每日投行/机构观点梳理 (2025-09-09)

2025 年 9 月 10 日
苹果秋季发布会新品汇总:史上最薄iPhone Air亮相,全系iPhone迈入高刷时代

苹果秋季发布会新品汇总:史上最薄 iPhone Air 亮相,全系 iPhone 迈入高刷时代

2025 年 9 月 10 日
港股IPO早播报:健康160开始招股 9月17日上市

港股 IPO 早播报:健康 160 开始招股 9 月 17 日上市

2025 年 9 月 10 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 10 日 星期三
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 贵金属

答不上来 「9.9 和 9.11 谁大」, 周鸿祎解释大模型为什么不识数

1 年 之前
在 贵金属
阅读时间: 1 mins read
0 0
A A
答不上来「9.9和9.11谁大」, 周鸿祎解释大模型为什么不识数


【TechWeb】7 月 18 日消息,这两天又一件事吵得沸沸扬扬:包括 ChatGPT 4o、谷歌 Gemini Advanced、Claude 3.5 Sonnet 在内的很多 SOTA 大模型王者在回答 「9.9 和 9.11 谁更大」 的问题时纷纷翻车。这让大家大跌眼镜,人工智能还是人工智障的说法再次卷土重来。

猜您喜欢

黄金9995价格多少钱一克(2025年09月01日)

今天金价多少钱一克 (2025 年 9 月 4 日)

3 天 之前
0
市场高低切凸显轮动特征,科技 + 金融或成本周观察重点

太原周生生今日黄金价格多少钱一克 (2025 年 7 月 25 日)

1 月 之前
0

360 创始人周鸿祎对该热门话题也发表了自己的观点,他认为:「不要低估大模型未来发展的潜力,但是不要高估大模型现在的实力 「,」 不要因为这个事就对大模型表示失望。这恰恰说明了其实大模型跟人的大脑是非常像的,它并不是万能的。」

同时,周鸿祎还解释了大模型为什么不识数、并给出了解决大模型不识数问题的解决方案。

大模型为什么不识数?

周鸿祎认为,大模型现在还是有很多的缺点,不认识 「9.11 和 9.9 谁大」,就是一个典型的例子。

「看了几个大模型输出的答案,差不多都在胡言乱语,为什么呢?」 周鸿祎简单解释了为什么大模型会认为 9.1 比 9.9 大。

他认为:第一个问题:「其实大模型的全称叫大语言模型,它首先解决的是对人类自然语言理解的问题。所以大模型把 9.9 和 9.11 并没有当成一个数字来看,而是把它们分成了两个 token。没有经过专门特别的提示和训练,大模型是不懂阿拉伯数字,也不懂数学,所以大模型是按照一个文字的逻辑来进行对比。所以 9 前面是一样大的,那么 11 比 9 要大,所以就得出来 9.11 比 9.9 要大。」

周鸿祎还举了个例子:这就好比你小时候上私塾只学了四书五经,一点数学算数都没学。那出一个这样的小数题你当然就不会了。

第二个问题就是对提示词的依赖。也就是说你跟人工智能提要求的时候,如果都是聊天机器人的界面,你的说法不一样,那大模型的反应是不一样的。就好像一个问题换了种问法,有时候大模型就很聪明,有时候大模型就很笨。这恰恰说明了通过自然语言跟大模型来交流交互,在有些情况下是一种非常不靠谱的方式。比如也有人说换一种问法大模型就会了,比如说把 9.9 和 9.11 放在前面,再问谁大谁小,而不是先问谁大谁小,然后把 9.11 和 9.9 放在后面。

怎么解决大模型不识数的问题?

「这也恰恰说明了光靠大模型是解决不了企业政府的很多实际的工作和生产上的问题,需要和其他技术相结合 「,周鸿祎认为,其实解决这个问题也很简单,有三种做法。

第一种方法,就是要教会大模型数学,就要把很多数学知识进行专门的训练。就像我们小学上了语文之后,还要学算数一样。有了这样专门的训这样的专业模型,就可以正确的回答这个问题。

第二个解决问题的方法,是像 360AI 搜索一样,就利用搜索和知识推理相结合。


 
 

周鸿祎称,刚才试看了一下 360 大模型的回答,实际上也是不准确的。但是跟 360AI 搜索结合在一起,通过全网搜索类似的答案,再加上大模型的理解,相当于是现找答案,然后现教大模型,那么答案就是对的。这也就是搜索增强或者知识对齐。

第三种方法实际上调用 API。比如说如果大模型能够识别这是一个数学题,但是它不会解。没关系,利用函数调用的方式去调比如说一个数学网站的 API,比如说有很多类似的这种数学网站,可以准确的告诉你 9.9 和 9.11 谁大谁小。

还有一种最简单的做法,为什么大模型现在都要学编程呢?因为编程就好比是大模型给了一个计算器,那你出了一道数学题,虽然我不会回答,但是如果我手上有个计算器,那我就能回答。所以有了大模型会懂得调 pythons 语言,用 pythons 来写一个程序,让 pythons 来比一下 9.11 和 9.9 谁大。当然了,编程的程序结果如果是对的那也会得出正确的答案。

最后,周鸿祎给出了三点总结:

第一,大模型对自然语言的理解是它的基础。很多数学物理化学的这些专业知识他并不了解,这个很正常。大家不要惊讶,要学习这些知识还需要专业的模型训练。

第二,利用搜索可以把人类拥有的解题的经验和知识的推理相结合,实际上是一种可以单独用大模型更有效的一种方法。

第三,大模型作为一个聊天机器人,实际上直接在业务和工作上直接用是不现实的,一定需要给他增加各种能力的补强。比如说它能调用其他的工具,能自己编程序来算。实际上人类也是这样,如果给了人类一个很复杂的一堆数据,让人类凭着自己的头脑去总结数据的规律,人类也往往回答不正确。但是人类如果会编程序,或者手边有一个什么计算软件,那么用这个计算软件和工具就可以帮助人类得到正确的答案。所以大模型也需要外部工具的帮助。

」 所以不要因为这个事儿对大模型表示失望。这恰恰说明了其实大模型跟人的大脑是非常像的,它并不是万能的。人今天之所以能做很多工作,人本身是得到了很多第三方工具的帮助,包括计算机,包括计算器。「周鸿祎强调,」 希望不要因为这个事儿丧失你对人工智能的信心。「
 



相关 文章

江苏通报1例霍乱病例
24 小时

江苏通报 1 例霍乱病例

4 分 之前

财联社 9 月 9 日讯,江苏南通市通州区疾病预防控制中心 9 月 9 日上午通报:9 月 4 日 18 时,南通市第三人民医院报告我区发生一例霍乱确诊病例,为二甲镇新市居人。患者经有效...

供需基本面有一定压力 螺纹钢短期或窄幅调整运行
禾湖观察

「抛售美国」 仍在继续!澳大利亚主权财富基金减持美国资产

13 分 之前

【文章来源:金十数据】AI 播客:换个方式听新闻 下载 mp3 音频由扣子空间生成 澳大利亚规模达 2520 亿澳元 (约合 1660 亿美元) 的主权财富基金——未来基金 (...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

江苏通报1例霍乱病例

江苏通报 1 例霍乱病例

2025 年 9 月 10 日
供需基本面有一定压力 螺纹钢短期或窄幅调整运行

「抛售美国」 仍在继续!澳大利亚主权财富基金减持美国资产

2025 年 9 月 10 日
9月1日金市早评:现货黄金现上下拉锯 市场继续押注美联储9月降息

A 股成交额连续 20 个交易日超 2 万亿元,关注 A500ETF 易方达 (159361)、沪深 300ETF 易方达 (510310) 等表现

2025 年 9 月 10 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录