• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
在9.11和9.8谁更大上 OpenAI最新的大模型OpenAI o1也翻车了

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

2024 年 9 月 13 日
收评:创业板指涨近1% 两市成交额缩量逾5000亿元

摩根大通 CEO:「特朗普冲击」 仍未完全显现,美联储降息作用不大!

2025 年 9 月 11 日
六个月建仓期接近尾声,徐彦新基仍没动静,投资者:我在这基金里躲牛市

六个月建仓期接近尾声,徐彦新基仍没动静,投资者:我在这基金里躲牛市

2025 年 9 月 11 日
从市值60亿到不足1亿:车车科技遭遇现实困境与规模增长挑战

报告显示我国能源和产业转型成效显著

2025 年 9 月 11 日
新华财经晚报:8月全国乘用车新能源市场零售107.9万辆

新华财经晚报:针对汽车行业网络乱象,六部门联合开展专项整治行动

2025 年 9 月 11 日
电动自行车新规喜忧参半

水贝金条价格今天多少一克 (2025 年 09 月 05 日)

2025 年 9 月 11 日
大股东所持29% 股权流拍 二股东宣布减持 *ST万方二拍压力与退市风险叠加

年内股价涨超 30%,A 股公司宣布:减持回购股份,负债率超 85%,连续多年亏损总和已超募资额

2025 年 9 月 11 日
债市日报:9月3日

iPhone Air 有新意没爆点?华尔街的真实反应远比发布会冷静

2025 年 9 月 11 日
尿素基本面支撑偏弱 玻璃盘面延续阶段性底部盘整趋势

20cm 速递|20cm 高弹性+0.2% 低费率,创业板新能源 ETF(159368) 乘固态电池政策东风迎布局窗口

2025 年 9 月 10 日
https://www.huxiu.com/article/4762285.html

公募名将卸任潮继续,刘格菘卸任已管近 7 年产品,周智硕独管

2025 年 9 月 10 日
第19届杭州亚运会纪念币金银套多少钱(2025年9月4日)

水贝足银多少钱一克 (2025 年 09 月 05 日) 参考价格

2025 年 9 月 10 日
商品日报(9月10日):碳酸锂重挫近5% 工业硅涨超2%

商品日报 (9 月 10 日):碳酸锂重挫近 5% 工业硅涨超 2%

2025 年 9 月 10 日
8年拍遍日军侵华遗迹:这些沉重的照片,永远不能忘

8 年拍遍日军侵华遗迹:这些沉重的照片,永远不能忘

2025 年 9 月 10 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 11 日 星期四
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 外汇动态

在 9.11 和 9.8 谁更大上 OpenAI 最新的大模型 OpenAI o1 也翻车了

12 月 之前
在 外汇动态
阅读时间: 1 mins read
0 0
A A
在9.11和9.8谁更大上 OpenAI最新的大模型OpenAI o1也翻车了


【禾湖财经】9 月 13 日消息,据外媒报道,在今年 7 月份,也就是在 OpenAI 推出新一代旗舰大模型 GPT-4o 之后约两个月,国外有用户在社交媒体上爆料称自己在 ChatGPT 4o 上询问 9.11 和 9.9 哪一个大 (9.11and9.9—which is bigger?) 时, ChatGPT 4o 笃定的回答 9.11 比 9.9 大 (9.11 is bigger than 9.9),OpenAI 当时最强模型 GPT-4o 加持下的 ChatGPT 4o,在这一问题上给出如此离奇的回答也让外界震惊不已。 

猜您喜欢

为提升团队士气 库克为苹果AI进展缓慢辩护

消息称苹果正在开发代号为 「Charismatic」 的全新操作系统

3 周 之前
0
消息称iPhone在国内需求下滑 苹果可能将其他市场加入iPhone 16首发行列

消息称 iPhone 在国内需求下滑 苹果可能将其他市场加入 iPhone 16 首发行列

1 年 之前
0

而随后有用户的测试发现,不只是 GPT-4o 加持下的 ChatGPT 4o,谷歌 Gemini Advanced、Claude 3.5 Sonnet 这两款国外知名的大模型在这一问题上也相继翻车,国内也有多家厂商的大模型未能幸免。

除了 9.11 和 9.9,也有相关媒体对其他的数字进行测试,比如 9.11 和 9.8,结果显示也有多家厂商的大模型翻车。

在 OpenAI 当地时间周四推出较以往的模型更注重推理,在奥数、编程竞赛中的表现都远强于 GPT-4o 的 OpenAI o1 系列大模型之后,也有好奇的用户再次对这一问题进行了测试。

但让人意外的是,号称有更强推理能力、数学和编程方面表现出色的 OpenAI o1,也未能避免翻车。

有测试显示,在询问 9.11 和 9.8 谁更大这一问题时,OpenAI o1 预览版在经过 14 秒的思考后,还是给出了 9.11 更大的结果,而给出的原因竟是因为 9.11 比 9.8 大。

就显示的内容来看,OpenAI o1 预览版在比较 9.11 和 9.8 谁更大时,进行了比较数值大小、对比数值大小、对比大小、比较两个数值这 4 个方面的思考,但除了对比数值大小、对比大小是 9.8 大于 9.11,另外两个方面都是 9.11 大于 9.8。不过在对比数值大小这一项中,显示的是 「蒙特认为 9.8 大于 9.11,9.8 显示出数学上的优越性。」(海蓝)



相关 文章

收评:创业板指涨近1% 两市成交额缩量逾5000亿元
禾湖观察

摩根大通 CEO:「特朗普冲击」 仍未完全显现,美联储降息作用不大!

6 分 之前

【文章来源:金十数据】AI 播客:换个方式听新闻 下载 mp3 音频由扣子空间生成 摩根大通首席执行官杰米·戴蒙 (Jamie Dimon) 近日对美国经济前景持谨慎...

六个月建仓期接近尾声,徐彦新基仍没动静,投资者:我在这基金里躲牛市
24 小时

六个月建仓期接近尾声,徐彦新基仍没动静,投资者:我在这基金里躲牛市

10 分 之前

财联社 9 月 10 日讯 (记者 吴雨其) 年初以来,A 股市场的节奏可谓 「令人意外地热情」。指数接连上攻,热门赛道层出不穷,甚至有不少投资者调侃,「随便买点就能涨」。一时...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

收评:创业板指涨近1% 两市成交额缩量逾5000亿元

摩根大通 CEO:「特朗普冲击」 仍未完全显现,美联储降息作用不大!

2025 年 9 月 11 日
六个月建仓期接近尾声,徐彦新基仍没动静,投资者:我在这基金里躲牛市

六个月建仓期接近尾声,徐彦新基仍没动静,投资者:我在这基金里躲牛市

2025 年 9 月 11 日
从市值60亿到不足1亿:车车科技遭遇现实困境与规模增长挑战

报告显示我国能源和产业转型成效显著

2025 年 9 月 11 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录