• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
ChatGPT Agent正式发布了,看看实力如何

ChatGPT Agent 正式发布了,看看实力如何

2025 年 7 月 18 日
电动自行车新规喜忧参半

英特尔前联席 CEO 离职,高层重组聚焦核心业务

2025 年 9 月 10 日
高位股调整明显,沪指半日下跌1.97%

老凤祥回收黄金多少钱一克 (2025 年 9 月 5 日)

2025 年 9 月 10 日
白糖期货收盘下跌0.59% 前20席位持仓呈现多减空增态势

贵金属板块逆势走强,两只重仓黄金股的基金涨超 4%

2025 年 9 月 10 日
今日黄金首饰价格多少钱一克(2025年9月4日)

收评:沪指跌 0.51% 贵金属及房地产板块领涨 大基金持股板块跌幅靠前

2025 年 9 月 10 日
需求出现疲软迹象 红枣短期或将重回弱势

最薄 iPhone 登场,eSIM 正式落地

2025 年 9 月 10 日
市场情绪偏空 氧化铝短期或延续承压震荡走势

多晶硅、工业硅期货部分合约交易限额调整

2025 年 9 月 10 日
市场实际成交不活跃 尿素短期低位整理

「我与浦东共成长」 系列报道 | 浦发银行助力科技企业发展

2025 年 9 月 10 日
「华尔街神算子」:比特币年底前仍有望「轻松」冲击20万美元!

「华尔街神算子」:比特币年底前仍有望 「轻松」 冲击 20 万美元!

2025 年 9 月 10 日
期货保证金都有哪些类型

回收黄金首饰多少钱一克 (2025 年 9 月 5 日)

2025 年 9 月 10 日
第19届杭州亚运会纪念币全套多少钱(2025年9月4日)

我国期货市场资金总量突破 1.9 万亿元

2025 年 9 月 10 日
14K金价格多少钱一克(2025年09月01日)

科创板收盘播报:科创 50 指数调整跌 2.38% 半导体类个股跌幅居前

2025 年 9 月 10 日
科创板收盘播报:科创50指数跌1.64% 电气设备股表现活跃

百事可乐承压,激进投资者要求瘦身

2025 年 9 月 10 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 10 日 星期三
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 贵金属

ChatGPT Agent 正式发布了,看看实力如何

2 月 之前
在 贵金属
阅读时间: 2 mins read
0 0
A A
ChatGPT Agent正式发布了,看看实力如何

猜您喜欢

6 月 9 日金市晚评:金价上行区间震荡 下方关注 3300 得失

3 月 之前
0

锇回收价格多少钱一克 (2025 年 05 月 20 日)

4 月 之前
0

【TechWeb】7 月 18 日消息,OpenAI CEO 奥特曼 (Sam Altman) 带队直播 25 分钟发布 「ChatGPT Agent」,首个统一智能体,大大提升了 ChatGPT 处理现实世界任务需求的能力。

例如,通过 ChatGPT Agent,可以让 ChatGPT 处理以下请求:「查看我的日历,并根据最新消息简要介绍即将召开的客户会议」、「计划和购买食材,为四人做日式早餐」 以及 「分析三个竞争对手并创建幻灯片」。ChatGPT 将智能地浏览网站、过滤结果、在需要时提示你安全登录、运行代码、进行分析,甚至提供可编辑的 PPT、Excel,总结其分析结果。

奥特曼称:「ChatGPT Agent 使用计算机执行复杂任务,对自己来说是一个真正感受 AGI 的时刻。」

即日起,专业版 (Pro)、增强版 (Plus) 和团队版 (Team)ChatGPT 用户都可使用 ChatGPT Agent。

ChatGPT Agent 的使用入口没变,还是在 ChatGPT 原页面,「工具」 下拉选择 「Agent mode」 即可。

融合三大能力,PPT 比人做得好

今年 1 月,OpenAI 发布了首个智能体 Operator,让 AI 像人类一样直接与 GUI 交互,可以自主上网、点击和输入。

Operator 推出 2 周后,OpenAI 又推出了首个 Deep Research,推理模型直接可以使用工具,开展研究,擅长分析和总结信息。

现在,ChatGPT Agent 融合了此前三大技术突破的优势:Operator 与网站交互的能力,Deep Research 整合信息的技巧,以及 ChatGPT 智能对话优势。

「Agent mode」 下的 ChatGPT 可以直接使用用户的计算机资源,包括智能浏览网页、筛选结果,在需要时提醒安全登录、运行代码、进行分析,还能直出 PPT 和 Excel 汇总发现结果。

为了展示 ChatGPT Agent 能力,团队演示了一个真实场景:上传一张团队吉祥物图片,ChatGPT 可以制作公司吉祥物漫画风贴纸,然后再订购 500 张并送到某个地址。

在理解提示词后,ChatGPT 先整合搜索-再推理创作-再执行任务,调用用工具 Imagen 生成动漫版图片,设计贴纸,最后从 StickerMule 订购 500 份寄到的用户指定的地址。

另外,团队还演示了 ChatGPT Agent 做 PPT 的能力。

要求 ChatGPT 从 Google 云中提取分析评估数据并制作成 PPT,直接用图表展示结果。

ChatGPT Agent 链接 Google 云 API 进行搜索,并读取相关内容信息,并编写一些代码。

模型使用图像生成功能,为 PPT 图表做一些装饰和优化。

制作出第一张 PPT(如上图),还不够精致。

强化学习的一个关键特性是模型会审视自己的结果,并加以完善,以交付出色的最终结果。

最终,ChatGPT Agent 调用模型生成了如下 PPT 图表。

ChatGPT Agent 「跑分」 情况

在网页浏览、现实任务完成能力的评估中,ChatGPT Agent 全部刷新了 SOTA。

在人类最后考试 (HLE) 中,ChatGPT Agent 以 41.6% 的得分,刷新了最高纪录。当研究团队采用并行策略后,即同时运行最多 8 次并选取自信度最高结果,HLE 得分直接刷到了 44.4%。

在最难的数学基准测试 FrontierMath 中,通过使用工具,如访问终端执行代码,ChatGPT Agent 的准确率达到 27.4%,远远优于之前的 o3 和 o4-mini 两种模型。

在旨在评估模型在复杂、经济上有价值的知识工作任务上的性能的内部基准上,ChatGPT Agent 的输出大约有一半的情况下与人类相当或更好,同时明显优于 o3 和 o4 mini。

在评估数据科学生产力任务的 DSBench 中,ChatGPT Agent 显著超越了人类表现。

在 Excel 编辑能力的 SpreadsheetBench 测试中,当能够直接编辑电子表格时,ChatGPT Agent 的得分甚至更高,为 45.5%,而 Excel 中的 Copilot 为 20.0%。

在投行分析师 1-3 年级建模任务的内部评估中,ChatGPT Agent 表现优于 Deep Research 和 o3 模型。

在 OpenAI 发布的 BrowseComp 基准测试 (衡量浏览代理在网络上定位难以找到的信息的能力),ChatGPT Agent 以 68.9% 的准确率成为新 SOTA,比 Deep Research 高出 17.4%。

最后,关于 WebArena⁠(在新窗口中打开),这是一个旨在评估网络浏览代理在完成现实世界网络任务方面的性能的基准测试,ChatGPT Agent 比基于 o3 的 CUA(为 Operator 提供动力的模型) 有所改进。

AI Agent 三维竞争格局形成

2025 年是全球 AI Agent 技术爆发元年,行业从基础大模型竞争全面转向智能体落地,竞争格局呈现多层级分化。

在通用领域,今年年初,中国团队开发的全球首个通用 Agent「Manus」 发布即引发震撼,6 月访问量达 1616 万次。

在垂直领域,就在 OpenAI ChatGPT Agent 发布前一天,亚马逊云科技发布了企业级 Agent 部署平台 Amazon Bedrock AgentCore,提供七大核心服务 (如运行时隔离、代码沙盒、浏览器工具),支持 8 小时异步任务,帮助开发者打通 AI agent 从概念验证到生产部署之间的关键环节。

随着 OpenAI ChatGPT Agent 的强势加入,当前 AI Agent 已形成 「通用 vs 垂直」、「端到端 vs 多模型」、「C 端工具 vs B 端平台」 的三维竞争格局。

 

相关 文章

电动自行车新规喜忧参半
禾湖观察

英特尔前联席 CEO 离职,高层重组聚焦核心业务

6 分 之前

【文章来源:金十数据】 英特尔 (INTC.O) 周一宣布,其前联席首席执行官米歇尔·约翰斯顿·霍尔特豪斯 (Michelle Johnston Holthaus) 将...

高位股调整明显,沪指半日下跌1.97%
贵金属

老凤祥回收黄金多少钱一克 (2025 年 9 月 5 日)

17 分 之前

老凤祥回收黄金多少钱一克 (2025 年 9 月 5 日) 老凤祥黄金回收价格查询 (2025 年 9 月 5 日) 老凤祥黄金回收价格 815.00 元/克 黄金纯度 99.0% 以上 ...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

电动自行车新规喜忧参半

英特尔前联席 CEO 离职,高层重组聚焦核心业务

2025 年 9 月 10 日
高位股调整明显,沪指半日下跌1.97%

老凤祥回收黄金多少钱一克 (2025 年 9 月 5 日)

2025 年 9 月 10 日
白糖期货收盘下跌0.59% 前20席位持仓呈现多减空增态势

贵金属板块逆势走强,两只重仓黄金股的基金涨超 4%

2025 年 9 月 10 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录