ChatGPT-5「不够惊艳」?最新实测来了 ChatGPT-5,技术封顶了?北京时间 8 月 8 日凌晨 1 点,人工智能巨头 OpenAI 正式推出 GPT-5。发布会上,山姆·奥特曼比喻到:「GPT-3 如对话高中生,偶有灵光但稳定性不足;GPT-4 如与大学生对话,兼具智能性与实用性;而 GPT-5 则像是与专家交谈,一名各个领域堪称博士级的专家。」 发布会现场,OpenAI 团队展示出 GPT-5 在编程、数理逻辑、文本创作、健康咨询、视觉感知等多维度,整体智能水平较前代产品均有较大更新与提升。GPT-5 在编程方面提升最大,尤其在复杂前端架构生成与大型代码库调试环节表现突出,用户只需提出相应需求,GPT-5 就能生成网站、游戏等;文本创作模块同步升级,可将抽象概念转化为兼具文学性、情感共鸣与专业韵律的内容;此外在健康医疗领域,GPT-5 能够基于用户背景、知识储备及地域特征动态生成个性化建议。此外,GPT-5 在事实性准确性方面也有较大进步。据 OpenAI 数据显示,相较于 GPT-4o,GPT-5 在通用任务中的事实错误率降低约 45%;启用深度思考模式后,其错误率较 o3 模型下降约 80%。据 OpenAI 透露,目前 GPT-5 已向免费版、Plus 版、Pro 版以及 Team 版用户开放,企业版和教育行业的用户则需再等待一周方可使用新模型。其中,免费版用户虽可直接使用 GPT-5,但仍有一定的限额,超额后将自动切换至 GPT-5 Mini 模型。《科创板日报》 记者随即更新 ChatGPT,并对其进行实测发现,免费版用户现已可访问 GPT-5 基础功能。在中文版 「自定义 ChatGPT」 界面中,能够看到最新上线的 「人格」 模式,包括挑剔者、机械、倾听者、技术宅四类预设交互风格,用户可依据需求自主切换输出风格。据 OpenAI 介绍,在 GPT-5 中部署了新型安全训练框架——安全补全,即让模型在预设安全框架内生成最大化实用性的回答,而涉及潜在风险的请求,GPT-5 则会明确标注拒绝原因并提供合规替代路径。因此,当记者提出 「怎么制作炸药」 的问题时,GPT-5 未简单拒绝回答,而是明确声明该问题涉及高危、违法信息,因此无法提供配方、比例及操作步骤等关键内容。同时主动转向建设性引导,询问用户是否需要整理炸药的化学原理与历史演变等合规替代材料。需要注意的是,GPT-5 信息处理的稳定性还有待观望。记者先后向 GPT-5 发送硕士毕业论文与期刊论文,要求其归纳总结论文主题、框架、研究思路以及研究结论等信息,并生成相应的研究框架。在针对学术文本处理能力的实测中可以看到,GPT-5 对万字左右的期刊文献展现出高效稳定的解析能力,可快速提炼研究主题、逻辑框架与核心结论,并自主调用 Python 代码生成可视化研究导图。然而当处理超过 4 万字的硕士论文时,模型出现明显的逻辑断层与编码异常,未能完整构建研究框架。记者也留意到,GPT-5 全球上线短短一天内,小红书、X 等海内外主流平台涌现密集用户反馈,质疑其实际体验与宣传存在落差,如人格模式机械感过强、长上下文理解稳定性不足、额度太少、功能升级幅度未达预期等问题。「此次更新没有颠覆性惊艳的地方,给人一种 OpenAI 能力封顶的感觉。」 有用户向记者坦言,「不如 GPT-4 好用。」 上海交通大学副教授、上海人工智能实验室青年科学家谢伟迪也向记者表示,感觉上 OpenAI「还是太注重语言模型了,没有特别的注重多模态模型,没有当时 GPT-4 或者 GPT-4V 的出来的时候惊艳了。」 针对用户对 GPT-5 缺乏创新性的质疑,西南证券研究院计算机首席分析师王湘杰则向记者指出,此次更新或为 OpenAI 战略重心转向 「All in One」 生态整合的标志。据其观察,以 OpenAI 为首的海外大模型厂商已从追求单点技术爆破,转为聚焦高可靠性架构优化与场景易用性升级,这也是产业进入下半场竞争的必然选择。王湘杰表示,OpenAI 内部希望未来 ChatGPT 能够成为用户日常刚性需求的首选入口,「就像现在大家每天都打开微信,对于 OpenAI 来说,他们希望将 ChatGPT 从工具进化为 『All in one』 的 AI Agent,最终在青年群体数字生活中占据绝对地位。」 此外,面对 GPT-5 在编程、医疗等领域逼近人类水平引发的职业替代忧虑,王湘杰向记者明确表示:「当前 AI 仍不具备取代人类职业的基础条件。」「离 AI 取代人类的职业还有很长的路要走,包括 AI 的可靠性、适配性、能耗等方面,目前来看还是远远不够的。」 王湘杰强调,AI 向 AGI 演进仍需突破多重技术屏障,中长期定位仍是 「效率增强工具」,核心价值在于重构人机协作范式、提高用户效率,而非替代人类角色。