「AI Agent 元年」 已至。
就在刚刚,OpenAI 曾点名的中国竞争对手智谱 (Z.ai,原 Zhipu) 发布全新 AI 智能体应用 AutoGLM。
8 月 20 日消息,智谱今天发布全球首个手机 Agent 智能体应用产品 AutoGLM 2.0 版本,基于 GLM-4.5、GLM-4.5V 等纯国产模型驱动,具备推理、代码与多模态的全能能力,拥有 iOS 版、安卓版和网页版等全平台版本,支持 Agent+云手机等新技术,突破硬件限制,能在任何设备、任何场景下运行,帮助用户 Agent 智能体操作。
会前媒体沟通会上,智谱 CEO 张鹏表示,此前发布的 GLM 4.5 系列更多是偏向于基础模型技术层面,虽然其有很大的变革意义,但这更多体现在企业应用和开发者用户层面。而 AI Agent 产品 AutoGLM 更偏向于 C 端产品,驱动模型能够发挥工作和日常任务,更像是 「综合能力展现」 的产品,希望有更广泛的产品反馈。
「有了 AutoGLM,就好像你突然多了很多帮手,这些帮手与你是平行工作。那么未来,人的能力并不完全取决于你自身,而是取决于 1(你)+N(多个智能体,Multi-agent system),让很多智能体帮助你完成工作。」 张鹏称。
智谱 CEO 张鹏
值得一提的是,昨天 CNBC 放出了 OpenAI CEO 奥尔特曼 (Sam Altman) 线下交流内容,直指中国 AI 对美国的强大威胁能力。
「我对中国感到担忧。」 奥尔特曼表示,美国可能低估了中国在 AI 领域的重大进展,并警告称美国对华出口限制并未阻碍这一进展。中美之间的 AI 军备竞赛比表面看起来更为复杂,尤其在推理、技术探索等能力方面,中国可能会更快构建起来,「我不认为这会像 『是美国还是中国领先』 那么简单。」
据统计,2024 年,中国人工智能产业规模超过 7000 亿元,连续多年保持 20% 以上的增长率;截至今年 3 月,共有 346 款生成式 AI 服务完成备案,而中国的 DeepSeek 已成为全球用户增速最快的生成式 AI 应用。
显然,中美 AI 应用竞争态势不断加剧。
时隔超 263 天,智谱 Agent 再度进化成 「Manus+云手机」 综合体
今年 6 月,OpenAI 发布了一份对外分析报告,点名中国 AI 公司智谱加快与马来西亚、新加坡、阿联酋、沙特和肯尼亚等地区合作落地大模型基础设施,并通过与其他硬件厂商的合作提供本地化私有硬件解决方案。
OpenAI 表示,智谱是一家 「有目的的市场抢跑」,甚至指责智谱 「试图在美欧公司进入前,先行锁定新兴市场」。报告称,这种 「主权级 AI 能力」 的输出,让智谱在全球新兴市场中建立起 「中国方案」 的替代逻辑。因此,OpenAI 正在长期关注智谱这家中国 AI 公司的发展。
事实上,早在今年 1 月,智谱就被美国列入了实体清单。
同时,今年以来,智谱连续获得上海、杭州等地资本的支持。截至今年 4 月,智谱已完成约 11 次融资,累计融资金额超 125 亿元,其背后既站着红杉中国、高瓴资本、达晨财智、顺为资本、君联资本等私募基金,也有阿里巴巴、腾讯、美团、好未来、三七互娱等多个头部企业,更吸引着北京、杭州、珠海等地国资重金参投,并收获来自沙特阿美旗下基金跟投。
今年 7 月,智谱发布全新 GLM-4.5 开源模型,使用成本低于 DeepSeek。与现有 AI 模型的底层逻辑不同,智谱 GLM-4.5 模型基于所谓的 Agentic AI,这意味着该模型会自动将任务分解为子任务,以便更准确地完成任务。据报道,最低只需使用 8 个英伟达 H20 芯片就可以运行 GLM-4.5 系列模型。
事实上,2025 年被称为 「智能体爆发年」,百度、阿里、腾讯、字节、360 等互联网大厂的密集布局,智能体市场已从 「单兵作战」 进入 「协同作战」 新阶段。
据公开数据统计,仅上半年就有超过 50 款智能体产品密集发布。字节跳动的扣子空间支持飞书、高德地图等 14 种插件调用;360 的 「多智能体蜂群」,被周鸿祎称为生产力迈入 「成果交付时代」 的关键节点。
当前,智谱再度更新 Agent 系列项目,而距离去年 11 月 29 日智谱 Agent 智能体 「全家桶」 对外发布仅隔了 263 天。
以下是过去三年智谱 Agent 研发至今的时间线:
- 2023 年 4 月,AgentBench 项目启动;
- 2024 年 1 月,智谱 All Tools 能力率先发布,它能自动调用代码解释器、web 浏览器和文生图模型等;
- 2024 年 4 月,AutoWebGLM 公布,此外,智谱与高通、三星、英特尔、荣耀、华硕等端侧芯片、手机、电脑厂商合作,联合发力大模型应用,在 AIPC、智能助手等领域落地。
- 2024 年 11 月,智谱 GLM OpenDay 上,智谱 AI 发布 AutoGLM 及 GLM-PC 两款 AI 智能体产品。其中,AutoGLM 基于智谱自研的 「基础智能体解耦合中间界面」 和 「自进化在线课程强化学习框架」,是智谱第一个产品化的智能体 Agent,通过文字/语音指令模拟人类操作手机,实现大模型从 「言」 到 「行」 的范式转变,目前已经 「百万内测」 开放申请;GLM-PC 则是基于 CogAgent 模型的视觉理解和任务规划能力,操作计算机的桌面应用,用户通过简单的一句话即可实现复杂任务的快速执行,同时具有任务规划、屏幕界面信息理解的能力,能够根据页面信息进行计划更改和自我纠错,根据用户的指令完成任务。
张鹏当时表示,Al Agent 今天非常火,从苹果的 Apple Intelligence、谷歌的 Jarvis,到 OpenAI 即将发布的 Operator,全球科技巨头纷纷布局。而国内智谱率先开放 AutoGLM 内测,已受到很多关注。「今天的 Agent 可以做到像人一样,理解界面、规划任务、使用工具、完成任务,从而更聪明地代替人类行动。」
张鹏认为,大家对于大模型的期待值过高,当然这毕竟是一个高投入的事情。信息的理解在于底层的技术,但底层技术并不是一个简单的单项能力,如果想让它做生产力工具,面对的是全面性的需求,可能会存在特别明显短板,所以智谱不止是技术上的布局,还需要产业生态的布局。智谱主要定位是 「开放平台」,帮助大家去做原有产品的改造以及 AI 智能化探索。
如今,AutoGLM 2.0 发布。相比 1.0 版本,AutoGLM 2.0 实现了质的飞跃——它不再只是 「说」,而是真正能够 「做」。从 1.0 版本让 AI 代替用户完成部分手机、部分场景操作,到如今,AutoGLM 2.0 已经成长为一名执行型助手,能够在 「云端」 自主完成多样化的任务。
智谱表示,AutoGLM 会以这样的产品形态出现,得益于由智谱最新开源 SOTA 语言模型 GLM-4.5 与视觉推理模型 GLM-4.5V 驱动,将基座模型原生能力发挥到极致,并结合在 「端到端异步强化学习」 方面的多项突破成果,让 AutoGLM 完成推理、编码、研究、Agentic 与 GUI 操作等多类任务,并可根据需求灵活调用最合适的 「大脑」 完成执行。
智谱 AutoGLM 技术负责人刘潇表示,团队认为,从 Agent 智能体到 AGI 通用人工智能,还需要满足 3A 原则:Around-the-clock(全时),24 小时运行,即使用户离线,Agent 依然在执行任务;Autonomy without interference(自主零干扰),独立运行,不占用用户屏幕与算力;Affinity(全域连接),跳出浏览器对话框,跨越手机、电脑、手表、眼镜、家电等设备,操作物理世界。
「每个人对于 AGI 都有不同定义。AGl 是一个范围性的概念,有上限也有下限。」 刘潇称。
在 Device Use 基准测试 (涵盖手机、电脑和网页操作) 中,AutoGLM 整体表现优于 ChatGPT Agent、UI-TARS-1.5 和 Claude 4 Sonnet。其中在 OSWorld 当中,AutoGLM 达到 48.1 分,远超 ChatGPT Agent。
智谱表示,这意味着,AI 不再是一个 「聊天工具」,而是一个能真正替你干活的全能 Agent。它不仅能给出答案,还能把任务完整执行,帮助用户节省时间与精力,彻底改变人与 AI 的协作方式。
据了解,即刻起,AutoGLM 已经免费上线在安卓、iOS 和网页等平台,不过目前很多功能仍需要迭代更新,稳定性有待反馈。但智谱表示,其还将在 AutoGLM App 中迭代推出定时任务等新功能。
整体来说,AutoGLM 独立于智谱清言 App,全新的 「智能体」 需要更 Agent 自动化操作能力,但是否 「高效」 有待时间检验。
预计智谱近期完成 IPO 上市辅导,从而将正式向上交所和港交所提交 IPO 上市申请。
奥尔特曼的焦虑症:美国低估了中国 AI 发展
当前,中国和美国 AI 大模型技术和应用的差距在不断缩小。
今年 1 月,中国开源的 AI 模型 DeepSeek V3/R1 引发关注,其不仅突破美国限制,构建了与 OpenAI 的 ChatGPT 性能相媲美的开源模型,而且成本能力上更胜一筹,DeepSeek 声称其 V3 模型的训练成本不到 600 万美元,震惊了全球投资者。
但一些分析师表示,该数字是基于该公司长期以来超过 5 亿美元的硬件支出得出的。
今年以来,受中国 AI 加速发展的影响,美国政府加大对 AI 技术的限制力度。
7 月 23 日,特朗普政府正式推出被称为 「AI 星球大战」 的人工智能 (AI) 行动计划,并签署三项行政命令,共推出 90 余项行动政策,大力推进美国 AI 技术的研发、加大基础设施建设和主导国际合作,其中提到要积极加大美国 AI 技术应用、建设足够安全的军事情报 AI 技术部署环境和基础设施,以及确保美国掌握 AI 技术。
中国现代国际关系研究院科技与网络安全研究所助理研究员范晓莹发文称,此项美国 「AI 行动计划」 继续秉持 「轻监管,重发展」 的理念,一方面采取 「避重就轻」 式监管策略。如针对极易引发政治安全风险和外交风险、影响美国 AI 出海的 AI「偏见」 及模型透明度议题,特朗普政府迅速提出相应监管政策。但对于可 「免费获取」 他国数据的 「侵犯版权监管」,美国则 「装聋作哑」,既未针对此热门争议出台相应监管政策,还计划取消阻碍 AI 开发和部署的联邦法规。另一方面是继续推动美国 AI 化转型,从培养 AI 专项人才、构建高质量数据集和加快政府及行业 AI 采用等方面入手,全方位塑造 AI 发展、应用和监管生态。
范晓莹强调,一定程度上,此次 「AI 行动计划」 未来会成为美国 AI 版 「曼哈顿计划」 的重要组成部分,将对全球 AI 生态带来深远影响。
就在 8 月 18 日,OpenAI CEO 奥尔特曼再提中美 AI 竞争话题。
「我对中国的 (AI 发展) 感到担忧。」 奥尔特曼警告称,中美 AI 竞赛深度交织,其影响远非 「谁更领先」 这一简单排名所能概括,不会简单到,哪一方领先了,就是谁赢得 AI 竞赛了。
尽管美国对华芯片出口管制不断升级,但奥尔特曼仍然担心这一政策无法跟上技术发展的实际情况,认为仅靠出口管制并非可靠的解决方案。根据美国政府新协议,英伟达和 AMD 已同意向美国政府 「上贡」 其在华销售芯片收入的 15%,以换取特朗普政府颁发的出口许可证。
虽然没有直接提及这项协议,但奥尔特曼特别强调,美国政府试图只依靠政策手段以控制 AI 发展进程,是 「不切实际」 的。美国只聚焦于 「阻断先进芯片出口」 单一环节,而中国正在构建完整的 AI 技术生态,这会让美国的管制措施即便不断升级,但仍然无济于事。
「你可以对某一样东西实施出口管制,但可能管制的并非关键之物…… 人们或许会建造晶圆厂,或是找到其他规避办法,」 奥尔特曼表示,对于流入中国的 GPU 数量减少,他表示怀疑,「我也希望有个简单的解决方案,但直觉告诉我,这很难。」
奥尔特曼也坦言,中国 Kimi K2、DeepSeek 等开源 AI 技术发展,迫使 OpenAI 改变了模型的发布策略。
「很明显,如果我们不这么做,世界 (的 AI 生态) 大概率会以中国开源模型为基础进行构建 AI 应用,」 奥尔特曼说,「这肯定是推动我们作出决定的因素之一。虽然不是唯一因素,但影响很大。」
今年 8 月初,OpenAI 推出 gpt-oss-120b 与 gpt-oss-20b 两款开放权重模型,免费开放且支持开发者定制,为闭源产品提供更透明的替代方案。这是 OpenAI 自 2019 年推出 GPT-2 以来,首次发布开放权重模型,也是其与微软签署独家云服务协议六年来问世的首批此类模型。
「AI 浪潮将给所有国家带来巨大机遇,不仅仅是中国和美国,」 张鹏表示,智谱将帮助海外客户构建他们自己的 AI 技术。他直言,智谱的商业计划 「与幕后支持者之类的人没有深层次的联系」。
事实上,OpenAI 为了获得更多支持和资金,将中国 AI 技术描绘成对美国生态系统的威胁。
据报道,OpenAI 正在推进其史无前例的 400 亿美元融资计划,融资后估值超过5000 亿美元 (约合人民币 3.59 万亿元),超越马斯克的航天公司 SpaceX(3500 亿美元),成为全球最具价值的 AI 公司之一。
同时,有消息称 OpenAI 年化收入已翻倍至 120 亿美元,同时其旗舰产品 ChatGPT 的周活跃用户数已经超过 7 亿人次。
奥尔特曼强调,2025 年,AI Agent(智能体) 将开始大规模 「上岗」,处理复杂任务,编程等场景;到 2026 年,智能体将具备自主发现新知识的能力,形成具有独立逻辑的决策框架;到 2027 年,智能体将正式进入物理世界,作为 「数字劳动力」 创造实际商业价值。
IDC 的研究报告指出,到 2027 年,60% 的大型企业会采用协作型智能体系统,将业务流程效率提升 50% 以上。
(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)