巨头混战 Agent，押注背后是真未来还是新泡沫？

文 | AI 大模型工场，作者｜西梅汁，编辑｜星奈

今年，被不少业内人称为「Agent 元年」。

这一年，AI Agent 的概念像一枚火种，从初创公司 Manus 的 Demo 视频点燃，到字节跳动用「扣子空间」将 Agent 化身为「裂变工具」，嵌入日常场景；百度「心响」定位通用超级智能体 APP，覆盖 200+任务类型，试图实现复杂任务的一站式解决；阿里的「心流」项目则深入研究 Agent 的人机协同效率，从电商客服到企业服务逐步铺展；腾讯继续秉持平台战略，构建 Agent 开发生态。

与此同时，融资市场也被点燃。据来觅 PEVC 数据，自 2024 年以来，全球 AI Agent 赛道的融资金额已突破 665 亿元人民币。其中，自动驾驶、人形机器人、大模型等赛道最吸金，头部机构频频下注。

但如同几乎每一场 AI 浪潮一样，泡沫的阴影也在快速靠近。

技术的跃迁是否足够支撑其野心勃勃的应用想象？用户真有「刚需」到愿意持续留存并为之付费？这场由巨头领舞的盛宴，究竟是迈向 AI 大规模落地的新起点，还是又一轮概念堆叠下的虚火？

一、Agent 何以成为巨头必争之地？

在国内大模型发展逐步稳定、通用对话功能趋同的背景下，Agent 像是被视作「后提示词时代」的新概念。它以任务导向、自主规划和多步骤执行为特征，为模型的可用性打开了新空间。

过去，用户需要靠提示词技巧与模型反复周旋，而现在，Agent 可在给定目标下自动执行一系列动作，更符合大家对「AI 助理」的直觉期待。

Manus 的出圈并非偶然，它采用多智能体系统架构，能动态调用不同领域的专用大模型，实现「1+1>2」的效果。这就有点像交响乐团的指挥，协调各个乐器组，让它们共同演奏音乐，不仅避免了单一模型在能力上的局限性，还有效提升了任务处理的能力和效率。

同时 Manus 的这种交互方式，标榜「端到端执行任务」，直接戳中了行业长久以来的痛点：大模型虽强，但不会用。在其带动下，国内大量创业项目涌现，部分采用开源框架如 LangChain、AutoGen，部分自建执行链路和插件体系，追求更加本土化的场景匹配与用户体验。

大厂也迅速响应，尤其在内容、办公、知识管理等相对标准化的应用领域推进 Agent 化转型。

字节「扣子空间」聚焦创作者自动剪辑与内容发布，百度借「心响」深耕搜索与问答任务链，阿里探索电商、客服、财务等垂直系统嵌入，腾讯则将 Agent 能力集成至企业微信、腾讯文档、混元平台 API 中，意在形成多层级的企业服务生态。

在这些探索背后，是国内 AI 产业对「大模型+场景」的现实需求。同时，更重视端到端的体验。Agent 不仅是界面重构，更被视为商业模型升级的关键跳板。

Agent 的爆发，并非偶然，它在多个层面踩中了时代的脉搏。

从技术演进来看，大模型能力的提升为 Agent 提供了基础算力保障。GPT-4 之后，无论是语言理解上，还是多模态能力上，都达到了一个足以支撑复杂任务调度的门槛。

其次是交互方式的进化。在语音助手、聊天机器人之后，Agent 的出现提供了一个更具沉浸感与目的性的交互路径。不仅回应用户的问题，更主动推进任务流程。相比于过去「你问我答」的工具形态，Agent 承诺的是「交付结果」的服务形态。

同时，对巨头而言，这是一道无法绕开的必答题。过去两年，大模型技术已经趋于「共识化」，能力边际变小、差异化成本变高，「百模大战」的价格战和性能战耗尽了耐心。

而 Agent 像是一条新通道，它不仅能撬动新应用，还可能打开存量业务的变现瓶颈。更关键的是，它落地的单位颗粒度小，可以快速试错、快速迭代、快速验证商业价值。

Agent，似乎成为了下一阶段「技术找场景」的试金石。

二、繁荣下的 AB 面：技术突破还是「高级自动化」？

但是在这股热潮之下，并非没有质疑。

华丽演示背后往往忽略场景条件和人工干预。许多「自助手写文章」或「自动化办公」案例，前提是有精心编写的提示词、可靠的网络资源和大量 API。

实际部署时，Agent 需要解决环境不稳定、异常处理和及时纠错等问题。不少技术人士指出，目前绝大多数 Agent 产品，距离真正的「智能体」尚有不小差距。路径规划、工具调用、多轮交互确实比传统对话系统更进了一步，但核心逻辑仍是任务自动化的增强版。

换句话说，许多所谓 Agent，更像是「流程机器人」套了一个 AI 壳。也就是说，真实场景中的连续任务与演示环境相差甚远，常常需要人工「监督+修正」，效率提升有限。

从技术底座看，Agent 的运行强依赖于几个关键环节：环境建模、记忆系统、长期目标拆解能力、多模态融合、对接工具链的稳定性等。遗憾的是，这些环节没有一个是完全「成熟」的。

而从用户体验出发，Agent 带来的改变，往往不如想象中「革命性」。大家仍需学习如何「正确地」提示 Agent，才能获得理想结果；不少产品陷入「体验上像是套壳 Siri，底层上是复杂 Prompt 拼贴」的窘境。更有甚者，在以「聪明感」吸引用户的同时，背后的调度逻辑与「AI」关联甚微，几乎只是流水线式脚本执行。

换言之，Agent 确实比传统 Bot 更强大，但要说它已经构成「生产力革命」的新转折，仍言之过早。

那么在面对这些挑战，创业公司和大厂分别采取了不同策略。以 Manus 为代表的新锐队伍，倾向于前沿探索，它们往往开放注册早期用户，依托最新架构集成 API 插件，追求功能极限。

Manus 自身就号称「多模型架构+后台实时监控+可回放会话」，试图给用户提供一个「看得见、可操控」的 Agent。但事实上，部分用户社区评论已经质疑其稳定性，称有部分功能只是包装，很多操作依赖已有大模型或手动准备的工具。

相比之下，字节、百度等大厂则走更稳健的路径，它们往往先将 Agent 功能融入已有产品（像智能客服、办公软件），以部件化插件形式提供服务，同时还在内部持续打磨系统。

如百度推出的「链路学习」场景、腾讯开放的企业办公助手等，更多强调闭环业务与安全控制。大厂有资源建立大规模测试和安全审查，因此在落地前强调可控性和行业适应度，而不是一味追求技术。

总的来说，Agent 在概念层面吸引了众多目光，但其技术短板同样显而易见，记忆与上下文管理不足、多任务泛化困难、对动态环境的感知不强、对结果的可靠性缺乏保证等等。Manus 等创业者的尝试激发了想象，但是否可持续盈利和规模化，还有待进一步探索。

三、巨头混战：战略卡位与差异化求生

不同的巨头，在 Agent 赛道上有着完全不同的下注策略，但它们的底层意图却高度一致：以 Agent 为抓手，构建出人与产品、人与服务、人与平台之间的关系。

从时间上看，字节是几家巨头中最早高调入场 Agent 概念的玩家。早在 2023 年底，字节就上线了豆包智能体平台，主张「人人都能造 Agent」。

到 2024 年初，其推出的「扣子」平台进一步降低了智能体开发的门槛，通过可视化流程、拖拽组件、内置插件等方式，让非技术背景的个人也能创建功能丰富的智能体，并一键发布至豆包、飞书、抖音等多个渠道。

「扣子」本质上是一个智能体应用广场，它整合了插件系统、工作流引擎、知识库接入和多端发布等能力。据 2024 年 12 月消息，扣子专业版集成了 1 万 + 插件，可调用国内流行的大语言模型，且扣子 1.5 版本还集成了视觉理解、音乐、图像生成等模型。

不仅如此，据公开数据统计，截至 2025 年第一季度，豆包平台上已上线智能体超过 10 万个，其中大部分来自个人开发者和中小企业，体现出较强的生态活力。在产品逻辑上，字节试图延续其内容平台的成功经验，通过低门槛创作工具和算法分发机制，激发长尾智能体的活跃度。

虽然 Agent 的交互属性与内容消费不同，但这种平台化打法在推动生态建设、吸引开发者上具备一定先发优势。

腾讯在 Agent 方向的布局体现出「平台+能力」的战略思路。自 2024 年底起，大模型相关业务统一划归至 CSIG，Agent 被正式纳入腾讯云的大模型战略，成为核心落地方向。当前已形成双平台体系：面向 C 端用户与轻量开发者的「元器」，以及服务企业级需求的「腾讯云智能体开发平台」，分别覆盖内容创作与业务重构两大场景。

在实际产品落地上，腾讯正在拓展 Agent 的行为边界。前段时间，推出的 Qbot 浏览器，具备文件转换、应用操作等能力，未来可望与本地软件打通，成为用户常驻的多功能助手。

在企业服务层面，腾讯强调 Agent 对高复杂度、高知识密度行业的改造潜力，已在汽车、金融、零售、医药等多个行业展开场景合作。技术上，腾讯聚焦 Agent 的自主决策、工具调用与工作流编排能力，通过整合内部 AI 技术栈，推动从「可调用」向「可协作」演进。

当前的挑战来看，模型自主性仍待提升，复杂任务的拆解执行仍需框架与工程体系配合，客户对 Agent 的认知也需要通过多种方式弥合。

阿里在 Agent 方向的思路，延续了其在企业服务领域的深耕路径。自 2023 年起，钉钉就开始试点智能助理功能，2024 年进一步升级为「AI 助理中心」，并在 2025 年开放智能体开发框架，支持企业定制自己的数字员工。其核心优势在于：紧贴企业实际需求，强调数据私有、安全可信、系统兼容。

在技术研发上，阿里云的通义千问 Qwen 系列大模型为 Agent 应用提供了强大的基础能力，还开源 Qwen - Agent 框架及多个 Agent 应用示例，降低开发门槛，并融入多模态技术丰富交互体验。

今年 3 月，夸克 App 推出了 AI 版，并首创了「智能体中枢」功能，将其转型为多模态 Agent 平台，用户通过该平台可以直接获取 AI 所执行的任务结果，而不仅仅是传统的搜索或聊天。4 月，阿里又推出了「心流」智能体应用，通过高级研究模式帮助用户自动完成报告编写、代码生成等复杂任务。此外还在外贸、智能客服等领域推出多种 Agent 应用。

除此之外，阿里智能体平台「通义万相」为个人创作者和中小企业提供简单易用的 Agent 开发工具，同时通过阿里云和百炼平台赋能企业客户；在人才与团队组建上，招聘前 Salesforce 集团副总裁许主洪等人才，还开启大规模招聘潮；在生态构建与合作上，阿里云智能集团整合各方资源确立「AI + 场景」深度融合战略，与众多企业拓展合作关系，推动 Agent 应用落地。

百度作为最早布局大模型的公司之一，在 Agent 方向的探索也在持续推进。在 create2025 百度 AI 开发者大会上，推出了「心响」APP，是一款以「AI 任务完成引擎」为核心的通用超级智能体 APP，致力于通过智能化手段解决用户日常生活中的复杂需求。已经覆盖了 200 多个任务类型，未来计划扩展至 10 万种以上。

同时，百度的文心智能体平台为零代码基础的用户提供了全链路的任务创作与经营服务，支持海量工具调用，推动了 Agent 生态的不断发展。

同时，百度全面拥抱 MCP 协议，将这一协议应用于文心大模型、千帆平台及核心产品，如百度搜索和百度文库等。这一协议使得 AI 应用与外部世界的连接更加紧密，进一步提升了 Agent 在任务规划和调度中的精确度与效率。此外，百度还发布了文心大模型 4.5 Turbo 和 X1 Turbo，为优化任务执行的速度、性能和性价比，推动 Agent 技术的持续进步。

不仅如此，百度通过智能云千帆平台，为企业提供全面的 MCP 支持，鼓励开发者在平台上开发自己的 MCP 组件并与外部业务系统对接，推动 MCP 生态的繁荣。

总体来看，Agent 并非一个孤立的技术标签，而是模型能力、应用框架与用户需求三者交汇的产物。随着大模型差异化逐步缩小，各家企业在 Agent 上的布局也反映出各自的生态定位与资源。

字节强调内容驱动与生态构建，腾讯重视能力组件与业务整合，阿里深耕产业落地与定制化服务，百度则以产品闭环和底层模型为基石。

这场 Agent 竞速没有明确的终点，它更像是大模型商业化的一场阶段性演进。

四、真未来还是新泡沫？

Agent 的确具备塑造未来产品形态的潜力，它融合了模型能力、交互逻辑与任务调度，使 AI 从「回答者」进化为「行动者」。但在通往未来的路上，每一个技术热点都难免遭遇泡沫期的「高估—失望—再估值」周期。

今天的 Agent 热，既是技术突破的阶段性结果，也裹挟着巨头对增长焦虑的投射。资本、流量、研发资源的倾斜，使其呈现出「预期大于现实」的膨胀状态。那些缺乏稳定场景支撑、无法形成用户复购的 Agent 应用，很可能会在下一轮融资窗口关闭时迅速退潮。

但这并不意味着泡沫本身是坏事。技术演进从不可能一帆风顺，泡沫是筛选机制，更是催化剂。真正的问题在于：谁能在热潮退却后留下可复用的底层架构与产品模型？谁能真正找到场景契合、用户愿意长期使用的价值点？

Agent 不会是终点，它更像是一块通向下一阶段 AI 生态的跳板。问题不在于它「是不是泡沫」，而是谁能在泡沫散去之后，站在原地继续前行。

巨头混战 Agent，押注背后是真未来还是新泡沫？

一、Agent 何以成为巨头必争之地？

二、繁荣下的 AB 面：技术突破还是「高级自动化」？

三、巨头混战：战略卡位与差异化求生

四、真未来还是新泡沫？

推荐阅读

国产模拟芯片，崛起前夜

期货合约到期了该怎么办

特斯拉「下乡」背后：朱晓彤推进销售体系下沉

沪市公司 2024 年现金分红创新高，关注上证中盘 ETF 易方达（510130）、上证 50ETF 易方达（510100）等表现

【新华财经调查】「第四代住宅」扎堆入市两大难题还需化解

巨头混战 Agent，押注背后是真未来还是新泡沫？

一、Agent 何以成为巨头必争之地？

二、繁荣下的 AB 面：技术突破还是 「高级自动化」？

三、巨头混战：战略卡位与差异化求生

四、真未来还是新泡沫？

推荐阅读

国产模拟芯片，崛起前夜

期货合约到期了该怎么办

特斯拉 「下乡」 背后：朱晓彤推进销售体系下沉

沪市公司 2024 年现金分红创新高，关注上证中盘 ETF 易方达 （510130）、上证 50ETF 易方达 （510100） 等表现

【新华财经调查】「第四代住宅」 扎堆入市 两大难题还需化解

二、繁荣下的 AB 面：技术突破还是「高级自动化」？

特斯拉「下乡」背后：朱晓彤推进销售体系下沉

沪市公司 2024 年现金分红创新高，关注上证中盘 ETF 易方达（510130）、上证 50ETF 易方达（510100）等表现

【新华财经调查】「第四代住宅」扎堆入市两大难题还需化解