【TechWeb】8 月 19 日消息,百度文库联合百度网盘通用 Agent GenFlow2.0 全端正式上线,不仅在文库 web 端,在手机端上也可以随时随地使用。
今年 4 月百度 Create 2025 开发者大会上,百度文库、百度网盘就推出内容操作系统沧舟 OS,并基于该系统推出 GenFlow1.0 版本。
此次升级的 GenFlow2.0 在交互和能力上都更强了:
1、可指挥超 100 个专家 Agent 同时干活,几分钟内可并行完成 5~6 个复杂任务,速度是同类产品的 5-10 倍。
2、可一次性并行生成 PPT、研报、海报、图片、图表、HTML、代码教具、小游戏、网站等多模态内容;
3、全是现货,即时可用,不需要邀请码,更不需排队等待;
4、全端通用,用户使用入口包括:百度文库 Web 端、百度文库 APP。
百度集团副总裁,文库事业部、网盘事业部负责人王颖表示,一句话总结 GenFlow2.0 的特点就是,「能干活、干得快、还靠谱」。
这里,一起看看 GenFlow2.0 有哪些超能力,实际表现到底如何。
够快、够聪明,文库 GenFlow2.0 真能干活
AI Agent 能 「快速响应」 用户需求并 「成功执行出想要的结果」,这两点无疑是用户判断 Agent 是否好用的有效标准。
和市面上其他智能体多采用串行模式不同,GenFlow2.0 采用 「并行」 执行任务的方式,依托自研 Multi-Agent 基础架构,可以让 100+专家智能体同时干活,大幅缩短任务完成时长。
据官方介绍,GenFlow2.0 平均 3 分钟就可完成多项并行的复杂任务,而同类产品可能要数十分钟到数小时,比其他主流 Agent 快 5-10 倍。
对用户来说,GenFlow2.0 做到了够快。
百度文库研发负责人杨在申透露,做好并行执行任务的关键点之一是做好状态管理。GenFlow2.0 在做用户意图拆解时,会生成一个子任务序列,每个任务调度的策略是不同的,GenFlow2.0 会有一个消息通讯总控来同步协调每个任务的状态进度。
重要的是,GenFlow2.0 够聪明。
这种聪明不仅体现在能准确理解用户需求,更重要的是,GenFlow2.0 在执行用户需求时 「全程可干预」。
这意味着,GenFlow2.0 在做任务时,用户可以随时暂停、追问、补充要求、甚至修改思考内容、及时校准生成方向,用户还能随时调用授权后存在百度网盘内的个人素材、文件,中间文件也可以直接编辑。这让生成的结果能更个性化、更懂用户、更符合用户需求。
事实上,很多时候用户对自己 「想要什么」 在最初往往并没有非常准确明晰的想法,在实际执行任务过程中能随时补充、调整需求这一能力对用户而言需求非常高。
百度文库产品负责人钟昊向 TechWeb 强调,文库 GenFlow2.0 的这种成功响应 「追问、干预」 的能力和市面上一些本质是全部重新执行一遍的假干预 Agent 不同,是真的从干预断点重新恢复执行。
要做的这点,需要每一个 Agent 都是千锤百炼过的:Agent 本身要足够稳定,在上下文处理的过程中,再去做调度,才能保证从开始到最终的交付是一个高稳定的状态。另外,GenFlow2.0 在做 Agent 调度的时候,还需要做到模式转换之间的稳定,比如并行接串行、串行再接并行、生图接生视频等等模式转换。做好这两点背后有非常多算法层面的优化和迭代。
钟昊介绍,目前 GenFlow2.0 在执行 「用户随时打断干预后的需求」 的成功率高达 99%,让用户真的实际可用。
另外,GenFlow2.0 升级后拥有丰富的公域知识库,打通学术、地图等百度生态,可以直接调用百度学术超 6.8 亿篇文献库,旅游攻略或地址检索相关任务可调用百度地图工具。
同时,GenFlow2.0 还打通了百度网盘,在用户授权后,可以直接检索、调用用户在百度网盘中存储的指定资料。
最终,GenFlow 要实现在执行用户需求时,既保障了专业、全面性,也实现了更聪明、更懂用户的个性化。
看看文库 GenFlow2.0 的实际表现
介绍完 GenFlow2.0 的能力和背后的技术,现在,实际上手看看效果。我们做 2 个测试。
第一,在百度文库 APP 中使用 GenFlow2.0 来生成一个 PPT,看看处理过程和生成的 PPT 效果。
在 GenFlow 输入:我是一个初中物理老师,正在准备教授 「光成像」 章节,教材是人教版的,请帮我整理课程思路,做一个教学课件,并制作演示动画,可直观展示光透过凸透镜、凹透镜成像过程,适合课堂演示使用,最后再出一些习题。
GenFlow 执行:把需求拆分成了 6 任务
最终成功交付了 4 个光成像资源素材:
以下是完整执行视频,总共花费 3.45 分钟。
点击图片跳转视频
第二,在百度文库 APP 中使用 GenFlow2.0 来生成一个旅游计划攻略。这里,有 1 次暂停执行和需求追加,以及完成后再追加修改需求。
在 GenFlow2.0 输入:帮我做一个武汉 3 日亲子游攻略,孩子 10 岁,从北京出发,费用预算 5000 元。
GenFlow2.0 执行:把需求拆分成了 6 个子任务,第一步并行执行了 3 个任务。
在 GenFlow2.0 执行过程中,我们根据它的初步规划,第一次暂停并补充了需求:不去欢乐谷,去更多自然景观。
GenFlow2.0 重新规划任务并执行。
交付结果 (如下图)包括了:行程规划、预算分配、行程地图 (调用了百度地图服务)。
GenFlow2.0 交付结果后,我们发现它在费用预算一栏默认旅游人员是 2 大 1 小,这里,我们再次修正需求:是一个大人和一个小孩,重新规划一下费用。
这里,GenFlow2.0 并没有全面重来一遍,只是在原有结果中,对 4 个方面的预算进行了重新规划计算,并生成新的 2 套方案。如下图:
以下是完整执行视频,包括 2 次增加新需求,总共花费 5.4 分钟。
点击图片跳转视频
从上面这两项实际测试来看,GenFlow2.0 在完成任务的速度和质量方面都表现不错。
当然,百度文库、网盘团队也强调,GenFlow 仍然在以 「每周迭代」 的速度响应用户提出的改善需求。用户在使用过程中,有任何问题,多多反馈,让 GenFlow 越来越好用。