文 | 融中财经
MiniMax 用一纸近 3 亿美元的新融资,把 「AI 六小虎」 的排位赛推向高潮。
昨晚消息称,大模型公司 MiniMax 近 3 亿美元的新一轮融资已接近完成,投后估值超过 40 亿美元 (约 300 亿元人民币)。结合公开信息,目前国内达到这一估值的大模型公司有 MiniMax 和智谱。
这家由前商汤副总裁闫俊杰于 2021 年创立的大模型公司,正以惊人的速度完成从 「技术炫技」 到 「商业闭环」 的跨越:一边发布覆盖基座、视频、语音、Agent 的全栈产品,一边让爆款情感应用 Talkie 在海外狂揽千万下载,又借 「蓝色胖猫」 让海螺 AI 在卷到冒烟的视频生成赛道成功破圈。
然而,速度只是门票,真正决定终点的,是如何在 「更快、更好、更赚钱」 的三角难题中找到平衡。
当对话、生图、生视频的同质化军备竞赛让免费成为默认选项,DeepSeek 用 「展示思考过程」 撕开差异化缺口;当 Agent 被视为 2025 商业化的最大变量,MiniMax 推出 Hailuo Video Agent,试图用一句话生成专业级短片,回答市场上关于 「Agent 到底解决什么具体问题」 的灵魂拷问。
MiniMax 收获的新融资,也在推动 「AI 六小虎」 竞争的新叙事。
又一家 「AI 六小虎 「融了一笔
这一局,Minimax 领先了一步。
昨晚,据媒体报道,大模型公司 MiniMax 近 3 亿美元的新一轮融资已接近完成,投后估值超过 40 亿美元 (约 300 亿元人民币)。结合公开信息,目前国内达到这一估值的大模型公司有 MiniMax 和智谱。
今年,Minimax 不断传出好消息。先是产品发布。MiniMax 发布了一系列核心技术与产品,涵盖基座模型、视频生成模型、多模态智能体等多个方向,系统展现其 「模型—多模态—应用」 一体化技术路线。
作为底层基础能力的支撑,MiniMax 发布并开源了自主研发的 MiniMax-M1 系列模型;配套算法方面,MiniMax 推出了新的 CISPO 强化学习优化算法;在多模态生成领域,MiniMax 推出新一代视频大模型 Hailuo 02,主打高保真物理模拟与直接生成 1080P 画质视频能力;Hailuo Video Agent 则通过自然语言驱动全局、全流程工具集调用,实现 「零门槛专业级视频生成」;语音模型 Speech 02 也进行了功能更新,Voice Design 音色设计,用户可以通过自然语言来描述自己心中所想的音色,实现对多个维度的精准控制。
同时,企业也传来了 IPO 的消息,今年 6 月,彭博社报道称,MiniMax 正在筹备赴港上市。
Minimax 一直都是资本的宠儿。红杉中国、阿里巴巴、腾讯、IDG 资本、米哈游,MiniMax 汇集了产业和机构中最顶级的资本。在 2024 年获得 6 亿美元 A 轮融资后,估值也已经超过了 25 亿美元 (折合人民币约 179 亿元)。
2021 年,商汤科技前副总裁闫俊杰创立了 Minimax。很长一段时间,公司最出圈的除了创始人的明星履历,还有一款海外的 AI 情感 APP——Talkie。仅去年前 8 个月,Talkie 的全球下载量就快速突破千万次,超过 Character AI,成为美国市场下载量第 4 的人工智能应用。英国 《金融时报》 报道称,仅来自 Talkie 的用户付费和广告收入去年就为 MiniMax 创造了 7000 万美元的营收。
不过,从去年底开始,很多社交直播 APP 都被要求下架整改,这其中就包括 Talkie。
这让 MiniMax 体会到了过渡依赖单一产品的风险,于是,2024 年 9 月,MiniMax 发布了视频生成模型 「海螺视频 I2V-01」,并上线海螺 AI。
起初海螺 AI 没有被广泛认可,甚至被认为 「有点过时」,毕竟 AI 时代人人追新,而 AIGC 作为 GPT 之后第一个火起来的赛道,在海螺 AI 推出来的时候已经被认为是 「火过头」 了。何况前有快手可灵 AI 后有字节 Seeweed 和 PixelDance,海螺 AI 作为一个初创公司的产品当时并没有立即就被寄予厚望。
结果,一款海螺 AI 生成的蓝色胖猫 IP 爆火,也让海螺 AI 在 AIGC 中开始出圈。不少网友称,海螺 AI 为目前市面上最优秀的 AI 视频生成模型。更有网友直言,若不是注意到一些细微的瑕疵,他们几乎以为这些视频是真实拍摄的。
前不久,MiniMax 也正官宣了旗下的 Agent 产品。融中财经也第一时间体验了这个产品。
进入页面之后,会出现 「chat」 和 「Agent」 两个选项,我们先选择 「chat」,询问 「介绍一下 MiniMax,包括产品、融资和未来发展」,再把回答和元宝的输出做出对比的话,可以发现,两者的回答语言都非常流畅丝滑,没有事实性错误,或许是因为自家产品的原因,MiniMax 介绍得更全面一些。
再选择 Agent 模式,融中财经尝试提出一个要求 「分析蔚来汽车 2025 年第一季度的财务报表」,MiniMax 接下来执行了几个任务,包括搜索数据、同行对比、数据分析等。然后直接产出了一个报告。
这份财务分析比较了同比、环比数据,也就是说 Agent 拆解整体任务为收集数据和分析数据两个大方面,其收集了 2024 第一季度、2024 第四季度以及 2025 第一季度蔚来的数据,进行了对比。除了微观数据的分析,报告还结合当下的行业环境给了更宏观的分析和评价,作为一个初步的财务分析报告可以高效地帮助用户掌握情况。
要快,还要好
「天下武功,唯快不破」 这句话应该送给所有的 AI 创业者。
Talkie 的出圈就赢在了 「快」。
上线快,2022 年 10 月,ChatGPT 爆火的前一个月,Talkie 的前身,一款能直接对话的 AI 智能体产品 Glow,就已经上线了;出海快,当时出海这个路线并没有成为 AI 厂一个约定俗成的玩法,Talkie 就抢先一步海外上线了。
不过 「快」,这一招留给 AI 创业者的机会已经不多了,如今市面上同质化的 AI 搜索、AI 社交的产品层出不穷,这也让产品的差异化成了品牌的必修课。
「订阅制是一部分 AI 产品的商业化手段,想要用户付费,差异化就是必须的。」AI 产品经理默默 (化名) 对融中财经表示。
现在的 AI 产品同质化太高了,对话、视频与图片生成这两个最普遍的赛道,就可以看到各家的大模型争先上线类似对话、搜索类的功能,或者是对话衍生的功能,这就导致很多产品严重同质化。而同质化严重就会让用户觉得选项很多,一旦一个产品开始收费,用户大可以转向免费的产品继续使用。所以同行之间的价格战,甚至在没开始变现的时候就已经打响了。
就拿对话类大模型来说,文心一言、Kimi、IMA、抖音、心流 APP 等产品先后上线,一直到 Deepseek 的出现,才又再次出圈。
而 Deepseek 的出圈,实际就是在用户体验上一次 「差异化」 创新的成功。
Deepseek 展示了思考的过程,其实这并不见得是一个技术的飞跃,但却是用户体验的进步,用户看到了大模型思考的过程,有了更多交互的体验。所以在 Deepseek 之后很多 AI 产品也跟着展示了一部分思考的过程。
要够快,要够好,还要够赚钱,这就是冲刺 IPO 的 「AI 六小虎」 普遍面临的问题。
商业化的不确定性一直是 AI 企业冲刺 IPO 的一道坎,这个情况在今年明显变得更乐观。2025 年被视为 Agent AI 商业化的元年,AI Agent 的应用场景不断拓展,从办公类 Agent 到垂直类 Agent,再到更广泛的行业应用。未来式智能等企业已经在电力、金融、泛互联网、制造业等行业实现了 Agent 的常态化应用。例如,Glean 垂直于企业知识数据库的搜索,优化企业内部数据检索和问题答复,在近两年中 ARR 翻倍增长。DayDream 链接了超过 2000+品牌,支持自然语言检索,根据用户提供的时间、地点、场合等信息给予相关产品推荐。这些应用不仅提升了企业的运营效率,还为用户带来了更便捷、高效的体验,进一步推动了 Agent 技术的商业化落地。
争做 「超级 APP」
一代人会有一代人的 「超级 APP」。
回溯互联网的发展史,百度、阿里、腾讯这些以搜索、购物、社交等需求出发衍生出的超级 APP 几乎垄断了 AI 出现之前的互联网时代。
而在后 AI 时代,下一个超级 APP 可能会出现在通往 AGI 的路上。
前不久 Open AI 公布了 AGI 五级路线图,揭示了人工智能从"聊天工具"到"战略指挥官"的完整进化路径——第一阶段 AI 只是一个会 「说人话」 的对话工具,不需要刻意的编程语言可以交流;第二阶段 AI 变成一个颇有学识的 「博士」,更准确、更快速;第三阶段 AI 成了一个超级助手,不止可以 「chat」 还可以 「act」,从这里再往上 AI 就不仅仅是一个被操控的工具,更可以提出创意甚至管理一个跨国公司。
目前大部分市面的 AI 产品都处于第一、第二阶段,因此押注 AI Agent 就成了今年大模型厂商的主流叙事,Minimax 也不例外。MiniMax 在官网宣布,发布一款视频创作 Agent:Hailuo Video Agent,并开放 Beta 版本。根据提示输入文字或图片,Agent 将自动分析、构思并生成具有专业水准、富有观看价值的完整视频内容。
谈到出发点,MiniMax 认为这会让 「视频创意和生成更加普惠」。尽管视频生成技术在快速提升,但对于很多人来说,想要将创意转化为优质短片不是件简单的事。从创意构思、分镜脚本设计,到生成图片素材、生成视频并配音,再到精细化剪辑,这是一个对普通用户来说具有挑战的流程。此外,MiniMax 还推出了一个能跑长程 (Long Horizon) 复杂任务的通用 Agent,能多步规划出专家级解决方案、拆解任务需求、并能执行多个子任务从而交付最终结果。具体场景可以是写代码、生成 PPT 等。
从目前主流的 Agent 商业化路径来看,TOB 比 TOC 先行一步。尤其是一些垂类场景,比如营销、办公软件等场景中的 Agent 已经开始和 SaaS 结合进行了商业化的探索。
科技投资人孔波 (化名) 就评价道,现在不论是做 TOB 还是 TOC,通用还是垂直,从技术投入和难度上来说差别都不是很大,不过从商业化角度来看,TOC 真正难实现的有两点:软件之间的联通,以及用户体验的极致。
孔波举例道,比如我现在做一个 Agent,垂直赛道,就做出行助手。我现在决定从 A 点到 B 点,我把这个问题抛给 Agent,后者给我规划一个最短路线、最短时间的路径,包括交通工具、预算等等,这并不困难,现在对话式的大模型软件就可以做到,但是 Agent 真正要解决的就是从 Chat 到 Act 的突破,因此一个合格的 Agent 其实是能够在收到这个指令的时候就调用我手机里的工具类 APP 完成订票、提醒我行程、监督行程这么一个过程。那么这个过程中涉及到两个点,其一,不同软件之间调用的授权;其二,涉及到付款的时候整个 Agent 的行为先后、策略合理性的一个考验。
相对来说,TOB 的 Agent 也会有类似的问题,比如如何深入到企业的 workflow 中,在整个任务的思考、完成过程中,Agent 不只要扮演一个角色,可能分担多个角色,这几个角色之间的权责划分、合作协同就是一个挑战。
「我相信下一个 Super APP 会出现在 Agent 赛道,目前市面上左右工具属性非常强的软件在 Agent 时代都可能被整合。从 chat 到 Agent 的演变也能看出,AI 已经从卷数据、卷研究人员、卷研发费用这些 「硬件」 逐渐升级成了硬件实力够硬的同时还要卷定位、卷市场、卷用户体验这些 「软实力」。而在这个赛道上,也许就会诞生下一个 「超级 APP」。