刚刚！智谱开源 3550 亿参数 GLM-4.5 模型，多项性能或超越 Kimi K2 成全球第三

猜您喜欢

「国家一级憨憨」，也是我家憨憨

3 年之前

突遭制裁！美国政府将复旦微电等 23 个中国实体列入「黑名单」，清单总量已超千家

2 周之前

国内大模型赛道太「卷」了。

Kimi K2、MiniMax M2、阶跃星辰 Step-3 模型发布不到一个月，这次智谱又要发布最强新模型了。

7 月 28 日消息，刚刚，智谱在全球发布新一代旗舰模型 GLM-4.5 系列，这是专为 AI Agent 智能体应用打造的基础模型，采用混合专家（MoE）架构，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。综合平均分，GLM-4.5 取得了全球模型第三、国产模型第一，开源模型第一，多项评分超越 DeepSeek-R1-0528（55.9）和 Kimi K2（53.1）等多款模型。

此次 GLM-4.5 系列包括两款产品：总参数量 3550 亿、激活参数 320 亿的 GLM-4.5，以及 1060 亿参数的 GLM-4.5-Air。目前，GLM-4.5 和 GLM-4.5-Air 已经全面在 Hugging Face 与 ModelScope 魔搭平台同步开源，API 已上线智谱开放平台，满血版 GLM-4.5 已经可以在智谱清言、z.ai 官网免费体验。

智谱 CEO 张鹏早前对笔者表示，智谱依然坚持在做行业 Agent 产品和解决方案，以及向企业提供 MaaS 服务。同时，AGI 需模型能力的全面性，人类处理复杂任务时，会面对多模态与复杂交互情况，如同木桶不能有短板，对能力需求是全面性的。

「不可否认的是，当下 AGI 之路还刚刚开始，（当前）模型的能力还无法达到完全类比人的这样一个水平。」张鹏曾坦言。

智谱 GLM-4.5 评测数据信息

据悉，智谱成立于 2019 年，以「让机器像人一样思考」为愿景，研发了具有国产独立知识产权的 GLM 大模型预训练架构。自 2023 年 3 月智谱 AI 推出千亿开源基座对话模型 ChatGLM 系列以来，GLM 大模型经历四个大版本迭代，共发布了超过 20 款 AI 模型技术和产品。

商业化方面，截至 2023 年底，智谱已拥有超 2000 家生态合作伙伴、超 1000 个大模型规模化应用，另有 200 多家企业跟智谱 AI 进行了深度共创，智谱 GLM 系列大模型已在金融、医疗、教育等多个行业得到广泛应用；C 端层面，截至 2024 年底，智谱清言拥有超过 2500 万用户，开始上线付费功能，ARR（年度经常性收入）收入超千万元。

融资方面，今年 7 月，在冲击 IPO 上市关口，智谱宣布获得上海国资 10 亿元战略融资；在此之前，智谱获得杭州城投产业基金、上城资本、珠海华发集团、四川成都高新区等机构的融资。据统计，截至目前，智谱累计融资超百亿元，投后估值超过 200 亿元，投资方包括高瓴、启明创投、君联资本等知名投资机构，以及美团、阿里、腾讯、小米在内的互联网公司。

智谱曾表示，2025 年将是智谱的开源年，其将很快发布包括基座模型、推理模型、多模态模型、Agent 等在内的全新大模型，并将其开源。

如今，智谱终于实现开源最强模型这一目标，这得益于 GLM 模型的更高参数效率和强化训练流程等多种技术能力。

首先，据介绍，而 GLM-4.5 和 GLM-4.5-Air 使用了相似的训练流程，首先在 15 万亿 token 的通用数据上进行了预训练，此后在代码、推理、智能体等领域的 8 万亿 token 数据上进行针对性训练，最后通过强化学习进一步增强模型推理、代码与智能体能力。

其次，GLM-4.5 参数量仅为 DeepSeek-R1 的 50%、Kimi-K2 的三分之一，但在多项标准基准测试中表现得更为出色。而且，API 价格仅为 Claude 的 1/10，低至输入每百万 tokens 达 0.8 元，输出每百万 tokens 达 2 元。同时，高速版本实测生成速度超过 100 tokens/秒，支持低延迟、高并发的实际部署需求，兼顾成本效益与交互体验。

最后，评测层面，GLM-4.5 分为基准和真实场景表现。其中，在包括 MMLU Pro 等 12 个评测基准中，GLM-4.5 取得了优异成绩，全球模型第一是 OpenAI o3（65.0）、第二是 xAI Grok 4（63.6）、第三是 GLM-4.5（63.2），超越了 Kimi K2（53.1）、DeepSeek R1（55.9）；真实评测方面，采用 52 个编程开发任务当中，GLM-4.5 相对其他开源模型展现出竞争优势，虽然略逊于 Claude-4-Sonnet，但在工具调用可靠性和任务完成度方面表现突出，大部分场景中可实现平替效果，编写较为复杂的应用、游戏、交互网页等。

目前，GLM-4.5 已经对外开源。智谱称，公司后续会发布更加详细的技术报告。

事实上，除了智谱 GLM-4.5 之外，今晚阿里又发布了新的开源模型——电影级视频生成模型通义万相 Wan2.2，可将光影、色彩、镜头语言三大电影美学元素装进模型，随意组合 60 多个直观可控的参数，大幅提升电影级画面的制作效率；而上周，阿里 AI 三连发——Qwen 3 最新版基础模型（非思考版）、Qwen 3 推理模型和 AI 编程模型 Qwen3-Coder，它们分别在基础模型、推理模型和编程模型等主流领域获得全球开源冠军；阶跃星辰则在 WAIC 期间发布 Step 3 模型，是公司首个全尺寸、原生多模态推理模型，兼顾模型效果与推理成本，采用 MoE 架构，总参数量 3210 亿，激活参数量 380 亿。

据悉，OpenAI 也即将释放最强闭源模型 GPT-5，预计最快在 7 月底发布，有望支持 Sora 2 世界模型，从而实现多模理解一体化。

一位 AI 行业人士 7 月 28 日向笔者表示，随着中国大模型越来越开源，硅谷模型转向闭源，而国内模型的开源对于 AI 行业有更多的益处。这也意味着，全球基础大模型行业有望迎来新的「洗牌」。

（本文首发于钛媒体 App，作者｜林志佳，编辑｜盖虹达）