2025 年 7 月 29 日 上午 8:44

刚刚!智谱开源 3550 亿参数 GLM-4.5 模型,多项性能或超越 Kimi K2 成全球第三


国内大模型赛道太 「卷」 了。

Kimi K2、MiniMax M2、阶跃星辰 Step-3 模型发布不到一个月,这次智谱又要发布最强新模型了。

7 月 28 日消息,刚刚,智谱在全球发布新一代旗舰模型 GLM-4.5 系列,这是专为 AI Agent 智能体应用打造的基础模型,采用混合专家 (MoE) 架构,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。综合平均分,GLM-4.5 取得了全球模型、国产模型,开源模型第一,多项评分超越 DeepSeek-R1-0528(55.9) 和 Kimi K2(53.1) 等多款模型。

此次 GLM-4.5 系列包括两款产品:总参数量 3550 亿、激活参数 320 亿的 GLM-4.5,以及 1060 亿参数的 GLM-4.5-Air。目前,GLM-4.5 和 GLM-4.5-Air 已经全面在 Hugging Face 与 ModelScope 魔搭平台同步开源,API 已上线智谱开放平台,满血版 GLM-4.5 已经可以在智谱清言、z.ai 官网免费体验。

智谱 CEO 张鹏早前对笔者表示,智谱依然坚持在做行业 Agent 产品和解决方案,以及向企业提供 MaaS 服务。同时,AGI 需模型能力的全面性,人类处理复杂任务时,会面对多模态与复杂交互情况,如同木桶不能有短板,对能力需求是全面性的。

「不可否认的是,当下 AGI 之路还刚刚开始,(当前) 模型的能力还无法达到完全类比人的这样一个水平。」 张鹏曾坦言。
智谱GLM-4.5评测数据信息

智谱 GLM-4.5 评测数据信息

据悉,智谱成立于 2019 年,以 「让机器像人一样思考」 为愿景,研发了具有国产独立知识产权的 GLM 大模型预训练架构。自 2023 年 3 月智谱 AI 推出千亿开源基座对话模型 ChatGLM 系列以来,GLM 大模型经历四个大版本迭代,共发布了超过 20 款 AI 模型技术和产品。

商业化方面,截至 2023 年底,智谱已拥有超 2000 家生态合作伙伴、超 1000 个大模型规模化应用,另有 200 多家企业跟智谱 AI 进行了深度共创,智谱 GLM 系列大模型已在金融、医疗、教育等多个行业得到广泛应用;C 端层面,截至 2024 年底,智谱清言拥有超过 2500 万用户,开始上线付费功能,ARR(年度经常性收入) 收入超千万元。

融资方面,今年 7 月,在冲击 IPO 上市关口,智谱宣布获得上海国资 10 亿元战略融资;在此之前,智谱获得杭州城投产业基金、上城资本、珠海华发集团、四川成都高新区等机构的融资。据统计,截至目前,智谱累计融资超百亿元,投后估值超过 200 亿元,投资方包括高瓴、启明创投、君联资本等知名投资机构,以及美团、阿里、腾讯、小米在内的互联网公司。

智谱曾表示,2025 年将是智谱的开源年,其将很快发布包括基座模型、推理模型、多模态模型、Agent 等在内的全新大模型,并将其开源。

如今,智谱终于实现开源最强模型这一目标,这得益于 GLM 模型的更高参数效率和强化训练流程等多种技术能力。

首先,据介绍,而 GLM-4.5 和 GLM-4.5-Air 使用了相似的训练流程,首先在 15 万亿 token 的通用数据上进行了预训练,此后在代码、推理、智能体等领域的 8 万亿 token 数据上进行针对性训练,最后通过强化学习进一步增强模型推理、代码与智能体能力。

其次,GLM-4.5 参数量仅为 DeepSeek-R1 的 50%、Kimi-K2 的三分之一,但在多项标准基准测试中表现得更为出色。而且,API 价格仅为 Claude 的 1/10,低至输入每百万 tokens 达 0.8 元,输出每百万 tokens 达 2 元。同时,高速版本实测生成速度超过 100 tokens/秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。

最后,评测层面,GLM-4.5 分为基准和真实场景表现。其中,在包括 MMLU Pro 等 12 个评测基准中GLM-4.5 取得了优异成绩,全球模型第一是 OpenAI o3(65.0)、第二是 xAI Grok 4(63.6)、第三是 GLM-4.5(63.2),超越了 Kimi K2(53.1)、DeepSeek R1(55.9);真实评测方面,采用 52 个编程开发任务当中,GLM-4.5 相对其他开源模型展现出竞争优势,虽然略逊于 Claude-4-Sonnet,但在工具调用可靠性和任务完成度方面表现突出,大部分场景中可实现平替效果,编写较为复杂的应用、游戏、交互网页等。

目前,GLM-4.5 已经对外开源。智谱称,公司后续会发布更加详细的技术报告。

事实上,除了智谱 GLM-4.5 之外,今晚阿里又发布了新的开源模型——电影级视频生成模型通义万相 Wan2.2,可将光影、色彩、镜头语言三大电影美学元素装进模型,随意组合 60 多个直观可控的参数,大幅提升电影级画面的制作效率;而上周,阿里 AI 三连发——Qwen 3 最新版基础模型 (非思考版)、Qwen 3 推理模型和 AI 编程模型 Qwen3-Coder,它们分别在基础模型、推理模型和编程模型等主流领域获得全球开源冠军;阶跃星辰则在 WAIC 期间发布 Step 3 模型,是公司首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,采用 MoE 架构,总参数量 3210 亿,激活参数量 380 亿。

据悉,OpenAI 也即将释放最强闭源模型 GPT-5,预计最快在 7 月底发布,有望支持 Sora 2 世界模型,从而实现多模理解一体化。

一位 AI 行业人士 7 月 28 日向笔者表示,随着中国大模型越来越开源,硅谷模型转向闭源,而国内模型的开源对于 AI 行业有更多的益处。这也意味着,全球基础大模型行业有望迎来新的 「洗牌」。

(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)

- Advertisement -spot_img

推荐阅读