《科创板日报》9 月 30 日讯 (记者 李明明)又一家国内大模型宣布适配国产芯片!
今日,智谱发布及开源新一代大模型 GLM-4.6,并介绍其整体性能超越 DeepSeek 最新模型 DeepSeek-V3.2-Exp。这是继 DeepSeek-V3.2-Exp 与 Claude Sonnet 4.5 之后,国庆节前业界的又一技术发布。
值得一提的是,智谱官宣 GLM-4.6 在寒武纪国产芯片实现 FP8+Int4 混合量化部署,为首套投产的该模式芯片一体方案,其基于 vLLM 框架,还可在摩尔线程新一代 GPU 原生 FP8 精度稳定运行。
《科创板日报》 记者注意到,近期国产大模型与国产芯片的协同发展取得了一定突破,核心是 DeepSeek-V3.2 模型的发布与国产芯片的"Day 0 适配"(通常指在某个新系统、新平台、新设备或新功能正式发布的第一天 (Day 0) 就完成适配工作),以及智谱 GLM-4.6 模型与芯片的深度融合。
这标志着标志国产 GPU 具备与前沿大模型协同迭代能力,国产 AI 生态可能正从"可用"向"好用"演进。
GLM-4.6 适配寒武纪、摩尔线程
智谱方面有关人士介绍,在公开基准测试和真实编程任务中,GLM-4.6 的代码生成能力已全面对齐 Claude Sonnet 4,成为目前国内最强的 Coding 模型。同时,模型在长上下文处理、推理能力、信息检索、文本生成及智能体应用等方面均实现全面升级,整体性能超越 DeepSeek 最新模型 DeepSeek-V3.2-Exp。
作为开源模型,GLM-4.6 目前是全球开源生态中性能最强的通用大模型之一。
在适配性方面,GLM-4.6 已在寒武纪的国产芯片上实现 FP8+Int4 混合量化部署,这是首次在国产芯片投产的 FP8+Int4 模型芯片一体解决方案,在保持精度不变的前提下,大幅降低推理成本,为国产芯片在大模型本地化运行上开创了可行路径。
另外,基于 vLLM 推理框架部署,摩尔线程新一代 GPU 可基于原生 FP8 精度稳定运行 GLM-4.6,印证了 MUSA 架构和全功能 GPU 在生态兼容与快速支持方面的优势。
GLM-4.6 和寒武纪、摩尔线程国产芯片的组合,即将通过智谱 MaaS 平台正式面向大众和企业提供服务。未来,国产原创 GLM 大模型与国产芯片将联合推动在模型训练和推理环节的性能与效率优化。
近日,DeepSeek 和智谱先后宣布推出新一代大模型,并宣布适配国内芯片。
9 月 29 日,DeepSeek-V3.2-Exp 大模型发布,华为昇腾、寒武纪、海光信息等多家芯片厂商即宣布完成适配。
华为昇腾基于 vLLM/SGLang 等推理框架实现 0day 支持,并开源全部推理代码与算子实现;寒武纪宣布已完成对 DeepSeek-V3.2-Exp 的同步适配;海光信息表示,其 DCU 实现对该模型的无缝适配与深度调优,展现出优异性能,验证了高通用性、高生态兼容性及自主可控的技术优势。
截至 30 日收盘,寒武纪报收 1325 元,微涨 0.11%;海光信息报收 252.6 元,跌 1.27%。
北京计算机学会 AI 专委会秘书长、北大人工智能博士张有鱼告诉 《科创板日报》 记者,过去是模型去适配芯片,而现在,大模型的算法创新正在反向定义下一代芯片的架构。这种 『软件定义硬件』 的协同进化模式,是中国 AI 芯片实现 『换道超车』 的真正机遇所在;其次,竞争的终局将从拼算力走向拼价值。 「随着国产化方案大幅拉低 AI 的使用门槛,算力成本将逐渐不再是企业应用 AI 的核心瓶颈。竞争的主战场将彻底转移到如何利用 AI 创造独特业务价值上,这将真正引爆千行百业的创新浪潮。」。
1/7 价格享受 Claude Sonnet 智能
随着 GLM-4.6 的发布,智谱 AI 同步推出了一套 「GLM Coding Plan」 升级方案,其核心策略直指 「极致性价比」,旨在重塑开发者与企业的 AI 成本结构。
《科创板日报》 记者注意到,该方案的竞争力体现在以下几个层面:
首先在性价比方面,智谱打出 「1/7 价格享受到 Claude Sonnet 智能」 的口号。其 API 价格仅为 Claude Sonnet 4 的 1/21,套餐包模式将成本压缩至 1.99 元/百万 Tokens 的行业新低,降低了开发者的准入门槛。
其次,在与国产模型的对比中,尽管价格相近,但 GLM-4.6 在代码生成 (SWE-bench 准确率超 70%)、Agent 工具调用等关键能力上展现了领先优势,实现了 「低价且高性能」 的精准卡位。
此外,其企业版套餐在提供安全合规模块的同时,成本相较于 Claude 同级方案降低了 95% 以上,为企业规模化应用 AI 提供了选择。
对于本次 GLM-4.6 的这套组合拳,张有鱼表示,智谱的策略非常清晰,其 『1/7 价格享受相似智能』 的定位,本身就超越了单纯的价格维度。当前头部厂商的低价策略,其核心目标并非短期利润,而是长期的 『生态圈地』。
张有鱼认为,AI 大模型竞争的终局,取决于谁能构建最繁荣的开发者生态和积累最高质量的应用数据。较低的 API 价格,正是实现这一战略目标、抢占未来生态制高点的有效手段之一。