2025 年 7 月 27 日 下午 7:50

国内首颗端边大模型存算一体 AI 芯片发布,后摩智能吴强:具身机器人发展处于早期


7 月 27 日消息,2025 世界人工智能大会暨人工智能全球治理高级别会议 (WAIC 2025) 正在举行。

本届 WAIC 以“ 智能时代 同球共济” 为主题,来自 30 余个国家和地区的 1200 余位嘉宾齐聚沪上,其中包括 12 位图灵奖、诺贝尔奖得主,80 多位中外院士,以及多个国际顶尖实验室代表;展厅方面,展览面积首次突破 7 万平方米,吸引 800 多家企业参展,集中发布 3000 余项前沿展品,包括 40 余款大模型、50 余款 AI 终端产品、60 余款智能机器人及 100 余款“ 全球首发” 或“ 中国首秀” 新品。

WAIC 大会期间,国内端边大模型 AI 芯片公司后摩智能发布了全新端边大模型 AI 芯片—— 后摩漫界 M50,同步推出力擎系列 M.2 卡、力谋系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。

这是国内首颗面向端边大模型的存算一体 AI 芯片。M50 芯片实现了 160TOPS(INT8)、100TFLOPS(bFP16) 的物理算力,搭配最大 48GB 内存与 153.6 GB/s 的超高带宽,典型功耗仅 10W,相当于手机快充的功率,就能让 PC、智能语音设备、机器人等智能移动终端高效运行 1.5B 到 70B(700 亿) 参数的本地大模型。和传统架构相比,M50 的能效提升 5-10 倍,真正实现“ 高算力、低功耗、即插即用”。

会后媒体交流时,后摩智能 CEO 吴强表示,目前公司研发的端边推理加速卡可以适配从 7B 到 70B 的 DeepSeek 模型,芯片上限大约在 100B(1000 亿) 参数规模,并且在与中国移动一起研发一体机产品。他认为,具身智能机器人更像是十年前的智能驾驶,这一赛道发展才刚刚开始,这是一个很大的新兴垂直赛道,格局还未定,大家依然有机会,一旦具身智能机器人发展起来,肯定比智能驾驶要大很多。“ 具身智能是我们的机会之一。”

据悉,后摩智能成立于 2020 年,致力于利用先进存储器件等技术做存算一体大算力智驾芯片,提供高能效比、低成本芯片及解决方案。公司创始人吴强毕业于美国普林斯顿大学,早前曾在 AMD、Facebook 公司任职,此前是地平线公司 CTO,团队硕博占比达 70% 以上。

实际上,所谓存算一体 (Computing in Memory) 指的是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法/加法运算。与以往的冯诺依曼架构相比,其打破了由于计算单元与存储单元过于独立而导致的“ 存储墙”,解决算力发展速度远超存储、存储带宽限制计算系统的速度等问题,成为后摩尔时代下新的技术发展路径。

公开数据显示,预计到 2030 年,中国存算一体芯片市场规模将超过 1100 亿元。

成立至今,后摩智能已完成四轮融资,投资方包括红杉资本中国基金、启明创投、经纬创投、联想创投、和玉资本、金浦投资等机构。最近一轮是在 2024 年 7 月,后摩智能宣布完成数亿元人民币的战略融资,由中国移动旗下北京中移数字新经济产业基金、上海中移数字转型产业基金共同对公司进行投资。

鸿途 H30 发布两年之后,后摩智能全面转型和聚焦端边大模型 AI 算力赛道,其研发的端边 AI 芯片,将广泛应用于 Pad、PC、智能语音设备、机器人等多种终端,以及一体机、计算盒子、工作站等智能边缘设备上,落地于消费终端、智能办公、智能工业等领域场景。

吴强坦言,这个转型过程非常痛苦,主要是认为存算一体和大模型有很多契合点。

“ 其实很多人问我为什么要转变,而从 2023 年下半年开始,我觉得智能驾驶这个赛道有可能走不通,当时整个自动驾驶赛道非常卷,格局逐渐稳定,给新入局的机会越来越少。为了体现存算一体的优势,所以一代芯片算力做得很大,但忽略了当时的市场需求,算力大就意味着成本高,而 2023 年行业都在讲价格、讲低成本,我们那个算力太超前、太冗余了,今天大家还会讲几百 T 和高阶,那个阶段不相信 L3,很多业内人士说 L3 永远不会到来,都在拼算力成本,当时芯片和市场需求有很大 Gap(差距)。所以,如果我们做一个新的芯片挤入智能驾驶,市场窗口就又错过了,当时新入局的机会越来越少,我在想要不要转变,当时非常痛苦。

研发非常痛苦,大家不愿意,而对我来讲也很痛苦,大家会质疑你为何没有坚持到底,但又明显知道自动驾驶芯片赛道走不通。最后,还是生存的压力大于面子,我们选择转型,我认为端边大模型有很大的新兴机会,并没有什么巨头在里面。2024 年初,我们快速把第一代芯片调整了一版推出 M30,后来中国移动对我们帮助很大,用 M30 运行 600 亿参数大模型,给了我们更多信心,认为存算一体和大模型有契合,最后转到这个方向并开始规划,用时不到两年的时间。” 吴强称。

谈到新的产品,吴强表示,力谋 LM5050 加速卡与力谋 LM5070 加速卡分别集成 2 颗、4 颗 M50 芯片,为单机及超大模型推理提供高密度算力,最高可达 640TOPS。此外,M50 芯片的存算一体技术从 SRAM-CIM,到 DRAM-PIM,一直在探索 DRAM-PIM 的产品化。

展望未来,吴强强调,后摩智能已启动下一代 DRAM-PIM 技术的 AI 芯片研发,通过将计算单元直接嵌入 DRAM 阵列,使计算与存储的协同更加紧密高效,而且能效较现有水平再提升三倍,推动百亿参数大模型在终端设备实现普及,让更强大的 AI 算力能够融入 PC、平板等日常设备。该芯片预计最快于 2026 年对外发布。

“M50 的发布只是一个开始,我们的目标是让大模型算力像电力一样随处可得、随取随用,真正走进每一条产线、每一台设备、每一个人的指尖。” 吴强称。

(本文首发于钛媒体 App,作者|林志佳,编辑|盖虹达)

更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App

- Advertisement -spot_img

推荐阅读