(图片来源:林志佳拍摄)
4 月 29 日,2025 年第八届数字中国建设峰会在福建福州开幕,预计有超过 800 位企业家、30 位院士,以及成千上万名专家学者和社会各界人士参与此次会议。
AI 技术是本届数字中国建设峰会的重要关注方向之一。钛媒体 AGI 在现场注意到,华为、蚂蚁集团、阿里云、腾讯,以及“ 三大运营商” 中国联通、中国移动、中国电信等国内大厂都在现场体验区展示关于数据中心、智能机器人、智慧城市等 AI 相关业务及服务。
国家数据局局长刘烈宏在第八届数字中国建设峰会开幕式上表示,当前,加快推进数字中国建设,要紧紧抓住人工智能发展带来的前所未有的机遇,推动数据要素市场化配置改革和“ 人工智能+” 行动同频共振。持续推进高质量数据供给。加快推动数据要素与人工智能、科技创新、产业发展和赋能应用相结合,推动行业高质量数据集建设,推动数据产业高质量发展,为 AI 技术创新和产业应用提供坚实的数据基础,确保“ 人工智能+” 行动到哪里,高质量数据集的建设和推广就到哪里。
值得一提的是,峰会期间,蚂蚁集团发布多项 AI 及数据要素领域技术成果:首次披露蚂蚁医疗 AI 产业布局,蚂蚁数科企业级金融智能体开发平台 Agentar,蚂蚁密算、蚂蚁数科首发可信数据空间等。
作为国内首款实现“ 数据流转全链路密态化” 保障的可信数据空间产品,蚂蚁密算全新密态可信数据空间产品依托于自研密态计算技术体系,通过完整的技术信任体系保障“ 数据可用不可见”,保障各参与方权益;同时,在提供对标等保四级的安全保障前提下,全链路密态计算成本可以低于数据流通价值的 5%,能够有效支撑数据跨地域跨行业规模化的可信流转。
对此,蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬对钛媒体 AGI 表示,总体来讲,今天密态计算规模化的应用场景主要集中在金融、医疗、公共数据等领域,今后需不断向服务中小企业的方向演进,大规模深入应用和重建行业体系可能需要 3-5 年的预期,整个数据要素行业规模最终会超过 10 万亿元。
韦韬强调,未来大规模高价值的数据要素流转,一定是以密态的形式进行跨云、跨地域和跨行业的流转、融合和计算,密态计算将是数据要素可信流通的重要支撑技术。
2030 年全球规模超 2.2 万亿元,中国数据要素亟待加强
自 2022 年底以来,Openal 推出的 ChatGPT、Sora 等生成模型被认为是通向通用人工智能 (AGI) 的重要里程碑。当前,AI 处于新一轮技术、应用大爆炸的发展早期,快速跟进世界先进 AI 能力,对于国内各行各业未来的产业升级具有巨大的战略意义。
事实上,作为 AI 技术发展“ 数据、算法、算力” 三大要素之一,数据是推动先进大模型发展的关键因素,也是数字时代的新型核心生产要素。
据统计,2022 年,中国数据交易规模 870 亿元,占当年亚洲整体数据交易量的 60% 以上,处于领先水平,但与北美和欧盟相比尚有差距。2022 年,全球数据交易规模约 906 亿美元,预测至 2025 年有望增长到 1445 亿美元,到 2030 年有望达到 3011 亿美元 (约合人民币 2.2 万亿元)。
另一公开显示,2023 年,中国的数据产量约占全球数据总产量的 23%,位居世界第一,预计到 2025 年中国的数据总产量将达 48.6ZB,约占全球的 1/3。预计到 2025 年,中国数据交易市场规模可达到 1749 亿元,到 2030 年将达到 5155.9 亿元。
2022 年 12 月,“ 数据二十条” 对外发布,从数据产权、流通交易、收益分配、安全治理等方面构建数据基础制度,提出 20 条政策举措,这对数据要素的流通指明了一定方向,也标志着中国数据要素市场建设迈入新的发展阶段。
然而,随着数据交易市场规模不断增长,但数据要素的流通与应用仍然面临很大的威胁和挑战,数据安全隐私保护压力日益增大,数据质量良莠不齐,数据孤岛现象依然严重。这些问题的存在,不仅制约了数据要素价值的释放,也阻碍了数据经济的高质量发展。
正是基于这样的背景,全球多家企业和机构都在隐私计算、可信计算、密态计算等领域布局。其中,密态计算是通过综合利用密码学、可信硬件和系统安全的隐私保护计算技术,其计算过程实现数据可用不可见,计算结果能够保持密态化,实现计算全链路保障,防止数据泄露和滥用。
自 2016 年起,作为全球领先的科技开放平台,蚂蚁集团持续投入密态计算技术研发以及商业化应用,并在密态计算的软硬件上取得一系列创新和技术突破,包括提出下一代隐私保护计算技术—— 密态计算技术体系。
蚂蚁密算是蚂蚁集团在数字科技板块的创新布局,致力于通过密算技术构建数据可信流通体系。
2024 年 6 月,蚂蚁密算公司正式成立,由蚂蚁集团副总裁、首席技术安全官韦韬担任董事长和法定代表人,蚂蚁集团隐私计算部隐语总经理王磊出任 CEO,意味着密算从蚂蚁集团的“ 内部业务”,升级为蚂蚁集团全资控股子公司,进一步推动密态计算技术在金融、医疗等领域的规模化应用。
产业实践上,蚂蚁密算支持杭州建立全国首个密态计算中心,为江西省建立数据汇聚流通基础设施平台提供技术支持。同时,蚂蚁密算坚持开放开源,先后开源隐语可信隐私计算技术栈、星绽可信系统安全软件栈等核心技术。
王磊向钛媒体 AGI 坦言,对于客户来说,之前密算属于蚂蚁集团的内部业务时,落地的很多场景都是围绕蚂蚁自身业务展开,通过技术解决数据合作过程中的信任问题,如今独立成一个公司以后,蚂蚁变成了蚂蚁密算其中一个 BP 客户。
韦韬进一步补充称,这可能与以前有很大的变化。独立成公司之后,蚂蚁密算还拥有包括各地数据集团以及金控机构等客户,成功的业务模式能够在行业当中复制。很多时候,客户想要一个非常有保障的商业服务。“ 我们感觉到,密算成立以后,一些客户会更加愿意跟我们一起坚定地投入来做尝试。提供商业服务以后,有更多的行业、更多的伙伴能够更好地进来。”
如今,时隔 331 天,蚂蚁密算持续“ 蜕变”,发布全新“ 密态可信数据空间” 产品。通过密态计算技术,在业内首次完整实现多主体之间的跨域全链路管控,确保任何参与方均无法在授权范围外窃取或滥用数据,为数据提供方提供全链路的安全保障。此外,会上十余家单位联合发起的“ 可信数据流通应用产业链共建行动” 正式启动。
事实上,传统隐私保护技术的成本相比明文计算动辄千倍以上,通过密态计算技术实现中安全级数据保护的全程密态成本,已低于明文分布式计算的 2 倍,高安全级则低于 10 倍。通过技术优化和集中化部署基础设施,密态可信数据空间产品将显著降低计算与运维成本,在提供对标等保四级的安全保障前提下,全链路密态计算成本可低于数据流通价值的 5%,能够有效支撑数据跨地域跨行业规模化可信流转。
韦韬表示,数据流通的主要形式,正在从“ 内循环” 走向“ 外循环”。这意味着,基于主体信任的数据安全体系被彻底颠覆,安全风险成为数据供给与流通利用的首要顾虑。数据要素价值的释放,其核心在于流通与应用的效能,更确切地说,是取决于数据要素参与方之间 “ 联合加工” 的效能。
韦韬认为,由于信任缺失,数据价值释放面临“ 缺乏加工、缺乏融合、缺乏验证” 三大行业难题:一方面,大量数据仍处于“ 原矿” 状态,数据缺乏初级加工和治理;另一方面,“ 数据孤岛” 仍普遍存在,多源数据融合难,难以形成高价值数据产品。此外,基于业务场景的价值验证缺乏,海量数据价值不明确,难以进行快速应用。破解“ 三个缺乏” 的困境,构建跨主体、跨行业、跨区域的技术信任体系迫在眉睫,可信数据空间有望成为破题的重要突破口和实践路径。
在他看来,大量的行业和地区数据可能还处于原矿阶段,所以数据的加工能力是非常匮乏的,数据价值没有发挥出来,供给跟不上,风险是巨大的,此外数据要素还存在合规、数据融合、指标体系等问题。
韦韬指出,传统的隐私保护计算,成本是明文分布式计算的千倍以上,甚至万倍以上,它的数据膨胀可能也是万倍以上,这个成本是非常高的。而蚂蚁密算提供的密态计算提升点的基础是安全芯片,包括可信芯片、机密计算芯片,把成本大幅度降下来,蚂蚁密算能确保把整个成本降到明文分布式计算的两倍以内,而且不只是计算,还有存储、链路、协商等全链路保障,各种成本也会持续控制到行业最低。
谈到一体机业务话题,韦韬表示,一体机核心解决的是部署易用性问题。因为企业大规模部署云计算的投入成本非常高、迭代周期成本也非常高。蚂蚁密算一体机面向政府、企业等领域客户,部署非常方便,项目落地周期更快,安全性更高。
在韦韬看来,一体机只是过渡态,未来企业依然需要上云。当整个技术成熟以后需要与云计算整合,最后会变成云计算的一部分。“ 现在面临的问题是,企业上的不是一朵云,是很多云,跨云是下一个核心的问题,是我们非常努力去解决的问题,也是跟各家云厂商合作在解决的问题。”
谈到 AI 大模型数据话题,韦韬表示,现在大模型防护能力还是很脆弱的,而大模型的核心问题在于“ 幻觉” 或可靠性,内部验证整个大模型的幻觉依然在 20%—30% 之间,而且有时联网之后也没有得到明显改善,因为中国互联网上充满了太多的假消息,联网以后幻觉问题还上升了。因此,市场需要解决大模型 99% 的可靠性及格线,才能够做好 AI 应用。
三年投入超 600 亿元,蚂蚁助力具身智能安全
AI 和数据要素是蚂蚁集团两大科技战略。
据阿里巴巴财报推算,蚂蚁集团 2023 年净利润为 283.2 亿元。同期,蚂蚁集团持续加大科技投入。2023 年科技投入增长 3.6% 至 211.9 亿元。
据蚂蚁集团可持续报告披露的数据显示,2021 年-2023 年,蚂蚁集团科技投入分别为 188 亿元、204.6 亿元和 211.9 亿元,复合年均增长率超 6%。三年累计投入超过 600 亿元,达到 604.5 亿元人民币。
蚂蚁集团董事长井贤栋表示,发展是拥有未来的前提,而科技创新是发展最根本的驱动力,未来更是如此。目前,蚂蚁拥抱技术变革,前瞻布局 AI 和数据要素技术,提出 AI First、支付宝“ 双飞轮” 和加速全球化的三大战略。
近期,蚂蚁集团新成立了 AGI(通用人工智能) 部门,由 CTO 何征宇 (花名:梁纥) 直接负责,专注于 AGI 算法和应用。目前,蚂蚁集团已经在 AI 基础层、模型层、应用层都进行完整布局:
- 基础层:蚂蚁集团建设了超过万卡的异构集群,其中硬件算力效率 (HFU) 超过 60%,集群有效训练时长占比 90% 以上,RLHF 训练在同等模型效果下训练吞吐性能相较于业界方案提升 3.59 倍,推理性能相较于业界方案提升约 2 倍;
- 模型层:蚂蚁集团推出了两款不同规模的 MoE 大语言模型——168 亿参数规模的百灵轻量版 (Ling-Lite),以及高达 2900 亿 (激活参数 288 亿) 参数规模的百灵增强版 (Ling-Plus),两者性能均达到行业领先水平;
- 应用层:百灵大模型计划聚焦在生活服务、金融服务、医疗健康等场景,已公布三大 AI 管家—— 支小宝、蚂小财及 AI 医疗助理,以及百宝箱等 AI 智能体产品等。
其中,AI 医疗是今年蚂蚁集团的重点方向。今年 1 月,蚂蚁集团正式完成对好大夫在线的收购,并发布了面向医生科普和病历管理的“AI 助理”;3 月 21 日,蚂蚁集团宣布在医疗机构、医生、用户三端的 AI 体系升级,联合推出“ 蚂蚁医疗大模型一体机”,以及 AI 医疗全栈式解决方案;面向好大夫在线 29 万注册医生,发布 AI 医生助手系列工具,发起“ 百大 AI 名医” 计划,将为全国百大名医打造 AI 分身;同时,服务用户的健康应用“AI 健康管家” 也推出智能思考、健康自测等十余项新功能。
同时,蚂蚁集团还发力具身智能、AI 眼镜等,近期吸纳了具身智能公司边塞科技创始人吴翼,并成立了强化学习实验室,由其担任首席科学家。
此外,除了加码 AI 布局,蚂蚁还对外调整了投资布局,重点投向大模型及应用、AI 算力、具身智能等方向,包括智谱 AI、月之暗面,爱诗科技、生数科技,秘塔科技,AI 芯片企业清微智能、墨芯科技等,具身智能公司星尘智能、星海图等。
整体来说,蚂蚁集团持续投入 AI、具身智能、数据要素等领域,实现全球领先的科技开放平台。
谈到具身智能数据和安全性话题,韦韬对钛媒体 AGI 表示,蚂蚁集团为什么坚定地投入具身智能,核心在于 AI 一定要向世界模型方向发展,智能发展就是要跟世界的交互得到反馈,得到修正。
“ 我们认为,下面一定是有很多新的技术突破,今天只是 (具身智能) 行业的第一波兴起,我们看到当中的巨大突破潜力。” 韦韬指出,具身智能和机器人的安全问题十分严峻,因为这意味着整个网络空间跟物理空间彻底融合。
韦韬称,“ 以前撑死了把网线拔掉,这没什么大不了,但今天机器人真的可以去按核按钮了,真的可以放出病毒了,所以呼吁整个安全体系需要提前做好准备,它的安全保障、复杂度和风险度已经是一个彻底的质变。”
韦韬透露,下一步,今年世界人工智能大会 (WAIC) 期间,蚂蚁密算将会推出大模型相关信息可靠性技术产品,使得 AI 大模型可靠性达到 99%,实现专业领域可用,这也将对数据要素行业发展带来深远的改变。总体来说,蚂蚁密算将通过“ 密态可信数据空间” 等系列产品,解决数据和 AI 的安全、合规和可靠性问题,推动数据要素和大模型行业应用加速发展。
韦韬强调,未来 3-5 年,整个行业需要通过可信数据空间重建体系,真正把数据的价值挖掘融合应用起来,这将产生巨大的社会劳动投入需求,只有这样才能支撑整个数据要素行业发展。
(本文首发于钛媒体 App,作者|林志佳)
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App