• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
持续攻坚大模型安全技术,蚂蚁集团、清华大学联合发布「蚁天鉴2.0」

持续攻坚大模型安全技术,蚂蚁集团、清华大学联合发布 「蚁天鉴 2.0」

2024 年 7 月 5 日
新消费日报 | 安普瑞斯销售未认证电芯被罚没374万元;国内多家品牌足金首饰价格上破1050元

滞胀 「梦魇」 挥之不去,美联储降息在即,华尔街却 「吵翻」 了

2025 年 9 月 10 日
对话索尼互娱江口达雄:后「黑悟空」时代,索尼在华商业叙事的转折|独家

对话索尼互娱江口达雄:后 「黑悟空」 时代,索尼在华商业叙事的转折|独家

2025 年 9 月 10 日
9月3日沪铝期货仓单较上日增持903吨

机器人板块全天震荡回调,机器人 ETF 易方达 (159530) 逆势获近 2 亿份净申购

2025 年 9 月 10 日
券商调研与评级同步发力 偏好红利、科技 白酒股难入法眼

券商调研与评级同步发力 偏好红利、科技 白酒股难入法眼

2025 年 9 月 10 日
通信ETF(515880)盘中翻红大涨超4%,「光模块ETF」哪里找?布局光模块占比50% 通信ETF

宁德时代设定枧下窝复产目标!能否如期复产,尚未有定论

2025 年 9 月 10 日
大股东所持29% 股权流拍 二股东宣布减持 *ST万方二拍压力与退市风险叠加

莱音珠宝铂金多少钱一克 (2025 年 09 月 05 日) 参考价格

2025 年 9 月 10 日
聚丙烯期货收盘上涨0.01% 主力处于净空头状态

原创 淘宝重启 「口碑网」,本地生活白热化,A 股谁受益?| 0909 张博划重点

2025 年 9 月 10 日
iPhone 17发布在即,华尔街预计新机难逃提价命运

小小椪柑卖全球,泸溪一县拿下 20 国市场,一年创收超 4 亿

2025 年 9 月 10 日
江苏通报1例霍乱病例

江苏通报 1 例霍乱病例

2025 年 9 月 10 日
供需基本面有一定压力 螺纹钢短期或窄幅调整运行

「抛售美国」 仍在继续!澳大利亚主权财富基金减持美国资产

2025 年 9 月 10 日
9月1日金市早评:现货黄金现上下拉锯 市场继续押注美联储9月降息

A 股成交额连续 20 个交易日超 2 万亿元,关注 A500ETF 易方达 (159361)、沪深 300ETF 易方达 (510310) 等表现

2025 年 9 月 10 日
消费力狂飙的东南亚,正成为商家「出海」的首站

消费力狂飙的东南亚,正成为商家 「出海」 的首站

2025 年 9 月 10 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 10 日 星期三
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 行业新闻

持续攻坚大模型安全技术,蚂蚁集团、清华大学联合发布 「蚁天鉴 2.0」

1 年 之前
在 行业新闻
阅读时间: 1 mins read
0 0
A A
持续攻坚大模型安全技术,蚂蚁集团、清华大学联合发布「蚁天鉴2.0」


7 月 5 日,在 2024 世界人工智能大会 「迈向 AGI:大模型焕新与产业赋能论坛」 上,蚂蚁集团联合清华大学发布大模型安全一体化解决方案 「蚁天鉴」2.0 版。蚁天鉴 2.0 新增 AI 鉴真功能,支持图像、视频等多模态内容真实性及深度伪造检测;并在测评功能上持续升级,打造了大模型安全测评 「智能体」,并新增大模型 X 光、大模型基础设施测评两大测评功能。至此,蚁天鉴 2.0 形成了包括大模型基础设施测评、大模型 X 光测评、应用安全测评、AIGC 滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。

猜您喜欢

卷到越南的中国工厂

卷到越南的中国工厂

12 月 之前
0
钌多少钱一克(2025年06月27日)

当三个物理天才就读同一所大学,引发了一段传奇和 「蠢事」

2 月 之前
0

(图:蚂蚁集团联合清华大学发布 「蚁天鉴 2.0」)

蚂蚁集团副总裁、大安全技术部总裁李俊奎现场发布了这一升级产品,并介绍道,大模型和 Agent 智能体正带给我们前所未见的智能体验,同时也带来了模型内部幻觉、安全漏洞和深度生成内容滥用等新的挑战。蚁天鉴旨在打造 AI 大模型的安全铠甲,确保大模型技术在安全可靠的环境中发挥效能。

记者从现场了解到,蚁天鉴 2.0 有两大特色,一是在测评端研发了业内首个 「测评智能体」。该测评智能体提供全流程自动化的安全测评工具,支持各种形式模型和深度学习框架,可扩展测评垂类大模型、多模态大模型及 Agent 智能体,并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例,保障测评效果和效率。目前,蚁天鉴 2.0 有超 300 万高质量测评题库,支持最高 50 万/日的饱和式攻击和逐级诱导深度攻击,并实现了 1 工作日内完成测评,全流程自动化率>99%。

与此同时,该智能体也增加了两项新功能。一是 「大模型 X-ray」。即大模型 X 光,可针对大模型的内在神经元进行 X 光扫描来做探查和判断,让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,从而在模型内部治理幻觉,实现从源头识别和抑制风险。二是 「大模型基础设施测评」。此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴 2.0 从攻击者全链路视角出发,深入扫描模型算法组件及软件系统,可及时准确发现大模型供应链及运行环境安全问题,保障云到端的应用安全可控。

同时,蚁天鉴 2.0 防御端新增 「AI 鉴真」 功能。支持多模态内容真实性及深度伪造检测,可快速精准鉴别图像、视频、音频、文本内容的真伪,图像识别准确率 99.9% 达到行业最高优秀级 (信通院测评)。目前,蚁天鉴 2.0 依托生成模型自建百万量级音视图多模态合成数据集,覆盖主流生成方案,有效应对 AI 换脸、声音模拟、证件伪造等各类深度伪造风险场景。 

(图:蚁天鉴 2.0 大模型安全一体化解决方案全景图)

据了解,蚂蚁集团是国内较早布局大模型安全的厂商。蚁天鉴去年 7 月首次对外发布,1.0 版本即被评为 2023 年世界人工智能大会 「镇馆之宝」。历时 1 年升级到 2.0 版,蚁天鉴 2.0 构建了双重防御护栏,内置防护关注训练阶段的数据清洗和风险抑制;外置护栏融合智能风控技术,精准拦截输入和输出的风险内容,保障其应用安全。

目前,蚁天鉴的检测与防御产品已开放给 20 家外部机构和企业使用,为通用大模型及医疗、金融、政务等垂直领域行业大模型应用安全保驾护航。例如,上海市第一人民医院引用了蚁天鉴,有效应对医疗领域大模型应用中的信息安全与隐私保护、双向内容风险防控等挑战;蚂蚁 AI 金融助理 「支小宝」 结合蚁天鉴,通过大模型训练与推理风险管控、大模型风险点全方位评测、大模型用户交互风险管控等举措保障大模型应用安全,确保数据的准确性和金融逻辑的严格性。2024 年,蚁天鉴商业化迈出重要一步,通过蚂蚁数科开始服务广泛的外部客户。

论坛现场还发布了由清华大学、中关村实验室、中国信通院、蚂蚁集团联合编制的 《大模型安全实践白皮书 (2024)》。这也是国内首份 「大模型安全实践」 研究报告,为行业打造高价值参考体系。

(图:大模型安全实践白皮书现场发布)

白皮书基于当前大模型发展趋势与挑战,提出了大模型安全实践总体框架。即确立了 「以人为本,AI 向善」 为大模型安全建设的核心,确保技术进步服务于人类福祉;以 「安全、可靠、可控」 三个核心维度的大模型安全技术体系,涵盖大模型安全测评与防御的综合技术方案;以及 「端、边、云」 为大模型安全技术的主要承载实体。作为企业撰写方,蚂蚁集团安全生态副总裁邵晓东进行了现场发布并表示,白皮书还阐述了大模型在金融、医疗、政务等领域安全应用的案例,以及 「五维一体」 协同共治的治理框架,希望行业共同推动大模型安全生态发展。

本场论坛汇聚了国内外研究机构和顶尖学者以及产业人士等,从前沿技术、产业应用等不同视角分享了大模型安全的研究,探讨端云协同、端侧应用等最新趋势以及大模型安全最新体系与实践。这些深入的讨论,也将为大模型如何安全可靠地助力产业转型升级、推进数字经济发展提供更加明确的前进方向。(七喜)



相关 文章

新消费日报 | 安普瑞斯销售未认证电芯被罚没374万元;国内多家品牌足金首饰价格上破1050元
禾湖观察

滞胀 「梦魇」 挥之不去,美联储降息在即,华尔街却 「吵翻」 了

8 分 之前

【文章来源:金十数据】AI 播客:换个方式听新闻 下载 mp3 音频由扣子空间生成 在暂停降息九个月后,美联储几乎确定将在即将召开的会议上降息 25 个基点。但这一待...

对话索尼互娱江口达雄:后「黑悟空」时代,索尼在华商业叙事的转折|独家
行业新闻

对话索尼互娱江口达雄:后 「黑悟空」 时代,索尼在华商业叙事的转折|独家

9 分 之前

索尼互动娱乐 (上海) 有限公司董事长兼总裁江口达雄,图片由其本人提供“phenomenal(现象级)!phenomenal!” 当 《黑神话:...

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

新消费日报 | 安普瑞斯销售未认证电芯被罚没374万元;国内多家品牌足金首饰价格上破1050元

滞胀 「梦魇」 挥之不去,美联储降息在即,华尔街却 「吵翻」 了

2025 年 9 月 10 日
对话索尼互娱江口达雄:后「黑悟空」时代,索尼在华商业叙事的转折|独家

对话索尼互娱江口达雄:后 「黑悟空」 时代,索尼在华商业叙事的转折|独家

2025 年 9 月 10 日
9月3日沪铝期货仓单较上日增持903吨

机器人板块全天震荡回调,机器人 ETF 易方达 (159530) 逆势获近 2 亿份净申购

2025 年 9 月 10 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录