• 最新
  • 热门
  • 所有
  • 期货市场
  • 外汇动态
  • 股票行情
「数据决定大模型性能上限」!国家数据局呼吁全社会强化数据要素价值认同

「数据决定大模型性能上限」!国家数据局呼吁全社会强化数据要素价值认同

2025 年 8 月 31 日
英伟达:Rubin CPX 登场!要和博通 ASIC「掰掰手腕」

英伟达:Rubin CPX 登场!要和博通 ASIC「掰掰手腕」

2025 年 9 月 10 日
通信ETF(515880)午后反弹超3%,算力核心环节占比超77%,规模大幅攀升超115亿元

ETF 今日收评 | 多只黄金股相关 ETF 涨超 5%,半导体相关 ETF 跌幅居前

2025 年 9 月 10 日
半导体设备年会将至,新凯来将参加,科创半导体ETF(588170)获资金逆势加仓

江苏常州金店周五 (9 月 5 日) 黄金价格 1028 元/克

2025 年 9 月 10 日
第19届杭州亚运会纪念币全套多少钱(2025年9月4日)

上市公司从亏损到单鸡盈利 3-4 元 黄羽肉鸡行业迎来盈利修复

2025 年 9 月 10 日
申万宏源王胜:驱动市场向上的因素未发生任何质变

申万宏源王胜:驱动市场向上的因素未发生任何质变

2025 年 9 月 10 日
锇回收价格多少钱一克(2025年09月01日)

时隔 6 年,东兴证券公开招聘首席经济学家,研究所人员与佣金收入双降,能否借新鲜血液扭转困局?

2025 年 9 月 10 日
AI抢饭碗还是送外挂?好莱坞大咖们吵翻了!(深度观察)

AI 抢饭碗还是送外挂?好莱坞大咖们吵翻了!(深度观察)

2025 年 9 月 10 日
固态电池生产设备企业上半年订单激增

突袭多哈内幕曝光!以色列跨境追杀战术重大升级

2025 年 9 月 10 日
大厂外派员工,在重复中被消耗

大厂外派员工,在重复中被消耗

2025 年 9 月 10 日
OpenAI有意在AI基础设施建设上 扩大与三星电子和SK海力士的合作

OpenAI 有意在 AI 基础设施建设上 扩大与三星电子和 SK 海力士的合作

2025 年 9 月 10 日
老铺黄金,为什么总想跟黄金划清关系?

老铺黄金,为什么总想跟黄金划清关系?

2025 年 9 月 10 日
pt999铂金回收价格今日多少钱一克(2025年09月01日)

9 月 5 日扬州金店黄金 980 元/克 铂金 370 元/克

2025 年 9 月 10 日
禾湖财经
  • 登录
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
2025 年 9 月 10 日 星期三
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 行业新闻
  • 股票行情
  • 基金快讯
  • 期货市场
  • 禾湖观察
  • 期货研报
  • 国际金融
  • 外汇动态
  • 贵金属
没有结果
查看所有结果
禾湖财经
没有结果
查看所有结果
首页 24 小时

「数据决定大模型性能上限」!国家数据局呼吁全社会强化数据要素价值认同

1 周 之前
在 24 小时
阅读时间: 1 mins read
0 0
A A
「数据决定大模型性能上限」!国家数据局呼吁全社会强化数据要素价值认同

猜您喜欢

市场高低切凸显轮动特征,科技 + 金融或成本周观察重点

王毅谈中美外长会晤:加强接触、防止误判、管控分歧、拓展合作

2 月 之前
0
【钛晨报】国家发改委等四部门:推动数据中心绿色低碳发展;Meta发布LLAMA 3.1 405B开源人工智能模型;苹果可折叠iPhone可能会在2026年发布

【钛晨报】 国家发改委等四部门:推动数据中心绿色低碳发展;Meta 发布 LLAMA 3.1 405B 开源人工智能模型;苹果可折叠 iPhone 可能会在 2026 年发布

1 年 之前
0

财联社 8 月 29 日讯 (记者 付静)「当前各方都普遍认为,数据资源非常重要,现在大家都愿意为模型、算力买单,我们也希望各行各业在推动行业大模型的应用过程中,也加大对数据资源的投入。再次呼吁全社会强化数据要素的价值认同,加快价值共创,共同培育为优质数据买单的共识。」8 月 28 日开幕的 2025 数博会期间,国家数据局党组书记、局长刘烈宏呼吁。

近两年人工智能产业尤以算力方向受关注,但财联社记者在 2025 数博会现场注意到,人工智能数据亦受到热议。28 日下午,由国家数据局主办,中国信息通信研究院、中国移动通信集团承办的高质量数据集主题交流活动现场颇为火爆,不仅是 「一座难求」,开场前数十位从业者站在舞台一侧,期待国家数据局的最新发声。

从业者等待活动开始 财联社记者摄

全国高质量数据集累计交易额达 40 亿元

本周国务院印发 《关于深入实施 「人工智能+」 行动的意见》,持续加强人工智能高质量数据集的建设。国家数据局会同有关方面共同推动高质量数据集的建设和应用,亦已取得积极成效。

财联社记者最新从国家数据局方面了解到,今年上半年,全国各地已建设高质量数据集超过了 3.5 万个,总体量超过 400PB。截至目前,全国各地高质量数据集累计交易额已达 40 亿元,交易机构挂牌 3364 个高质量数据集,总规模达到 246PB。

国家数据局方面透露,为推进高质量数据集的建设,国家数据局布局建设成都、沈阳等七个数据标注基地,目前国内多数模型训练使用的中文数据占比达到了 60-80%,中文高质量数据的开发和供给能力显著增强。

同时,人工智能模型训练正推动数据交易需求上升。以北京数交所为例,高质量数据集占交易总量的比例从去年 10% 左右提升到目前的近 80%。上海、天津、安徽等地正在试点 「数据语料作价入股」 模式,引导企业将高质量数据集折算为股权投入新企业。

此外,国家数据局强调高质量数据集建设基础保障。通过建立健全数据基础制度,加快建设数据基础设施,推进公共数据开发利用,布局攻关数据领域核心技术,完善数字人才培养体系等一系列组合拳和体系化的布局,持续推进数据要素市场化改革和 「人工智能+」 行动同频共振,联合各部门创新工作模式,构建部门协同的工作制度,协同发力,联合施策,积极引导做好高质量数据集建设工作。

国家数据局称,下一步将加快打造重点领域,以及具身智能、低空经济、生物制造等领域数据高地。

财联社记者了解到,大模型能力边界几乎完全由数据的质量、规模和安全性来定义,数据是提升模型能力的关键和模型训练的基础,也是拓展智力上线和性能优化的支撑,高质量数据将有效降低模型幻觉。

「很多专家说当前的技术条件下,人工智能的发展体现出很强的数据驱动特色。数据决定了大模型的性能上限。」 刘烈宏表示。

多家企业布局高质量数据集

目前,多家企业的业务布局也顺应着这一趋势。

此次数博会,财联社记者注意到,在智算服务器领域表现突出的超聚变 2024 年起发力数据层面,目前已构建了统一的资产与数据安全管理体系。

超聚变 CIO、城企数智事业部总裁蓝文广表示,新一代 AI+数据技术改变了从业务到数智化的生产方式、业务设计与数智化实施方法框架并重构所有的业务及应用。据悉,在企业服务领域,超聚变推出的 xIBT 业务变革与数智化转型解决方案,依托 100+场景智能体,将企业业务流程深度融入智能体架构。

财联社记者从中国电科集团旗下的中国司法大数据研究院有限公司 (以下简称 「中国法研」) 方面了解到,研究院为我国公共数据资源授权运营的先行先试单位,在司法领域高质量数据集建设方面,组织法律专业知识专家、法律从业者和高校法律学生共同组成数据标注团队,构建了基于法律知识体系指引的数据标注系统,通过 「人机协同」 方式,开展了专业领域数据标注。

中国法研以积累的 「法律法规、司法解释、指导案例、公开文书」 等作为基础数据源,结合司法领域专业知识和应用场景需要,归纳和整理形成 「法律问答、法条推荐、案件认知」 等在内的 27 类司法语料库,共计 600 万对精调语料;同时,针对检索增强生成,基于法律实务 (文书) 和专家观点数据,构建了超 2 亿条法律行业知识。

公开信息显示,作为产业链 「链主」,目前三大运营商以数据专业公司为立脚点,致力于构建高质量数据集。其中中国移动已建成覆盖 32 个行业、超 3500TB 通用高质量数据集。

高质量数据集建设仍面临挑战

值得关注的是,中国信息通信研究院院长余晓晖在数博会期间发布了 《高质量数据集建设指引》。

财联社记者了解到,在上述 《指引》 发布背后,高质量数据集的建设仍面临诸多挑战。

余晓晖称,目前全国已建成超过 3.5 万个数据集,Token 消耗量呈高速增长态势,中央、地方和行业层面也在积极推动相关工作。然而,实践中仍面临诸多挑战,如数据供给、技术、治理体系和标准等问题亟待解决。

中国法研总经理专项助理李晓智在采访中告诉财联社记者,现实应用中,数据的合法性和数据保护问题客观上增加了数据集建设的难度,技术瓶颈仍然存在,当前的算法和工具仍无法有效解决数据标注的高成本和低效率问题,尤其是在人力资源有限的情况下,如何高效、准确地完成大规模数据集的标注和清洗仍是关键问题。

据悉,高质量的领域语料建设,是一项领域知识密集型工作,需投入大量的领域专业人员。李晓智介绍,虽然现在中国法研已经形成一套人机结合的语料构建、质量检测方法,但是人工劳动还是占语料构建 30%+以上的工作量。后续中国法研考虑基于法律大模型联盟形成 「数据伙伴」 团队以及中国法研 CNAS 测评团队,共同进行行业语料集建设和评价,希望国家相关部门能够予以顶层指导和政策支持。

吴世忠研究员亦在其演讲中提到了数据来源的合法性风险。

同时吴世忠表示,数据内容面临可靠性风险,现实中数据集经常面临低质噪声、失实性错误甚至价值观的偏差;数据供应链方面存在风险,「应高度关注篡改的隐患,数据集从采集、标注、实用多个环节,数据供应商,外包标注团队、云平台等等,任何漏洞都可能成为攻击的入口」;数据使用方面面临伦理风险,「严防滥用与失控潜在危险,即使数据集本身合法合规,如果缺乏对使用场景的约束,也可能引发问题及某些包含生物特征的数据,人脸照片,影音片断,生成类的大模型导致深度伪造方面的技术滥用,这方面的例子出现了很多。」

相关 文章

英伟达:Rubin CPX 登场!要和博通 ASIC「掰掰手腕」
行业新闻

英伟达:Rubin CPX 登场!要和博通 ASIC「掰掰手腕」

6 分 之前

文 | 海豚投研在最近博通带着 ASIC 高歌猛进的情况下,英伟达为首的 GPU  阵营明显是遇到了挑战。博通的股价在财报发布的当天上涨将近 ...

通信ETF(515880)午后反弹超3%,算力核心环节占比超77%,规模大幅攀升超115亿元
基金快讯

ETF 今日收评 | 多只黄金股相关 ETF 涨超 5%,半导体相关 ETF 跌幅居前

16 分 之前

每经记者|叶峰    每经编辑|彭水萍    

  • 热门
  • 评论
  • 最新
老凤祥回收黄金多少钱一克(2025年6月27日)

国海证券策略首席分析师胡国鹏:下半年 A 股牛途在望,配置核心在科技成长

2025 年 8 月 1 日
铑多少钱一克(2025年06月27日)

人工智能+行动重磅发布!资金借道软件 ETF(515230) 布局,连续两日吸金近 2 亿元

2025 年 8 月 1 日
郑州宝泉钱币周五(6月27日)银条价格8.79元/克

老凤祥黄金价格今天多少一克 (2025 年 07 月 30 日)

2025 年 8 月 1 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

英伟达:Rubin CPX 登场!要和博通 ASIC「掰掰手腕」

英伟达:Rubin CPX 登场!要和博通 ASIC「掰掰手腕」

2025 年 9 月 10 日
通信ETF(515880)午后反弹超3%,算力核心环节占比超77%,规模大幅攀升超115亿元

ETF 今日收评 | 多只黄金股相关 ETF 涨超 5%,半导体相关 ETF 跌幅居前

2025 年 9 月 10 日
半导体设备年会将至,新凯来将参加,科创半导体ETF(588170)获资金逆势加仓

江苏常州金店周五 (9 月 5 日) 黄金价格 1028 元/克

2025 年 9 月 10 日
  • 隐私政策
  • 联系我们
  • 关于禾湖
联系我们:+86 15388934451

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

没有结果
查看所有结果
  • Home
  • Tech

Copyright © 2025 长沙禾湖信息科技有限公司. 湘 ICP 备 2023006560 号-2

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录