Title
您当前的位置: 首页 > > 文章详细
2025中国国际大数据产业博览会“高质量数据集”主题交流活动举行高质量数据集建设加速赋能人工智能发展
发布时间:2025-08-28

  “今年上半年,全国各地已建设高质量数据集超过3.5万个,总体量超过300PB,全国各地高质量数据集累计交易额接近40亿元。”8月28日,在贵阳召开的2025中国国际大数据产业博览会“高质量数据集”主题交流活动上,国家发展和改革委员会党组成员,国家数据局党组书记、局长刘烈宏表示,上半年,国家数据局全面推动高质量数据集的建设和应用,围绕高质量数据工作部署,制定印发相关政策文件,研究制定高质量数据集建设和分类指南、格式要求、质量评测等相关标准,组织开展高质量数据集建设典型案例征集、先行先试相关工作,联合有关部门、企业和各地数据管理部门协同推进,取得了积极的成效。刘烈宏表示,今年上半年,国家数据局推进高质量数据集建设,布局建设成都、沈阳等七个数据标注基地,以数据标注带动数据生产和应用。目前国内多数模型训练使用的中文数据占比达60—80%,中文高质量数据的开发和供给能力显著增强。高质量数据集价值得到释放,全国各地交易机构挂牌3364个高质量数据集,总规模达到246PB,人工智能模型训练推动数据交易需求上升,高质量数据集支持人工智能创新发展的作用正在凸显。刘烈宏表示,下一步国家数据局将与全社会一道发挥高质量数据集建设链主单位的作用,依托先行先试,加快为重点领域以及具身智能、低空经济、生物制造新领域提供数据支持。贵州作为数据高地,当前正重点大力发展以建设高质量数据集为重点的数据产业。贵州省人民政府党组成员、副省长罗强表示,近年来,贵州聚力推进国家数据要素综合试验区建设、打造高质量数据集新高地,目前已培育数据商超过200多家,在金融服务、工业制造、医疗健康、商贸流通等重点领域,发布了900余个高质量数据集。罗强表示,围绕建设高质量数据集为重点的数据产业,贵州将从三方面持续发力:一是坚持先行先试供好数据,聚焦数据“供得出流得动用得好保安全”四个关键环节,持续深化数据要素市场化配置改革。二突出数据标注,壮大数商,充分发挥贵州人力资源丰富、数据和场景开放的优势,加快建设省级数据标注的产业园。三是加强安全治理,守牢底线,将从制度、技术、管理三个方面发力,不断健全数据的定价、收益、分配、安全保障制度,落实好公共数据资源的开发利用,数据授权、营运、数据资源的登记,数权营运的价值机制等政策体系,全力提升数据安全防护能力,打响贵州数据“既开放,又安全”的响亮招牌。当前,全球人工智能正从感知智能向认知智能跃迁,大模型作为跃迁的核心载体,性能安全是其核心领域。吴世忠研究员表示,当前大模型数据集建设面临数据来源的合法性、数据内容的可靠性、数据供应链的安全性以及数据使用方面的伦理挑战等风险。他建议,未来在建设数据集的过程中,应完善分级分类的数据安全制度,以数据安全法等法律法规为基础,制定大模型训练数据的安全指南等标准,对数据集实施分级分类管理;推动建立国家大模型数据资源目录,为开发者提供合规、安全的数据资源;强化全流程技术防护手段,筑牢防篡改的底层技术能力;创新多方协同的治理模式,建立数据集备案和审查制度;培育安全向善的行业生态,在数据集建设中主动融入中华优秀传统文化、社会主义核心价值观,避免模型成为利己主义的工具。会上,高质量数据集建设先行先试工作正式启动,并公布了工作参与单位名单。同时,中国信息通信研究院院长余晓晖发布了《高质量数据集建设指引》;北京大学助理教授、银河通用创始人兼首席技术官、智源学者王鹤发布了《高质量合成数据集驱动的具身VLA大模型及开源数据》。据了解,本次活动由国家数据局主办,中国信息通信研究院、中国移动通信集团有限公司承办。来自相关政府部门、研究机构、高校院所和企事业单位的专家代表一同参加。(哈建伟)编辑:迟明绪  

上一篇:
陕西元朔动力有限公司
下一篇:
中国邮政速递物流西北(西安)航空电商物流中心
Title