加快构建行业高质量数据集 国家数据局发布六大行动

2026/06/09 责任编辑:Hanson 访问:1039

日前,国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》(以下简称《实施方案》)的通知,围绕行业高质量数据集供给、流通、应用等关键环节,部署强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六个专项行动,形成“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮”,加快构建数据要素与人工智能协同演进的共生生态。

《实施方案》提出,到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设工具和标准。数据从供给到价值释放的良性循环基本形成,数据赋能人工智能创新发展的作用更加凸显,数据产业与人工智能深度融合,持续催生智能经济新增长点。

一是实施强基扩容行动。顺应人工智能加速向行业渗透,从对话向多模态生成、决策执行、具身智能、物理交互等范式跃迁的趋势,拓宽数据供给渠道,丰富数据供给类型,加快建设行业高质量数据集,为人工智能发展和应用提供充足“燃料”。要聚焦行业领域推进高质量数据集建设,夯实行业高质量数据集建设基础路径,面向人工智能应用需求丰富行业高质量数据集建设形态,强化与数据基础设施建设有机联动。

二是实施标注攻坚行动。数据标注是将知识和经验注入到训练数据的过程,是行业高质量数据集建设不可或缺的关键环节。引导数据标注从“以人为主”向“人机协同、专家深度参与”的多层次标注模式转变,推动数据标注向专业化、智能化跃升。要推动数据标注转型升级,持续推动数据标注先行先试,扩大数据标注人才供给。

三是实施提质增效行动。推动构建符合结构完整性、内容多样性、标注准确性、模型适配性等质量标准、满足人工智能就绪(AI-Ready)的高质量数据集,降低训练推理成本,有效提升模型性能。要提升行业高质量数据集建设质效,推动高质量数据集标准体系建设和应用落地,强化高质量数据集质量测评和结果互认。

四是实施应用赋能行动。坚持行业高质量数据集建设与实际应用深度融合,以模引数、用数赋模,促进高质量数据集建设与“数据要素×”“人工智能+”同频共振,全面赋能产业数智化转型。打造“数据飞轮”应用闭环,打造行业应用标杆和典型案例,繁荣数据集协同发展生态。

五是实施管理服务行动。加强数据集管理,完善数据伦理和治理机制,推动落实数据权益相关制度,推进数据集建设体系更加规范有序。构建数据集全生命周期的管理体系,探索面向人工智能发展的数据相关制度,坚持伦理先行与公平普惠。

六是实施价值释放行动。发挥数据集的应用价值,以行业高质量数据集赋能人工智能发展。释放数据要素价值,推动数据集商业化、资产化,培育为数据付费的市场共识,探索以词元(Token)为基础的价值体系。发挥行业高质量数据集的应用价值,创新行业高质量数据集商业模式,探索行业高质量数据集资产化创新路径,培育为高质量数据付费的市场共识。

本文来源:人民邮电报

扩展阅读

  • 扫码关注微信公众号