中国信通院发布“可信AI”人工智能数据集质量评估体系2.0,助力“人工智能+”高质量数据集建设
中国信通院CAICT
为响应国家深入实施“人工智能+”总体战略及行业发展新需求,中国信息通信研究院(简称“中国信通院”)现正式升级发布“可信AI”人工智能数据集质量评估体系2.0,打造“2+2+1+N”的数据集质量评估能力体系,面向通识基础数据集、行业通识数据集和行业专识数据集提供人工智能数据集质量评估标准服务,推动形成“高质量数据集供给—高效模型训练—可靠场景应用”的闭环生态。
中国信通院“可信AI”人工智能数据集质量评估体系2.0
——2项质量评估标准:人工智能数据集质量评估国家标准+行业标准
按照人工智能高质量数据集建设指南和质量要求,中国信通院人工智能研究所联合业界单位和行业专家核心支撑编制国家标准《高质量数据集 质量评测规范》,并牵头编制人工智能行业标准《面向人工智能的数据集质量通用评估方法 总体要求》(YD/T 6486-2025,已正式发布),旨在为人工智能数据集质量评估提供标准依据和规范。
——2套数据集质量指标体系:通用基础质量体系+行业专属质量体系
通用基础质量体系:人工智能数据集通用基础质量指标体系主要由说明文档(7大类)、前置数据质量(9大类)、模型应用(4大类)三大核心维度指标组成。行业专属质量体系:针对不同行业场景建立行业专属高数据集质量指标体系,细化和开发行业专属质量评估规则,精准赋能行业垂类模型开发和应用,包括行业场景分类、质量指标设计、质量评估、问题分析与优化四大方面。
——1个质量评估工具平台:数据集质量评估算法扩展+数据集质量与模型性能反馈验证
采用分层随机抽样+自动化评估+人工辅助校核的评估方式,累计扩展开发100余个质量评估量化算子,自动化评估率可达到80%以上,实现前置数据质量评估指标的有效工程化落地。此外,基于中国信通院“方升”大模型基准测试体系,初步搭建数据质量与模型性能反馈验证方法,实现基于不同模型性能指标组合的数据集质量反馈方法落地。
中国信通院人工智能数据集质量评估平台2.0版本
——N项服务方案:针对不同类型数据集提供定制化质量评估服务
人工智能数据集质量评估体系2.0通过全量指标迭代、专属指标筛选、侧重权重设计、算子规则匹配以及安全方案对齐实现不同行业、不同类型数据集定制化测试服务方案,覆盖文本、图像、音频、视频、多模态、结构化数据、传感器数据、时间序列等多种数据模态,应用于预训练、监督微调、强化对齐、智能体训练、模型评测等多个训练阶段。
评估实践方面,中国信通院自2024年12月正式发布“可信AI”人工智能数据集质量评估体系1.0后,目前已完成招商局集团、中国建筑、中国物流、中国中车、中国东方航空、中国航天科技集团、中国电信、国家呼吸医学中心等10余家重点行业央企与国家级实验室案例,涵盖文本、图片、多模态等模态,涉及交通、物流、建筑、制造、航空、航天等行业领域。经过测试发现目前高质量数据集面临内容稠密性、领域相关性、领域准确性、样本唯一性、内容准确性等核心问题,具体结果与趋势如下。
“可信AI”人工智能数据集质量评估测试结果
趋势一:人工智能数据集质量评估从传统大数据质量转向AI原生数据质量;趋势二:人工智能数据集质量评估从通用基础质量指标转向行业专属场景质量指标;趋势三:人工智能数据集质量评估从静态评估转向动态闭环优化。
地方实践方面,“可信AI”人工智能数据集质量评估支持保定、东莞、兰州新区、沈阳、苏州、广州等地方建设人工智能高质量数据集质量评估公共服务能力,落地人工智能数据集质量评估服务协同平台,推动重点行业领域高质量数据集建设与行业垂类模型训练。其中,中国信通院人工智能数据处理和质量测评中心落地河北保定,国家数据局、文旅部、京津冀和贵州等地各级政府领导,以及国际企事业专家到访近80批、1400余人次,建立“源数据-高质量数据集-模型应用”的完整评测服务体系,推动以数据要素为核心的区域人工智能产业发展的辐射与引领作用。
下一步,中国信通院将依托工业和信息化部人工智能标准化技术委员会数据组(MIIT/TC1 WG2)启动“面向“人工智能+”场景的行业高质量数据集标准专项征集工作,旨在系统梳理各个重点行业领域核心需求,为后续行业专属高质量数据集建设与质量评估工作奠定基础。同时,2025年第四轮可信AI人工智能数据集质量评估工作现已正式启动,欢迎各个人工智能相关企业和行业高质量数据集建设企业参与评估。
评估咨询联系人:
中国信通院
人工智能研究所
燕老师
17801035157(微信同号)
樊老师
18612301312(微信同号)
李老师
18611353631(微信同号)
校 审 | 谨言、珊 珊
编 辑 | 凌 霄