近日,工业和信息化部批准了《大规模预训练模型技术和应用评估方法》5项行业标准。该系列标准覆盖大模型的开发、管理、运营等多个阶段,主要包括模型开发、能力评估、应用成效、运营管理和可信要求五部分,为大模型技术和产品的研发测试和应用推广提供了重要参考。该系列标准的发布与实施,将进一步健全大模型标准体系,加速大模型技术创新与应用落地,为“人工智能+”行动的深入推进提供坚实支撑。
YD/T 6520.1-2025《大规模预训练模型技术和应用评估方法 第1部分:模型开发》规定了大模型在开发过程中的能力要求,旨在评估数据管理、模型训练、模型管理和模型部署四大维度的规范性与成熟度,涵盖数据获取与处理、训练方式与框架、版本回溯、模型微调与转换等关键能力。
YD/T 6520.2-2025《大规模预训练模型技术和应用评估方法 第2部分:模型能力》规定了大模型的技术和服务能力要求,旨在通过智能语义、视觉、语音及跨模态等多方面任务评估大模型的技术能力,以及大模型在服务稳定性、鲁棒性、响应时间、开放程度和并发性等方面的服务成熟度。
YD/T 6520.3-2025《大规模预训练模型技术和应用评估方法 第3部分:模型应用》规定了大模型在应用阶段的能力要求,旨在评估工程路径、运营能力、管理能力和服务能力等方面的成熟度,包括大模型的知识库管理、工具链完备性及应用服务的安全可靠性。
YD/T 6520.4-2025《大规模预训练模型技术和应用评估方法 第4部分:可信要求》规定了大模型全生命周期的可信能力要求,旨在评估技术层面的数据可信、算法模型可信、基础设施可信能力,以及业务层面的应用可控性和业务可信度。
YD/T 6520.5-2025《大规模预训练模型技术和应用评估方法 第5部分:模型运营》规定了大模型工程化落地和运营阶段的能力要求,旨在评估数据工程、模型调优、模型交付、服务运营以及平台资源管理调度等方面的能力。
作为该系列标准的牵头单位,中国信息通信研究院积极践行标准引领人工智能产业高质量发展的目标,深入开展大模型关键技术及产业应用研究工作。同时,联合大模型相关企业、高校、科研机构和行业用户等百余家单位广泛开展调查研究,在标准中充分考虑技术发展趋势和应用实践经验。通过建立一套科学、系统、全面的大模型评估体系,将有效引导大模型产业的健康有序发展,推动技术与应用的深度融合。
下一步,中国信通院将持续完善大模型标准体系,为实施“人工智能+”行动、推动大模型产业高质量发展做出积极贡献。
本文来源:中国信通院