近日
在中国移动的助力下
中国石油高效完成了
DeepSeek V3/R1全栈国产化的
训推适配和私有化部署
此次部署
基于DeepSeek的关键技术点
开展了系列基础模型算法创新
实现了从底层芯片到框架、
模型的全栈自主可控
为推动人工智能技术
在能源化工领域的深度应用
与国产AI技术生态的规模化落地
注入了强大动力
一直以来,中国移动与中国石油两大央企积极响应国家人工智能战略,努力推动 “人工智能 +” 在能源化工行业落地生根。此前,中国移动携手中国石油发布能源化工领域首个行业大模型——700亿参数昆仑大模型,助力中国石油打造“五个一”:建设一个央企领先的算力中心,一个集中统一AI中台,一套高质量行业数据集,一套国内领先的行业大模型、一系列创新应用。
AI了!牵手中国石油,开启能源化工 “智” 时代
面对中国石油多模态、超百亿参数的大模型训练任务需求,移动云凭借强大的算力网络能力,实现了资源的快速响应、弹性扩展及高质量供给。通过为中国石油构建“算力泛在、算网共生、智能敏捷、安全可靠、绿色低碳”的一体化算力体系,移动云已提供超过1000P的稳定算力资源,为大模型的建设和运行提供了坚实的算力保障。
为了使DeepSeek系列模型在昆仑大模型原有的框架下,获得更好的适配效果和执行性能,中国移动第一时间开展相关的分析、适配与创新工作。中国移动通过配置化开发,在DeepSeek V3模型基础上快速实现了自定义模型参数和规模的针对性优化。团队在不实际启动集群训练任务的情况下,仅通过单卡即模拟出集群中所有卡的内存占用情况,从而制定整体的集群分布式训练策略。
中国移动复现并优化了DeepSeek MTP多Tokens预测功能,通过DeepSeek-V3/R1主模型和MTP Module的分布式调度,实现一次解码生成多个token,并通过使整图编译功能,组合计算图的通用算子,实现自动融合加速,提升DeepSeek-V3/R1端到端的推理性能。
此次DeepSeek大模型的成功部署,为中国政企客户实现DeepSeek V3/R1全栈国产化的训推适配和部署提供了重要参考。它也为中国石油昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎,推动“数智中国石油”建设步入快车道。
算网大脑加持!移动云全面上线DeepSeek!
在应用层面,昆仑大模型的问答应用“行业大家”目前已新增DeepSeek深度推理能力。用户在使用该应用时,除了可以得到昆仑大模型生成的能源化工领域专业问答结果,还能选择“深度思考”模式,体验知识推理、场景理解等AI服务。
在模型层面,昆仑大模型的AI中台模型广场目前已上线DeepSeek-V3与DeepSeek-R1模型版本,并实现全尺寸适配,用户可基于AI中台调用DeepSeek模型API服务,并使用AI中台组件及工具构建智能体,以满足不同场景的需求。
未来,中国移动与中国石油将继续携手共进,在油气勘探开发、炼油化工、油气销售、工程建设等核心业务领域深入挖掘AI潜力,以新质生产力为中国式现代化建设贡献力量。
本文来源:中国移动