近日,中国移动完成了业界首次百公里级800G以太网智算协同训练的现网技术试验,标志着智算中心互联技术取得重要进展,为高效聚合分散算力资源提供了关键技术支撑。
本次试验主要面向城市群(如京津冀、长三角城市群)智算中心分布在多地,需要聚合零散算力资源进行模型训练的场景。本次试验采用了中国移动提出的全调度以太网与高速光网络融合的技术体系(GSE-DCI),单台设备将路由功能和长距光传输融合,单光纤可支持高达32个800G波长通道的超大容量传输,相比传统智算中心互联技术实现了单比特成本降低40%,功耗降低35%,节点时延降低20%。在700亿级参数大模型的并行训练场景下,其训练效率可达同等GPU规模单一节点的98%。该方案可最大限度协同智算中心内外网络,大幅提升跨智算中心训练算效,有效解决算力碎片化问题。
800G以太网是面向未来智算与互联网需求制定的新一代互联标准。中国移动引领了全球最大技术组织IEEE(国际电气电子工程师学会)的中长距800G以太网标准制定,IEEE是全球电子、计算机、通信等领域制定行业国际标准的核心机构。
下一步,中国移动将依托算力网络试验装置(CFITI)开展更多基础网络前沿技术验证。
本文来源:人民邮电报