C114通信網  |  通信人家園

資訊
2024/7/30 15:17

中國移動在光通信頂會ECOC 發(fā)表首個基于OTN承載智算拉遠的學術研究成果

C114通信網  

中國移動研究院創(chuàng)新提出基于光傳送網(Optical Transport Network,OTN)的智算分布式協同架構,攜手業(yè)界合作伙伴構建了基于OTN互聯的智算分布式協同原型系統(tǒng)并完成理論仿真和實驗研究,相關成果近期被全球光通信領域頂級學術會議European Conference on Optical Communications(ECOC)2024錄用,是揭示OTN傳輸和組網技術承載智算拉遠可行性的首篇學術成果。

隨著ChatGPT、Sora、Gemini等基礎大模型應用涌現,以智算為代表的新型基礎設施已成為新質生產力發(fā)展的重要引擎。伴隨智算中心規(guī)模向超萬卡演進,機房空間及供電需求迅猛增加,單節(jié)點集中部署面臨巨大挑戰(zhàn),分布式協同部署是潛在解決方案。而如何將分布式部署的智算機房進行協同調度,充分發(fā)揮算力資源的最大效能,是業(yè)界亟需研究的關鍵問題。

中國移動面向智算分布式協同場景,開展基于OTN的智算分布式協同架構技術創(chuàng)新,并首次完成2-100公里不同距離多場景下OTN承載分布式智算技術試驗。在試驗中基于400G OTN互聯的兩個智算集群上運行百億級參數的大型基礎語言模型,詳細論證研究了互聯距離、帶寬變化、光纖閃斷、鏈路誤碼等因素對計算效率的影響。首次揭示了訓練效率劣化與拉遠距離基本呈線性關系,并通過充分發(fā)揮OTN大帶寬、穩(wěn)定低時延、高可靠等傳輸和組網技術特點,在100km的拉遠距離下實現了訓練效率僅劣化3.75%的高效協同訓練,為分布式智算技術演進提供了全新理論依據和詳實試驗數據。

基于OTN互聯的智算分布式協同創(chuàng)新是實現跨智算集群協同訓練的潛在技術方案,本次高水平論文成果的發(fā)表,是首次以試驗方式定量揭示了基于OTN的智算拉遠技術性能和變化規(guī)律,后續(xù)需進一步推進產學研在跨智算集群協同技術方面的深度協同,構建分布式智算中心新模式。

給作者點贊
0 VS 0
寫得不太好

  免責聲明:本文僅代表作者個人觀點,與C114通信網無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯系我們 | 網站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網 版權所有 舉報電話:021-54451141