近期,中國移動在北京、重慶、湖北、青海、浙江、內(nèi)蒙及福建七省市順利完成業(yè)界首批IP網(wǎng)絡(luò)智算互聯(lián)關(guān)鍵技術(shù)現(xiàn)網(wǎng)試點(diǎn)。
近年來,隨著生成式人工智能(artificial intelligence generated content,AIGC)大模型和智能計算應(yīng)用的高速發(fā)展,對于智算企業(yè)到智算中心間大規(guī)模數(shù)據(jù)的傳輸、異地計算、存儲和處理需求日益增加,主要涵蓋存算分離、樣本數(shù)據(jù)上傳、分布式訓(xùn)練、推理下發(fā)這四大場景,其流量特征表現(xiàn)為大規(guī)模、周期性、大突發(fā)、高并發(fā)的“大象流”,對網(wǎng)絡(luò)造成巨大沖擊,IP廣域網(wǎng)面臨負(fù)載不均,擁塞丟包,帶寬資源無法充分利用等問題。為解決上述問題,中國移動在“MATRIXES”技術(shù)體系下,提出面向企業(yè)入算場景的微流級負(fù)載均衡、分時分網(wǎng)調(diào)度、精準(zhǔn)擁塞控制三大關(guān)鍵技術(shù),本次試點(diǎn)對其進(jìn)行了充分的實(shí)踐和驗證,對構(gòu)建大運(yùn)力、低時延、無阻塞的新一代IP智算互聯(lián)網(wǎng)絡(luò)具有重大參考和指導(dǎo)意義。
微流級負(fù)載均衡:通過新一代的負(fù)載均衡技術(shù),將大突發(fā)高并發(fā)的大象流數(shù)據(jù)分擔(dān)到多個SRv6 Segmelist網(wǎng)絡(luò)路徑上,解決傳統(tǒng)網(wǎng)絡(luò)設(shè)備負(fù)載分擔(dān)不均的問題,在確保數(shù)據(jù)傳輸完整性的同時,有效降低網(wǎng)絡(luò)擁堵現(xiàn)象,極大提升了網(wǎng)絡(luò)的吞吐量和傳輸速度。
分時分網(wǎng)調(diào)度:為應(yīng)對智算業(yè)務(wù)高并發(fā)大象流的大帶寬傳輸需求,充分利用網(wǎng)絡(luò)空閑帶寬資源,分時分網(wǎng)調(diào)度技術(shù),基于對網(wǎng)絡(luò)運(yùn)力的預(yù)測和管理,結(jié)合網(wǎng)絡(luò)帶寬的時空變化規(guī)律,通過靈活調(diào)整路徑編排策略,對流量進(jìn)行動態(tài)調(diào)度,為用戶提供可敏捷彈性擴(kuò)縮的運(yùn)力服務(wù),從而實(shí)現(xiàn)更高效的網(wǎng)絡(luò)資源利用。
精準(zhǔn)擁塞控制:為解決智算中心間互聯(lián)場景擁塞丟包導(dǎo)致業(yè)務(wù)性能下降的問題,通過精準(zhǔn)擁塞控制技術(shù)突破,實(shí)現(xiàn)網(wǎng)絡(luò)擁塞提前發(fā)現(xiàn)、主動調(diào)整、擁塞范圍不擴(kuò)散等,從而有效控制擁塞。
本次現(xiàn)網(wǎng)試點(diǎn)工作由中國移動集團(tuán)計劃建設(shè)部牽頭,中國移動研究院、設(shè)計院負(fù)責(zé)整體技術(shù)方案制定,中國移動集團(tuán)網(wǎng)絡(luò)事業(yè)部、7省公司、云能力中心負(fù)責(zé)技術(shù)驗證工作。試點(diǎn)基于中國移動云專網(wǎng)架構(gòu)與新平臺路由器設(shè)備開展創(chuàng)新,實(shí)現(xiàn)了智算中心側(cè)400G大象流在IP廣域網(wǎng)100G 鏈路中的高效傳輸,不同網(wǎng)絡(luò)路徑的負(fù)載均衡精度控制在5%以內(nèi),帶寬利用率從60%提升到90%,完全達(dá)到試點(diǎn)驗證目標(biāo)。
展望未來,中國移動將繼續(xù)與產(chǎn)業(yè)各方緊密攜手、開拓創(chuàng)新,共同推動 IP 網(wǎng)絡(luò)智算互聯(lián)技術(shù)不斷發(fā)展演進(jìn),在超寬管道、低時延加密、主動擁塞避免等方面進(jìn)一步深入探索研究,助力構(gòu)建超越連接、突破性能、極低時延的智算互聯(lián)IP網(wǎng)絡(luò),實(shí)現(xiàn)以網(wǎng)強(qiáng)算、以網(wǎng)促算,為 AI 智算業(yè)務(wù)的蓬勃發(fā)展注入新動能,為國家數(shù)字經(jīng)濟(jì)發(fā)展貢獻(xiàn)堅實(shí)力量。