中國電信上海公司(以下簡稱“上海電信”)在上海衡山花園酒店舉辦的“智云上海發(fā)布暨2024中國電信上海公司科技節(jié)”上,攜手華為展示400GE IP彈性無損智算廣域網(wǎng)絡(luò)創(chuàng)新解決方案,旨在通過400GE大容量承載、RDMA(Remote Direct Memory Access)無損傳輸以及任務(wù)式彈性調(diào)度等智算網(wǎng)絡(luò)技術(shù)為千行百業(yè)提供高彈性、高吞吐、高可靠的入算網(wǎng)絡(luò)服務(wù)。
400GE IP彈性無損智算廣域網(wǎng)絡(luò)方案
國內(nèi)算力市場蓬勃發(fā)展,算力規(guī)模每年幾乎要翻一倍,中國電信在臨港信息園區(qū)建設(shè)國產(chǎn)萬卡算力集群,并以出租的方式為企業(yè)提供算力服務(wù)。企業(yè)需要將自己的算力數(shù)據(jù)通過運營商的智算廣域網(wǎng)送到智算中心進(jìn)行模型訓(xùn)練或推理。當(dāng)前算力輸送面臨兩種典型的場景:一是百T級大數(shù)據(jù)集中訓(xùn)練,例如基因測序的模型訓(xùn)練平均日產(chǎn)數(shù)據(jù)量達(dá)到12TB每天,如果通過傳統(tǒng)專線模式將數(shù)據(jù)送到智算中心進(jìn)行模型訓(xùn)練,企業(yè)和研究機(jī)構(gòu)會面臨“低帶寬等不起,高帶寬用不起”的窘境。另外一種場景是數(shù)據(jù)拉遠(yuǎn)訓(xùn)練,部分企業(yè)由于要保障數(shù)據(jù)安全性,要求從研究機(jī)構(gòu)到算力中心傳輸過程中數(shù)據(jù)不在園區(qū)外落盤;赗DMA的拉遠(yuǎn)訓(xùn)練對時延、丟包十分敏感,因此對網(wǎng)絡(luò)承載能力提出了更高的訴求。上海電信攜手華為打造端到端400GE IP彈性無損智算廣域網(wǎng)絡(luò),為企業(yè)提供海量樣本高效入算、存算分離拉遠(yuǎn)、數(shù)據(jù)快遞彈性IP等多種算網(wǎng)一體化服務(wù)能力。
400GE彈性算網(wǎng),一跳入多算:智算廣域網(wǎng)絡(luò)端到端部署400GE大帶寬接口技術(shù),將網(wǎng)絡(luò)運力提升4倍。通過在企業(yè)側(cè)部署智能AI-CPE,實現(xiàn)10Mbps~100Gbps IP彈性伸縮專線,滿足企業(yè)一條專線同時訪問智算、超算以及通算等多種異構(gòu)算力資源池的需求。
長距RDMA無損傳輸:基于RDMA的拉遠(yuǎn)訓(xùn)練對網(wǎng)絡(luò)時延、丟包、抖動等網(wǎng)絡(luò)傳輸指標(biāo)十分敏感,萬分之一丟包會導(dǎo)致訓(xùn)練效率直接下降50%。智算廣域網(wǎng)絡(luò)具備基于智算大象流智能識別和深度負(fù)載均衡能力,使網(wǎng)絡(luò)吞吐率逼近400GE線路帶寬,支持城域100KM覆蓋范圍的RDMA遠(yuǎn)距離、高吞吐無損傳輸。
時延可保障:智算廣域網(wǎng)絡(luò)結(jié)合網(wǎng)絡(luò)控制器智能調(diào)度能力,實現(xiàn)算力業(yè)務(wù)傳輸質(zhì)量實時可視。基于網(wǎng)絡(luò)路徑秒級調(diào)優(yōu)能力,智算網(wǎng)絡(luò)可以保障算力業(yè)務(wù)傳輸時延,從而滿足推理業(yè)務(wù)流量毫秒級傳輸。
AI激發(fā)了網(wǎng)絡(luò)創(chuàng)新,網(wǎng)絡(luò)服務(wù)算力并聯(lián)接算力。入算、算間、推理這些不同的算力業(yè)務(wù)為網(wǎng)絡(luò)注入了新的業(yè)務(wù)模式,也對IP網(wǎng)絡(luò)提出了更高的承載要求。華為將和上海電信持續(xù)攜手創(chuàng)新,利用端到端切片、無損以太、長距離RDMA、網(wǎng)絡(luò)數(shù)字地圖等技術(shù),構(gòu)建高效無損智算網(wǎng)絡(luò),讓千行百業(yè)像使用自來水一樣便捷地使用算力服務(wù),助力上海建設(shè)成為具有全球影響力的智能算力創(chuàng)新及應(yīng)用示范區(qū)。