8月21日,由中國通信學會和華為技術有限公司聯(lián)合主辦的“第八屆未來網(wǎng)絡發(fā)展大會——智算網(wǎng)絡創(chuàng)新技術論壇”在南京舉行。來自中國通信學會、互聯(lián)網(wǎng)企業(yè)、電信運營商、設備制造商、高等院校、科研院所等單位的200余名專家齊聚會場(線上直播累計觀看量達28萬人次),共同探討智算網(wǎng)絡的創(chuàng)新研究、應用實踐、標準體制以及產(chǎn)業(yè)生態(tài)等。
中國通信學會副秘書長歐陽武出席會議并致辭。歐陽秘書長表示隨著人工智能的快速發(fā)展與廣泛應用,算力集群正在成為目前產(chǎn)業(yè)和技術發(fā)展的新熱點、新趨勢,隨著AI模型規(guī)模的不斷攀升,模型訓練所需算力也同步增大,網(wǎng)絡基礎設施面臨的挑戰(zhàn)更加嚴峻。在智算中心,網(wǎng)絡是連接CPU、GPU、內存等異構算力資源的關鍵,其性能對提升智算中心的整體算力水平具有絕對性的影響,網(wǎng)絡的智能化及智算網(wǎng)絡便成為新型基礎設施的必然選擇。希望通過本論壇引起更多深入的交流和啟發(fā)性的討論,形成政府和企業(yè)的合力,啟發(fā)智算網(wǎng)絡的技術創(chuàng)新思路,促進智算網(wǎng)絡產(chǎn)業(yè)的良性發(fā)展。中國通信學會愿與產(chǎn)業(yè)界、科技界朋友一道,推動智算前沿技術的研發(fā),推動產(chǎn)學研用深度融合,促進智算網(wǎng)絡技術的創(chuàng)新發(fā)展。
華為網(wǎng)絡技術實驗室主任劉冰洋博士代表主辦單位致辭,表示在過去一年多,面向AI大模型的智算網(wǎng)絡技術快速發(fā)展,總線網(wǎng)絡、以太網(wǎng)絡的性能不斷摸高,組網(wǎng)規(guī)模不斷擴大。網(wǎng)絡架構、協(xié)議、硬件、芯片都圍繞著大模型的需求開展系統(tǒng)創(chuàng)新,并與計算組件垂直整合、協(xié)同優(yōu)化,各種創(chuàng)新快速落地。相關的產(chǎn)業(yè)組織也如雨后春筍般發(fā)起,希望比標準組織更加快速和更加聚焦地推動智算網(wǎng)絡技術的產(chǎn)業(yè)發(fā)展。去年最為火爆的是AI訓練網(wǎng)絡,大家把AI訓練的各種并行模式、流量模型研究得非常細。今年以來,推理服務化的系統(tǒng)架構以其網(wǎng)絡開始備受關注,相關的算法和架構快速迭代,成為研究和創(chuàng)新的新熱點。本次論壇邀請了來自國內研究機構和ICT企業(yè)的頂尖專家學者,開放討論智算網(wǎng)絡技術和產(chǎn)業(yè)發(fā)展的趨勢和關鍵問題,希望能夠促成思維碰撞,凝聚共識,推動合作。
中國信息通信研究院云計算與大數(shù)據(jù)研究所所長何寶宏在《智算網(wǎng)絡的幾點觀察與思考》主題演講中,闡述了過去10年互聯(lián)網(wǎng)/云讓數(shù)據(jù)中心成了技術創(chuàng)新的制高點,現(xiàn)在AI又讓數(shù)據(jù)中心成了算力中心,強調了高吞吐、大規(guī)模組網(wǎng)、高可靠及易運維等是智算網(wǎng)絡的技術重點,并全面介紹了智算網(wǎng)絡的產(chǎn)業(yè)新生態(tài)、標準研制以及國際合作進展。
清華大學助理教授章明星老師在《以KVCache為中心的LLM推理服務優(yōu)化》主題演講中,闡述了大模型時代,高并發(fā)場景下,數(shù)據(jù)供給速度成為計算智能的關鍵瓶頸,分析了大模型推理服務(MaaS)在系統(tǒng)層面的挑戰(zhàn),并詳細介紹了以KVCache為中心的大模型推理架構——Mooncake。
阿里云資深網(wǎng)絡架構師席永青在《阿里云可預期智算集群架構HPN7.0》主題演講中,表示傳統(tǒng)網(wǎng)絡集群設計不再適用AI計算,強調網(wǎng)絡性能與高可靠系統(tǒng)是集群算力的兩大關鍵要素,并詳細介紹了阿里云為AI設計的高性能網(wǎng)絡架構——HPN7.0,最后展望了未來的AI基礎設施網(wǎng)絡架構,包括scale up加scale out融合設計、面向訓推一體的數(shù)據(jù)中心架構等。
騰訊自研DPU網(wǎng)絡架構楊潔偉在《DPU助力AI大模型網(wǎng)絡突破極致性能》主題演講中,深刻分析了AI大模型對網(wǎng)絡的需求及挑戰(zhàn), 分享了騰訊AI大模型集群底座——星脈網(wǎng)絡、實現(xiàn)算力卸載同時提高算力效率的自研DPU架構及產(chǎn)品,并展望了星脈2.0網(wǎng)絡技術,包括深度融合網(wǎng)卡升級、交換機升級、網(wǎng)絡能力升級以及GPU高速互聯(lián)接口等。
華為數(shù)據(jù)通信標準專利部部長朱科義在《華為星河AI網(wǎng)絡擁抱智能未來》主題演講中,分析了AI對數(shù)據(jù)通信網(wǎng)絡帶來的新挑戰(zhàn),介紹了華為星河AI網(wǎng)絡關鍵技術棧、實踐案例以及在標準學術組織的研討進展,呼吁面向智能時代的高效算力承載目標網(wǎng)共聚產(chǎn)業(yè)共識,一起攜手推進智算網(wǎng)絡新標準、共筑智算網(wǎng)絡新生態(tài)。
中國電信研究院網(wǎng)絡技術研究所副所長雷波在《關于云網(wǎng)融合下的智算基礎設施的幾點思考》主題演講中,表示大模型時代需要構建新型智算基礎設施,重點闡述了云網(wǎng)融合智算基礎設施架構設想與實踐,從提升單節(jié)點計算密度、多計算節(jié)點合一、計算和網(wǎng)絡資源統(tǒng)一分配三個角度打造具有泛在接入、高速、確定性承載能力、多要素聚合的智算基礎設施,為AI發(fā)展提供強大的能力底座。
中科院計算所高性能計算機研究中心主任譚光明在《面向科學智能的高性能網(wǎng)絡系統(tǒng)優(yōu)化》主題演講中,分析了面向科學智能,傳統(tǒng)超算出現(xiàn)了一些新的算法、模型上的變化,主要體現(xiàn)在通過AI技術加速計算建模的求解以及相應的迭代過程,重點分享了其團隊在高性能網(wǎng)絡系統(tǒng)優(yōu)化的研究內容及優(yōu)化效果,并介紹了高通量以太網(wǎng)聯(lián)盟的愿景與發(fā)展理念。
清華大學李丹教授在《大規(guī)模智算網(wǎng)絡關鍵技術研究》的主題演講中,介紹了智算網(wǎng)絡的研究工作意義與重要性、國內外現(xiàn)狀與發(fā)展趨勢,重點分享了其團隊的研究工作概況,包括智算網(wǎng)絡拓撲結構、傳輸調度、并行策略、仿真尋優(yōu)等,最后介紹了后續(xù)擬開展的研究工作——高聯(lián)算比智算中心網(wǎng)絡。
華為網(wǎng)絡技術實驗室技術專家任首首在《AI智算網(wǎng)絡挑戰(zhàn)與關鍵技術研究》的主題演講中,分析了未來智算網(wǎng)絡規(guī)模越來越大,MoE、多租多任務等趨勢使得流量特征更加復雜,當前主流RDMA技術的lossless和lossy兩條路線在智算場景下所面臨的關鍵技術挑戰(zhàn),重點介紹了數(shù)控分離DCP(Data&Control Partition)架構,該架構對控制信息和數(shù)據(jù)信息采用不同傳輸策略,通過端網(wǎng)協(xié)同方式,高效結合lossless和lossy路線各自優(yōu)勢,使能更低成本、更大范圍、更高性能的下一代傳輸系統(tǒng)與協(xié)議。
本次論壇由華為網(wǎng)絡技術實驗室技術專家陳哲主持。
通過本次論壇,演講嘉賓們深刻剖析了AI大模型的發(fā)展趨勢以及對網(wǎng)絡提出的關鍵需求與挑戰(zhàn),介紹了在智算網(wǎng)絡上的一些關鍵基礎架構創(chuàng)新以及協(xié)議方面創(chuàng)新,分享了面向AI大模型的智算網(wǎng)絡部署實踐、標準研制、產(chǎn)業(yè)生態(tài)以及國際合作等方面的進展。