資訊
`
2024/8/6 15:23
中國移動研究院在CCSA TC1牽頭完成異構(gòu)智能算力統(tǒng)一通信機制行標立項
0
0

近日,在CCSA (中國通信標準化協(xié)會)TC1(互聯(lián)網(wǎng)與應(yīng)用)WG4(數(shù)據(jù)中心)工作組會議上,中國移動牽頭的《異構(gòu)智能算力硬件統(tǒng)一通信機制技術(shù)要求》行業(yè)標準獲批立項,標準獲得信通院、燧原、天數(shù)智芯、瀚博、曙光、中興、中國信息通信科技集團等產(chǎn)業(yè)伙伴的支持及共同參與。

當前云計算數(shù)據(jù)中心內(nèi)智能算力形態(tài)呈現(xiàn)多樣化發(fā)展趨勢,不同廠商、不同類型的智能算力硬件,如GPGPU(通用圖像處理器)、NPU(神經(jīng)網(wǎng)絡(luò)處理器)、DSA(領(lǐng)域?qū)S眉铀倨鳎┑,亟需一體協(xié)同工作,充分發(fā)揮各自計算優(yōu)勢,充分釋放系統(tǒng)整體效能。而異構(gòu)混合算力集群中,智能算力硬件互聯(lián)方式各異、通信協(xié)議、數(shù)據(jù)格式及通信接口不一致,各硬件廠商通信庫不兼容,難以實現(xiàn)異構(gòu)硬件設(shè)備間的信息傳遞及參數(shù)同步,亟需面向異構(gòu)混合算力環(huán)境設(shè)計一套異構(gòu)算力分布式統(tǒng)一通信標準。

根據(jù)統(tǒng)一通信技術(shù)與智算芯片軟件棧關(guān)系,智能算力硬件統(tǒng)一通信是面向分布式訓推場景的通信機制標準約束,是面向異構(gòu)智算芯片定義的一套統(tǒng)一通用的通信方法,可用于處理異構(gòu)智算芯片訓推過程所涉及的參數(shù)傳遞、梯度更新等數(shù)據(jù)傳輸協(xié)同相關(guān)操作。

  統(tǒng)一通信技術(shù)與智算芯片軟件棧關(guān)系示意圖

基于統(tǒng)一通信技術(shù)研究目標,標準從數(shù)據(jù)傳輸架構(gòu)、流程及接口等方面制定了一系列規(guī)范化約束,旨在實現(xiàn)同一訓推任務(wù)下的跨架構(gòu)分布式并行數(shù)據(jù)傳輸及協(xié)同。標準內(nèi)容將包括統(tǒng)一通信機制架構(gòu)、異構(gòu)算力通信初始化流程及接口、異構(gòu)算力通信拓撲發(fā)現(xiàn)流程及接口、異構(gòu)算力數(shù)據(jù)傳輸通道建立流程及接口等。

未來,中國移動將與產(chǎn)學研用各界合作伙伴一起,推動不同廠家、不同架構(gòu)異構(gòu)智能算力間形成統(tǒng)一通信機制,助力我國智算生態(tài)融通發(fā)展。

免責聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網(wǎng)版權(quán)所有 舉報電話:021-54451141 用戶注銷