C114訊 7月3日消息(南山)大模型等AI人工智能技術(shù),正在深刻改變光通信行業(yè)。尤其是數(shù)據(jù)中心光互聯(lián),在洶涌的智能算力驅(qū)動(dòng)下,傳輸帶寬高速增長(zhǎng)。
在近期舉辦的2024中國(guó)光網(wǎng)絡(luò)研討會(huì)上,阿里巴巴首席通信科學(xué)家、阿里云資深技術(shù)總監(jiān)謝崇進(jìn)發(fā)表演講指出,AI對(duì)算力的需求快速增長(zhǎng),超過了摩爾定律的增長(zhǎng)速度。根據(jù)IDC的預(yù)測(cè),到2027年,AI服務(wù)器市場(chǎng)份額將超越傳統(tǒng)服務(wù)器,主導(dǎo)服務(wù)器這一核心算力設(shè)備市場(chǎng)。
而AI計(jì)算是大規(guī)模并行計(jì)算,包括矢量并行 (Tensor parallelism)、流水線并行 (Pipeline parallelism)、數(shù)據(jù)并行 (Data parallelism),在服務(wù)器、處理器、網(wǎng)絡(luò)、功耗等方面與通用計(jì)算的基礎(chǔ)設(shè)施存在很大差異。
例如服務(wù)器,將從x86為主的通用計(jì)算服務(wù)器,轉(zhuǎn)向GPU為主的高性能計(jì)算服務(wù)器,功率更高、算力更強(qiáng)、網(wǎng)絡(luò)帶寬更大;再如網(wǎng)絡(luò),從數(shù)據(jù)中心以太網(wǎng)網(wǎng)絡(luò),轉(zhuǎn)向基于RoCE的以太網(wǎng)或者IB的高性能網(wǎng)絡(luò),具備高吞吐、超低時(shí)延和高可靠性。
以阿里云自研的HPN 7.0高性能AI智算集群網(wǎng)絡(luò)為例,創(chuàng)新性地設(shè)計(jì)了“雙上聯(lián)+多軌+雙平面”的網(wǎng)絡(luò)架構(gòu),并配合最新一代的51.2Tbps單芯片以太網(wǎng)交換機(jī)和400G高性能網(wǎng)卡,自研Solar-RDMA和ACCL通信庫(kù),實(shí)現(xiàn)了單層千卡、兩層萬卡的高性能和高穩(wěn)定互聯(lián)。
謝崇進(jìn)指出,AI時(shí)代,計(jì)算在從通用計(jì)算走向智能計(jì)算,從CPU為中心轉(zhuǎn)向GPU為中心。由于并行計(jì)算特點(diǎn),智能計(jì)算帶來了大量的光互聯(lián)需求,成為光互聯(lián)的新增長(zhǎng)引擎。