C114訊 6月4日消息(水易)人工智能加速滲透千行萬業(yè)的今天,算力尤其是智能算力成為驅(qū)動數(shù)字經(jīng)濟發(fā)展的核心底座。根據(jù)行業(yè)數(shù)據(jù),截至2024年底,中國智算算力供給規(guī)模達到1450EFlops,預(yù)計未來三年中國智算算力將保持40%以上的增速,到2027年達到4080EFlops。
在此背景下,傳統(tǒng)數(shù)據(jù)中心向大型及超大型智算中心轉(zhuǎn)型成為發(fā)展趨勢。同時,為滿足科學計算、自動駕駛等更復(fù)雜的場景需求,跨區(qū)域、跨中心的算力協(xié)同勢在必行?梢哉f,整個智算產(chǎn)業(yè)站在機會和挑戰(zhàn)并存的轉(zhuǎn)折點。
如何推進IDC向AIDC轉(zhuǎn)型?算網(wǎng)融合的實現(xiàn)路徑是什么?如何構(gòu)建智算產(chǎn)業(yè)生態(tài)?帶著這些問題,“2025智算行業(yè)峰會——算網(wǎng)融合與數(shù)據(jù)中心創(chuàng)新論壇”期間,C114等媒體對華為中國政企大企業(yè)系統(tǒng)部總經(jīng)理劉濤,華為中國政企大企業(yè)部系統(tǒng)部MKT與解決方案銷售部總經(jīng)理肖雪崗進行了采訪。
算網(wǎng)融合:破局算力指數(shù)級需求與線性供給矛盾
“大模型對于算力的需求呈指數(shù)級膨脹式增長,但是硬件算力的供給能力呈線性增長”劉濤介紹,目前對于算力的需求量要比硬件算力供給量高出200倍以上。同時伴隨著模型參數(shù)的不斷增長,不僅需要大算力,對于網(wǎng)絡(luò)和存儲的協(xié)同訴求也與日劇增。
為破局算力需求指數(shù)級和供給線性級的矛盾,華為聚焦算力基礎(chǔ)設(shè)施優(yōu)化與算網(wǎng)深度融合兩大方向,持續(xù)賦能IDC向AIDC轉(zhuǎn)型。
算力基礎(chǔ)設(shè)施優(yōu)化方面,華為向業(yè)界提供領(lǐng)先的人工智能大規(guī)模AI算力集群,并向超節(jié)點架構(gòu)持續(xù)演進。同時,通過軟硬件原生協(xié)同設(shè)計,系統(tǒng)級優(yōu)化AI集群,充分釋放和提升昇騰芯片有效算力使用。另外,通過基于精準液冷及其數(shù)字化聯(lián)控技術(shù),可以實現(xiàn)最優(yōu)整體能耗。
算網(wǎng)深度融合方面,相關(guān)數(shù)據(jù)顯示,AI集群的故障超過20%發(fā)生在網(wǎng)絡(luò),網(wǎng)絡(luò)故障中有70%發(fā)生在光模塊鏈路。另外在模型訓練過程中,0.1%的丟包率會導致50%的算力損失,持續(xù)丟包還會有訓練任務(wù)中斷風險。
肖雪崗表示,為了實現(xiàn)網(wǎng)絡(luò)技術(shù)創(chuàng)新使算力發(fā)揮最大效能,華為依托零丟包無損網(wǎng)絡(luò)技術(shù)、多級可靠性架構(gòu)及智能算網(wǎng)調(diào)度措施,有效化解網(wǎng)絡(luò)波動對算力效能的制約,實現(xiàn)算力資源利用率最大化,顯著提升智算中心的綜合性能。
據(jù)肖雪崗介紹,目前算網(wǎng)融合已經(jīng)在兩大場景展現(xiàn)出良好的應(yīng)用前景。第一是幫助頭部IDC從“機柜租賃商”向“智能算力服務(wù)商”升級轉(zhuǎn)型,例如幫助IDC運營商構(gòu)建智能、可靠、高效的算力網(wǎng)絡(luò),通過算力和網(wǎng)絡(luò)的深度融合,幫助企業(yè)智能流量調(diào)度,訓練時間縮短30%,GPU平均利用率達95%以上。
第二,提供智能算力資源調(diào)度與彈性服務(wù),為用戶提供跨地域算力資源池、使客戶可以按需調(diào)用。比如,通過部署“算力網(wǎng)絡(luò)大腦”,構(gòu)建區(qū)域“1ms時延圈”,全局感知客戶需求,自動調(diào)度多地數(shù)據(jù)中心閑置算力資源,助力游戲公司應(yīng)對節(jié)假日算力峰值需求,算力利用率從40%提升至75%,采購成本降低30%。
場景創(chuàng)新:從模型訓練推理到智能世界全面賦能
從前文可以看到,智算需求和供給的矛盾主要來自大模型應(yīng)用的加速迭代升級,特別是頭部大模型廠商卷出新高度。正如劉濤所言,智算最成熟的應(yīng)用場景仍集中在大模型的訓練與推理,尤其是在自然語言處理、計算機視覺和多模態(tài)技術(shù)等方向,對算力的強烈需求推動了智算數(shù)據(jù)中心的快速發(fā)展。
對于華為而言,除了提供算網(wǎng)融合的智算解決方案,在大模型領(lǐng)域,針對當前流行的MoE架構(gòu),華為國內(nèi)首創(chuàng)大規(guī)模專家并行方案,具備更多的專家和更大的專家并行域。另外,昇騰支持多專家動態(tài)均衡,避免形成單點專家過熱,實現(xiàn)專家熱點均衡,資源利用率提升20%。
肖雪崗介紹,華為的AI方案是親和MoE架構(gòu),結(jié)合軟件優(yōu)化,在超長序列、多模態(tài)以及稀疏MoE等核心場景下,性能優(yōu)于業(yè)界水平。
“當然,智算的服務(wù)范疇遠不止于大模型!眲硎,在成熟應(yīng)用領(lǐng)域,智算已廣泛部署于自動駕駛、智慧城市、醫(yī)療影像和工業(yè)制造等行業(yè)。例如,自動駕駛依賴高精度仿真和路徑規(guī)劃的高性能計算,工業(yè)制造則借助智算實現(xiàn)缺陷檢測與產(chǎn)品設(shè)計優(yōu)化,顯著提升效率與精度。
與此同時,一批新興場景正在加速崛起。元宇宙與數(shù)字孿生技術(shù)被應(yīng)用于城市規(guī)劃、交通管理與應(yīng)急演練;“AI for Science”推動氣候模擬、生命科學與材料研發(fā)等復(fù)雜科學計算進入智能化時代;金融量化交易依賴智算實現(xiàn)海量數(shù)據(jù)處理與實時決策;影視制作也開始借助智算加速數(shù)字創(chuàng)意的生成與渲染。
“智算不僅服務(wù)于人工智能本身,它本質(zhì)上是面向智能時代的核心算力基礎(chǔ)設(shè)施。”劉濤強調(diào),智算在企業(yè)數(shù)字化轉(zhuǎn)型、科學研究、大數(shù)據(jù)分析等領(lǐng)域發(fā)揮著不可替代的作用。同時,隨著技術(shù)不斷演進,智算正逐步成為支撐整個智能社會運行的關(guān)鍵底座。
生態(tài)協(xié)同:打造開放共贏的人工智能產(chǎn)業(yè)生態(tài)
2025年,在“人工智能+”行動的驅(qū)動下,我國AI行業(yè)應(yīng)用、AI智能體市場將迎來爆發(fā),將引領(lǐng)我國傳統(tǒng)產(chǎn)業(yè)數(shù)智化升級加速。肖雪崗表示,面對AI大機遇,華為堅持“硬件開放、軟件開源、使能伙伴、發(fā)展人才”的十六字方針,聯(lián)合技術(shù)和商業(yè)伙伴,打造“共建、共享、共贏”的人工智能產(chǎn)業(yè)。
硬件開放領(lǐng)域,華為計算產(chǎn)業(yè)擁有14家OEM伙伴,自研產(chǎn)品50多款,50家APN伙伴,自研產(chǎn)品100多款。華為積極與合作伙伴共建AI生態(tài)圈,共同推動行業(yè)的數(shù)智化轉(zhuǎn)型。通過共建生態(tài)圈,華為與合作伙伴可以共享資源、共同發(fā)展,實現(xiàn)互利共贏。
軟件開源領(lǐng)域,華為計算開源社區(qū)MindSpore企業(yè)服務(wù)數(shù)量5500多個,社區(qū)下載量超1100萬,社區(qū)開源模型超500個,中國AI框架2024年新增市場份額達30%。華為給合作伙伴提供開放的AI計算平臺,支持各類AI應(yīng)用的開發(fā)和部署。合作伙伴可以在該平臺上快速搭建自己的AI解決方案,加速產(chǎn)品上市和落地。
使能伙伴領(lǐng)域,華為計算產(chǎn)業(yè)擁有2500多個行業(yè)合作伙伴,5800多個解決方案認證,全國26個創(chuàng)新中心,深入IDC、ISP、互聯(lián)網(wǎng)、運營商、金融等行業(yè)核心場景。華為為合作伙伴提供專業(yè)的培訓和技術(shù)支持,幫助他們更好地理解和應(yīng)用華為的AI算力產(chǎn)品。包括技術(shù)培訓、解決方案設(shè)計等,幫助合作伙伴提升技術(shù)水平和服務(wù)能力。
發(fā)展人才領(lǐng)域,華為計算產(chǎn)業(yè)擁有超330萬開發(fā)者,聯(lián)合72所高校啟動智能基座2.0建設(shè),開設(shè)1600多門課程,賦能超6000先鋒教師,華為提供涵蓋專業(yè)人才培訓服務(wù)與高校師資培訓服務(wù),聯(lián)合高校進行科研課題技術(shù)合作,助力生態(tài)人才培養(yǎng)。
劉濤強調(diào),無論是昇騰還是鯤鵬的伙伴計劃,華為打造的生態(tài)體系不只是提供開發(fā)激勵,還有算力激勵、營銷激勵,助力伙伴和客戶實現(xiàn)商業(yè)成功。為了實現(xiàn)這一目標,必須發(fā)動社會的力量和伙伴的力量,而不是一個人單打獨斗。華為通過構(gòu)建“以客戶為中心”的“伙伴+華為”體系,致力于讓AI“用得起、用得好、用得放心”,以人工智能賦能社會發(fā)展與產(chǎn)業(yè)升級,為人類社會發(fā)展帶來價值。