資訊
`
2025/5/24 10:40
AI時代的底座變遷:昇騰大EP+一體機筑基千行萬業(yè)智能化升級
0
0

C114訊 5月24日專稿(蔣均牧)燧石取火讓原始人掙脫黑暗桎梏,蒸汽轟鳴為工業(yè)革命注入澎湃動能,硅基芯片的誕生催生了信息時代的高度繁榮……一個個“底座”,構(gòu)成了人類文明進(jìn)步的長梯,F(xiàn)如今,人工智能AI)的浪潮席卷全球,各種AI應(yīng)用如雨后春筍般涌現(xiàn),日益成為生產(chǎn)力、創(chuàng)造力的代名詞。如何筑牢托舉起算力這一新時代“火種”的底座,使之如源頭活水般精準(zhǔn)灌溉千行萬業(yè),已然成為一個匯聚各方視線的核心議題。

2025年世界電信和信息社會日智算產(chǎn)業(yè)創(chuàng)新發(fā)展專題研討會上,華為昇騰計算業(yè)務(wù)副總裁王慶文以“共筑堅實智算底座,加速行業(yè)智能化”為題,勾勒出一幅算力筑基、產(chǎn)業(yè)共榮的藍(lán)圖。基于對AI產(chǎn)業(yè)趨勢、運營商算力基礎(chǔ)設(shè)施建設(shè)與行業(yè)智能化發(fā)展路徑的深度解讀,他給出了昇騰的答案:大規(guī)模專家并行(大EP)集群推理方案。

通過將混合專家(MoE)模型的專家權(quán)重分散到更多計算卡上,變“單機獨奏”為“集群交響”,在硬件性能受限的現(xiàn)實中,昇騰用系統(tǒng)級優(yōu)化開辟新局面——不僅吹響了眾多行業(yè)效率革命的號角,提供了運營商深度參與AI盛世的利器,更為國人握緊AI產(chǎn)業(yè)發(fā)展的“方向盤”創(chuàng)造了條件。

AI2B奇點已至,運營商具天然優(yōu)勢

“如果說訓(xùn)練是上學(xué),推理就是上班。”王慶文用一句生動的比喻,道破了AI產(chǎn)業(yè)從技術(shù)探索到商業(yè)落地的躍遷。Gartner數(shù)據(jù)顯示,2025年全球80%的中國企業(yè)將部署生成式AI,60%會將AI融入核心生產(chǎn)系統(tǒng),標(biāo)志著企業(yè)AI應(yīng)用從通用場景向核心生產(chǎn)場景滲透的“奇點時刻”到來。

這一轉(zhuǎn)變的背后,是AI推理從“可用”到“好用”的質(zhì)變。首先,AI在深度搜索、思維鏈、多模態(tài)融合等技術(shù)方面已經(jīng)取得了明顯的突破。大語言模型從原來的黑箱式的問答走向可解釋的因果推理,在多個逐步達(dá)到了媲美領(lǐng)域?qū)<业乃。例如某三甲醫(yī)院的AI醫(yī)療診斷系統(tǒng)將單張病理切片分析時間從40分鐘壓縮至秒級,效率提升超百倍;某日化巨頭的AI質(zhì)檢系統(tǒng)將故障率從2.3%降至0.05%,年省成本超300萬元;上海300所中小學(xué)的教師利用AI來備課,將備課時間縮短82%,教案生成效率提升300%。

其次,AI模型生態(tài)已從千模百態(tài)演變?yōu)椤笆畯姴⒘ⅰ,國?nèi)更是“五岳爭鋒”,高質(zhì)量模型脫穎而出。這種收斂并非壟斷,而是產(chǎn)業(yè)成熟的標(biāo)志,促使“高手”們良性競爭、市場健康發(fā)展。根據(jù)斯坦福大學(xué)《2025年人工智能指數(shù)報告》,排名第一和第十的模型的差距已從12%銳減至5%。

最后,MoE模型快速成熟,推動AI產(chǎn)業(yè)走向商業(yè)爆發(fā)。《2025年人工智能指數(shù)報告》顯示,達(dá)到GPT-3.5水平的模型推理成本在兩年間下降9~900倍,小模型成本也在18個月內(nèi)下降280倍;DeepSeek的成本利潤率則達(dá)到驚人的545%。更深層次的影響在于安全與自主,當(dāng)美國試圖以算力枷鎖遏制中國AI產(chǎn)業(yè)發(fā)展,MoE架構(gòu)的出現(xiàn)不啻為一場“平權(quán)運動”。

王慶文指出,運營商在提供推理服務(wù)上具有天然優(yōu)勢:憑借領(lǐng)先的泛在多級訓(xùn)推資源,以及全國性網(wǎng)絡(luò)基礎(chǔ)設(shè)施和數(shù)據(jù)中心機房,既能滿足中小企業(yè)的靈活需求,也能支撐大型企業(yè)核心業(yè)務(wù)及海量用戶場景。同時,通過多租戶部署技術(shù),保障大租戶資源獨立、中小租戶性能提升的同時全方位確保數(shù)據(jù)安全。此外,得益于長期向市場提供優(yōu)質(zhì)的信息通信服務(wù),運營商積累了廣泛的公眾/政企客戶,樹立了良好的口碑。

昇騰大EP:革命性創(chuàng)新筑基AI未來發(fā)展

IDC數(shù)據(jù)顯示,2024年AI IT總投資規(guī)模達(dá)3158億美元,到2028年有望增至8159億美元,五年復(fù)合增長率32.9%。AI應(yīng)用的規(guī);涞匾苍诘贡苹A(chǔ)設(shè)施升級。

一方面,正如蒸汽機的普及反而推動煤炭消費激增,AI技術(shù)進(jìn)步降低了單次應(yīng)用的算力消耗,卻激發(fā)出指數(shù)級增長的總需求。另一方面,在模型架構(gòu)層面,“小專家”模式的興起帶來了專家數(shù)量的增加,從DeepSeek V2的160個專家到V3的256個專家,如何在保證負(fù)載均衡的同時降低通信開銷,成為新的挑戰(zhàn)。

昇騰從基礎(chǔ)硬件、算子到推理系統(tǒng)全面創(chuàng)新,面向不同的推理場景需求,為包含運營商在內(nèi)的客戶及伙伴提供集高性能、高可靠、易部署、開源開放于一體的推理解決方案。其面向大型企業(yè)、C端超級應(yīng)用等場景推出的大規(guī)模專家并行集群推理方案,正是針對上述癥結(jié)的“組合拳”。

其核心邏輯在于“分而治之”——將原本集中于單卡的專家權(quán)重分散到多卡,通過動態(tài)負(fù)載均衡與通信優(yōu)化,實現(xiàn)“1+1>2”的系統(tǒng)效能。這種設(shè)計理念,恰如現(xiàn)代醫(yī)院從 “全科大夫” 轉(zhuǎn)向 “?萍(xì)分”,當(dāng)眼科、外科、內(nèi)科專家各司其職,整體接診效率自然得以極大提升。數(shù)據(jù)顯示,采用大EP方案后平均單卡吞吐性能提升3倍以上,大幅降低每Token推理成本,幫助運營商構(gòu)筑高性能的AI算力基礎(chǔ)設(shè)施,為行業(yè)客戶帶來更優(yōu)的業(yè)務(wù)體驗。

在這背后有幾大革命性創(chuàng)新:分布式部署,單卡專家數(shù)從16~32個降至4~5個,內(nèi)存容量占用減少60%,支持更大KV緩存以承載高并發(fā);動態(tài)均衡,通過多層次均衡策略、全局智能調(diào)度,實時感知專家負(fù)載,自動遷移熱點任務(wù),避免“旱澇不均”;通信優(yōu)化,采用RoCEv2網(wǎng)絡(luò)協(xié)議、PA+MLAPO融合算子、雙流并行等手段,大幅降低All-to-All通信時延,讓“專家會診”效率倍增。

今年以來,科大訊飛攜手昇騰率先實現(xiàn)了MoE模型的大EP集群推理,雙方在算子融合、混合并行策略和通信計算并行等方面深度協(xié)同創(chuàng)新,推理集群中單卡靜態(tài)內(nèi)存占用僅為雙機部署的1/4,推理吞吐性能提升3.2倍,端到端時延降低50%。工商銀行采用昇騰大EP方案在同業(yè)率先完成DeepSeek開源大模型的私有化部署,無縫接入行內(nèi)“工銀智涌”大模型體系,并在后續(xù)的1個月時間內(nèi)實現(xiàn)行內(nèi)50余個場景的模型升級,為業(yè)務(wù)高質(zhì)量發(fā)展注入強勁動力。移動云成功部署基于昇騰AI算力底座的大EP推理集群,在移動云MaaS平臺、COCA推理系統(tǒng)上線,突破性實現(xiàn)單卡吞吐提升3倍,解碼時延降低50%,推動AI技術(shù)革新。

大模型應(yīng)用一體機:大開智能化方便之門

有統(tǒng)計顯示,我國中小微企業(yè)數(shù)量已突破6000萬戶,每天有超萬戶新企業(yè)破土而出,它們貢獻(xiàn)了60%以上的稅收、60%以上的GDP,創(chuàng)造了70%以上的技術(shù)創(chuàng)新成果,吸納了80%的城鎮(zhèn)就業(yè)。然而,當(dāng)AI浪潮拍岸,他們卻因為成本、技術(shù)、人才、運維等方方面面的問題而在智能化升級上舉步維艱。

昇騰面向中小微企業(yè)以及學(xué)校、醫(yī)院等機構(gòu)需要快速部署、快速落地AI應(yīng)用的需求,使能運營商打造大模型應(yīng)用一體機,大開方便之門。

該方案巧妙打包量化、調(diào)優(yōu)等工具鏈,將部署效率大幅提升50%;借助MLA(Multi-Head Latent Attention)親和等卓越特性,吞吐性能更是飆升90%;支持vLLM,將推理應(yīng)用業(yè)務(wù)上線周期縮短至天級,真正實現(xiàn)了從模型部署到應(yīng)用上線的“即開即用”。這大大降低了AI部署的門檻,讓智能化不再是大型企業(yè)的專屬,而是惠及每一家企業(yè)、每一個組織。

目前,已有超140家合作伙伴基于昇騰發(fā)布大模型應(yīng)用一體機產(chǎn)品,應(yīng)用場景廣泛覆蓋醫(yī)療、教育、金融、制造等多個領(lǐng)域。

寫在最后:昇騰為舟,駛向星辰大海

站在2025年的門檻回望,AI發(fā)展軌跡清晰可辨:從ChatGPT的現(xiàn)象級破圈到DeepSeek的全民普及,再到昇騰大EP集群的工程化突破,AI正由錦上添花的“技術(shù)盆景”蛻變真正驅(qū)動經(jīng)濟增長的“水電煤”!肮仓䦂詫嵵撬愕鬃,加速行業(yè)智能化”的演講主題,或許是對昇騰使命的最佳注解。

“單木不成林,眾木自成春”。在生態(tài)方面,昇騰圍繞“硬件、算子、加速庫、模型、應(yīng)用”五大方向,已聯(lián)合伙伴開發(fā)了160多個高性能算子、孵化40多個大模型和380多個應(yīng)用,全流程使能大模型從創(chuàng)新到落地。在行業(yè)應(yīng)用上,昇騰已經(jīng)聯(lián)合2500多家應(yīng)用伙伴、共同孵化了5800多個行業(yè)解決方案,加速了大模型在各行各業(yè)的規(guī)模應(yīng)用。

當(dāng)技術(shù)創(chuàng)新與生態(tài)協(xié)同形成共振,AI產(chǎn)業(yè)的未來必將如星河般璀璨。

版權(quán)說明:C114刊載的內(nèi)容,凡注明來源為“C114通信網(wǎng)”或“C114原創(chuàng)”皆屬C114版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來源。編譯類文章僅出于傳遞更多信息之目的,不代表證實其描述或贊同其觀點;翻譯質(zhì)量問題請指正。

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網(wǎng)版權(quán)所有 舉報電話:021-54451141 用戶注銷