依據(jù)IDC發(fā)布的《中國智算服務(wù)市場(2023下半年)跟蹤》報告,我國智算服務(wù)市場的增量幾乎全部來自GenAI IaaS和智算集成服務(wù)。其中,GenAI IaaS市場由火山引擎、阿里巴巴和商湯科技等引領(lǐng),智算集成服務(wù)市場則是華為一家獨大,呈現(xiàn)出與公有云和IT集成服務(wù)截然不同的市場格局,但又遵循著與云服務(wù)類似的發(fā)展規(guī)律。
我國智算服務(wù)市場格局
據(jù)IDC統(tǒng)計,2023年下半年,我國智算服務(wù)1市場整體規(guī)模達到114.1億元,同比增長85.8%。其中,GenAI IaaS市場呈0到1式增長,規(guī)模達到32.2億元,為整體智算服務(wù)貢獻了59%的增量;Non-GenAI IaaS市場緩慢增長至45.9億元,僅貢獻3%的增量;智算集成服務(wù)2受各地政府大力推進智算中心建設(shè)等因素驅(qū)動,市場規(guī)模達到36.0億元,同比增長129.4%,貢獻了38%的增量。
競爭格局方面,火山引擎、商湯科技和華為的表現(xiàn)引人注目。
GenAI IaaS市場:火山引擎、阿里巴巴、商湯科技、百度和騰訊占據(jù)前五位,份額合計約70%,市場集中度與公有云IaaS相近。其中,火山引擎和商湯科技這兩家并不屬于公有云第一梯隊的廠商,份額分別達到21%和15%,這意味著生成式AI或?qū)⒋呱碌脑凭揞^。
智算集成服務(wù)市場:華為、新華三、百度、寒武紀和中國電子云占據(jù)前五位,份額合計約55%,市場集中度遠高于IT咨詢與集成服務(wù)以及定制化開發(fā)服務(wù)等市場(CR5僅為15%~20%)。其中,華為獨占超過45%的份額,成為絕對霸主;百度、寒武紀、中國電子云等主營業(yè)務(wù)各異的非傳統(tǒng)系統(tǒng)集成服務(wù)廠商,也分別取得了2%上下的份額。這或許說明與傳統(tǒng)IT服務(wù)相比,智算集成服務(wù)更加要求供應(yīng)商在資源和服務(wù)等方面擁有差異化優(yōu)勢。
TOP廠商的核心競爭力
1.火山引擎:背靠字節(jié)跳動,火山終于“爆發(fā)”
作為字節(jié)跳動旗下的云廠商,火山引擎依托豐沛智算資源、領(lǐng)先萬卡集群和開放模型平臺等在2023年實現(xiàn)高速擴張,同比增速超過150%,并正通過進一步激發(fā)應(yīng)用生態(tài)為增長飛輪注入更多動能。
豐沛智算資源:在人工智能被打上“落地變緩”“負增長”等這些標簽的2022年,火山引擎為滿足抖音等字節(jié)跳動自有業(yè)務(wù),以及自動駕駛和生物信息計算等新興領(lǐng)域頭部客戶的需求,持續(xù)囤積智算資源,順理成章地在生成式AI爆發(fā)且算力供不應(yīng)求的情況下,成為了智譜AI、月之暗面、Minimax、零一萬物和百川智能等一眾AI初創(chuàng)公司的算力底座。
萬卡集群技術(shù):隨模型參數(shù)量從千億邁向萬億,以及推理需求不斷增長,大模型的算力要求升級,高效率且高穩(wěn)定的萬卡集群成為新一輪智算基礎(chǔ)設(shè)施競賽的必選項。字節(jié)跳動聯(lián)合北京大學(xué)發(fā)表論文3,針對在萬卡集群上訓(xùn)練大模型的效率和穩(wěn)定性問題提出MegaScale生產(chǎn)系統(tǒng)。論文顯示,在12288塊GPU上訓(xùn)練1750億參數(shù)大語言模型時,MegaScale實現(xiàn)了55.2%的算力利用率(MFU),是英偉達Megatron-LM的1.34倍。
開放模型平臺:與阿里云、百度智能云等先卷大模型不同,火山引擎首先將匯聚和開放第三方大模型作為重點,推出火山方舟MaaS平臺。通過搭建模型需求端和供給側(cè)間的橋梁,火山引擎在幫助模型廠商拓展客戶的同時也實現(xiàn)了自身收入增長。
激發(fā)應(yīng)用生態(tài):隨AI大模型的普及度和滲透率不斷提升,推理工作負載將遠大于訓(xùn)練工作負載;鹕揭婵礈蔬@一趨勢,將字節(jié)跳動豆包大模型的推理輸入價格降至0.8厘/千tokens,以期降低客戶試錯成本,繁榮AI應(yīng)用生態(tài)。
2.商湯科技:大裝置發(fā)揮大作用
商湯科技2014年以視覺AI起家,2018年開始打造由模型層、深度學(xué)習(xí)平臺和計算基礎(chǔ)設(shè)施等三部分構(gòu)成的AI基礎(chǔ)設(shè)施——SenseCore商湯AI大裝置。依托大裝置,商湯科技不僅對外提供豐富的AI云產(chǎn)品和行業(yè)解決方案,也實現(xiàn)了自有“日日新”大模型體系的高速迭代。在“大裝置+大模型”驅(qū)動下,商湯科技2023年生成式AI收入突破11.8億元,同比增長近200%。
前瞻性布局智算中心:商湯科技2020年起陸續(xù)在上海、深圳、廣州、福州、濟南和重慶等多地建設(shè)智算中心,截至2023年底,上線GPU數(shù)量達到45000張,總運營算力達到12 EFLOPS。其中,上海臨港智算中心于2020年啟動建設(shè),2022年正式運營,24年4月算力規(guī)模達到8.1 EFLOPS,位居我國乃至全球前列。
打造高效穩(wěn)定萬卡集群:商湯科技已實現(xiàn)萬卡互聯(lián),集群線性加速比超過90%,同時保證超30天穩(wěn)定訓(xùn)練不間斷和訓(xùn)練間斷半小時恢復(fù)。
高性價比推理服務(wù):商湯科技2023年將推理服務(wù)性價比提升300%,大幅降低大模型推理單位成本。
3.華為:領(lǐng)先芯片和全棧服務(wù)顯身手
領(lǐng)先AI芯片:在美不斷升級對華半導(dǎo)體出口管制和我國信創(chuàng)進程加速的背景下,華為昇騰910B作為少數(shù)可與英偉達A100等海外高端GPU抗衡的國產(chǎn)AI芯片之一,是華為得以拿下眾多智算中心建設(shè)項目的殺手锏。
全棧智算服務(wù):基于30余年的ICT服務(wù)經(jīng)驗,華為已形成從規(guī)劃、集成、運維到模型使能和人才培養(yǎng)等的端到端智算集成服務(wù),幫助客戶建好和用好智算基礎(chǔ)設(shè)施。
運營商競爭策略
回顧云服務(wù)發(fā)展歷程,1.0階段,亞馬遜和阿里巴巴等互聯(lián)網(wǎng)大廠將自有資源和技術(shù)向其他互聯(lián)網(wǎng)企業(yè)開放,順利打開市場;2.0階段,中國電信等運營商抓住政企上云機遇,憑借不斷提升的技術(shù)實力和長年累積的服務(wù)經(jīng)驗實現(xiàn)規(guī)模擴張。
如今,智算服務(wù)1.0因“百模大戰(zhàn)”開啟,火山引擎和商湯科技等對智算資源和技術(shù)早有儲備的企業(yè)占得市場先機。面對將由行業(yè)大模型帶動的智算服務(wù)2.0,運營商已從資源、技術(shù)、產(chǎn)品和服務(wù)等多方面做好準備,如中國電信規(guī)劃并建設(shè)覆蓋全國的“2+3+7+X”公共智算云池,打造國產(chǎn)萬卡智算集群,加快構(gòu)建“息壤”一體化智算服務(wù)體系和能力等。
然而,由于其他智算服務(wù)提供商,如AI企業(yè)、互聯(lián)網(wǎng)/云廠商和其他央國企等,多同樣具備政企服務(wù)經(jīng)驗,因此運營商在智算服務(wù)2.0將面臨比云服務(wù)2.0更為嚴峻的競爭環(huán)境。建議:
一是強化安全可信,針對在AI時代被進一步放大的數(shù)據(jù)(含算法、代碼等)隱私與安全問題,依托機密計算4等技術(shù),打造可在AI全生命周期內(nèi)保障數(shù)據(jù)和模型等的機密性與完整性的智算基礎(chǔ)設(shè)施,讓客戶安心使用AI IaaS;
二是繁榮模型生態(tài),秉持開放共贏理念,幫助自研和第三方模型、MaaS平臺與AI應(yīng)用等觸達客戶;
三是升級集成服務(wù),理解與把握政企客戶對智算基礎(chǔ)設(shè)施的當下和長遠需求,提供從建到用再到后續(xù)升級的高水平全棧服務(wù)。
注釋:
1.IDC將智算服務(wù)定義為以GPU、FPGA、ASIC等AI專用算力為主的基礎(chǔ)設(shè)施服務(wù),主要包括智算集成服務(wù)和智算基礎(chǔ)設(shè)施即服務(wù)(AI IaaS)。其中,AI IaaS市場又分為面向生成式AI的GenAI IaaS和面向渲染、仿真、視聯(lián)網(wǎng)推理等非生成式AI的Non-GenAI IaaS等兩個細分市場。
2.智算集成服務(wù)指廠商在幫助客戶建設(shè)私有智算基礎(chǔ)設(shè)施過程中提供的咨詢、集成、開發(fā)、運維等專業(yè)和管理服務(wù)。
3.《MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs》。
4.機密計算是一種通過在基于硬件的可信執(zhí)行環(huán)境(TEE)中執(zhí)行計算來保護使用中的數(shù)據(jù)的技術(shù)。
本文作者
魏玥
戰(zhàn)略發(fā)展研究所
副主任分析師
碩士,高級工程師,長期從事ICT產(chǎn)業(yè)研究,近年來專注云計算、人工智能、產(chǎn)業(yè)數(shù)字化等領(lǐng)域。