C114訊 9月19日午間消息(蔣均牧)面對一窩蜂堆算力、言必大模型的企業(yè)人工智能發(fā)展現(xiàn)狀,華為副董事長、輪值董事長徐直軍在華為全聯(lián)接大會2024上旗幟鮮明地指出,不是每個企業(yè)都需要建設(shè)大規(guī)模AI算力、都要訓練自己的基礎(chǔ)大模型,也不是所有的應用都要追求“大模型”。
首先,大規(guī)模AI算力建設(shè)存在著機房改造難、性能發(fā)揮難、運營維護難等難點。大規(guī)模AI算力集群堆供電、散熱等數(shù)據(jù)中心機房環(huán)境要求高、改造難度大,同時隨著AI算力需求的持續(xù)增加和AI服務器的升級換代,機房將面臨持續(xù)改造;AI硬件迭代速度快,平均一到兩年就有新的硬件產(chǎn)品推出,受限于每個代際的算力規(guī)模,企業(yè)需要多個代際產(chǎn)品混合使用來訓練一個大模型,資源調(diào)度復雜,帶來性能“木桶短板”問題,新一代產(chǎn)品性能難以充分發(fā)揮;AI技術(shù)還處于成長期,技術(shù)變化快,多代際產(chǎn)品共存,對技能要求高,導致運營維護困難。
其次,基礎(chǔ)大模型訓練面臨數(shù)據(jù)準備難、模型訓練難、人才獲取難等問題;A(chǔ)大模型預訓練數(shù)據(jù)量進入10萬億tokens量級,這對于企業(yè)來說,不僅意味著高成本,同時是否能獲取到足夠的數(shù)據(jù)量也是挑戰(zhàn);基礎(chǔ)大模型參數(shù)量在持續(xù)增大,模型迭代和優(yōu)化難度大,通常需要數(shù)月到數(shù)年時間完成模型迭代訓練,影像AI盡快賦能核心業(yè)務;基礎(chǔ)大模型涉及的相關(guān)技術(shù)每天都在更新,具備實戰(zhàn)經(jīng)驗的技術(shù)專家少,對于企業(yè)來說,建立足夠的技術(shù)人才資源也是挑戰(zhàn)。
此外,從盤古大模型的行業(yè)實踐來看,企業(yè)應根據(jù)不同業(yè)務場景需求匹配不同規(guī)格的模型,通過多模型組合來解決問題、創(chuàng)造價值。十億參數(shù)模型面向科學計算、科研決策等業(yè)務場景以及端側(cè)場景,例如降雨預測、藥物分子優(yōu)化、手機端通話助手;百億參數(shù)模型面向NLP、CV、多模態(tài)等特定領(lǐng)域任務,例如知識問答、代碼生成、金融坐席助手;千億參數(shù)模型面向NLP、多模態(tài)的復雜任務以及作為中樞調(diào)度,例如信貸評估、智能投顧、多模型調(diào)度。
徐直軍指出,對于很多企業(yè)來說,云服務是更為合理的、可持續(xù)的選擇。華為云面向AI全棧升級,賦能千行百業(yè)智能化,讓每個企業(yè)都能按需高效地訓練模型和應用模型推理。華為通過持續(xù)打造昇騰云服務,讓AI算力觸手可及;通過不斷升級ModelArts Studio模型即服務,讓企業(yè)不必從零開始訓練基礎(chǔ)大模型;通過盤古大模型5.0和百模千態(tài)社區(qū),讓企業(yè)能夠根據(jù)業(yè)務場景選擇最適合的模型。此外,華為云還提供從理念、機制、技術(shù)到知識產(chǎn)權(quán)的體系化安全能力,全面保障大模型訓練、推理安全。