C114訊 9月18日消息(九九)“AI應(yīng)用層出不窮,算力技術(shù)飛速提升,存儲(chǔ)技術(shù)和產(chǎn)品發(fā)展相對(duì)緩慢,成為AI大模型訓(xùn)練過程中的性能瓶頸。”在日前舉行的2024開放數(shù)據(jù)中心大會(huì)(ODCC)上,江波龍企業(yè)級(jí)存儲(chǔ)事業(yè)部高級(jí)市場(chǎng)總監(jiān)曹潯峰在接受C114專訪時(shí)如是說。
從ChatGPT火遍全球到Sora橫空出世,AI的進(jìn)化與普及日新月異。曹潯峰指出,在此過程中,大模型參數(shù)呈指數(shù)級(jí)增長(zhǎng),據(jù)市場(chǎng)機(jī)構(gòu)分析,兩年增加410倍,“GPU算力8年增長(zhǎng)1000倍”,與之形成鮮明對(duì)比的是,GPU內(nèi)存僅以每2年2倍的速度擴(kuò)展。緩存的容量和性能跟不上AI算力的提升。
作為在存儲(chǔ)市場(chǎng)深耕25年的“老兵”,江波龍如何迎戰(zhàn)算力產(chǎn)業(yè)發(fā)展的新趨勢(shì)?曹潯峰在訪談中分享了對(duì)于AI應(yīng)用數(shù)據(jù)存儲(chǔ)優(yōu)化的思考,大模型AI應(yīng)用下江波龍的企業(yè)級(jí)產(chǎn)品矩陣,并深度解讀了江波龍新近提出的PTM(存儲(chǔ)產(chǎn)品技術(shù)制造)模式:集芯片設(shè)計(jì)、固件開發(fā)、技術(shù)定制、封裝測(cè)試、生產(chǎn)制造于一體,實(shí)現(xiàn)從標(biāo)準(zhǔn)化產(chǎn)品到存儲(chǔ)產(chǎn)品一站式服務(wù)的升級(jí)跨越,打造價(jià)值合作新范式。
創(chuàng)新存儲(chǔ)技術(shù)與產(chǎn)品,迎戰(zhàn)萬卡AI訓(xùn)練集群
江波龍擁有嵌入式存儲(chǔ)、固態(tài)硬盤(SSD)、移動(dòng)存儲(chǔ)及內(nèi)存條四大產(chǎn)品線。產(chǎn)品廣泛應(yīng)用于主流消費(fèi)類智能終端(如智能手機(jī)、可穿戴設(shè)備、電腦等)、數(shù)據(jù)中心、汽車電子、物聯(lián)網(wǎng)、安防監(jiān)控、工業(yè)控制等領(lǐng)域,以及個(gè)人消費(fèi)類存儲(chǔ)零售市場(chǎng)。隨著AI的爆發(fā),江波龍基于自身產(chǎn)業(yè)能力與時(shí)俱進(jìn),創(chuàng)新存儲(chǔ)技術(shù)與產(chǎn)品滿足多樣化的市場(chǎng)要求。
在AI應(yīng)用實(shí)踐中,原始數(shù)據(jù)需經(jīng)過精細(xì)的清洗和預(yù)處理,轉(zhuǎn)化為高質(zhì)量的數(shù)據(jù)集,進(jìn)而通過網(wǎng)絡(luò)傳輸至AI服務(wù)器的本地SSD存儲(chǔ),并最終upload至GPU HBM緩存中進(jìn)行訓(xùn)練。曹潯峰指出,隨著AI訓(xùn)練模型參數(shù)量的增長(zhǎng),現(xiàn)有HBM緩存和系統(tǒng)內(nèi)存RDIMM容量已難以滿足需求。“采用高性能、大容量的CXL存儲(chǔ)器或8x GPU卡AI服務(wù)器,將是理想的緩存優(yōu)化解決方案。”
大模型需要大算力,大算力需要大集群。據(jù)悉,江波龍正積極探索支持AIC和E3.S的JBOM系統(tǒng),并結(jié)合即將到來的支持CXL2.0服務(wù)器系統(tǒng),為萬卡AI訓(xùn)練集群提供更具成本效益的內(nèi)存池化共享硬件解決方案。
曹潯峰介紹,江波龍基于CXL協(xié)議研發(fā)了兩款存儲(chǔ)方案:E3.S形態(tài)CXL2.0內(nèi)存拓展模塊最大支持192GB容量,能夠適配參數(shù)量在萬億級(jí)別以下的大模型,相比業(yè)界同期水平實(shí)現(xiàn)成本大幅下降的優(yōu)勢(shì);針對(duì)10萬億參數(shù)規(guī)模的大模型,江波龍升級(jí)研發(fā)了AIC形態(tài)、最大支持512GB內(nèi)存的拓展模塊,目前正在與一些國(guó)家級(jí)實(shí)驗(yàn)室做聯(lián)合測(cè)試,面市后將進(jìn)一步推動(dòng)AI應(yīng)用的存儲(chǔ)優(yōu)化。
打造企業(yè)級(jí)產(chǎn)品矩陣,攻關(guān)產(chǎn)品可靠性和穩(wěn)定性
數(shù)據(jù)中心是存儲(chǔ)產(chǎn)品的重要應(yīng)用領(lǐng)域,特別是隨著算力的極速發(fā)展,數(shù)據(jù)中心成為更具潛力的存儲(chǔ)市場(chǎng)。曹潯峰介紹,江波龍從2020年開始投入用于數(shù)據(jù)中心企業(yè)級(jí)存儲(chǔ)產(chǎn)品的研發(fā),截至目前已成功構(gòu)建了完整的企業(yè)級(jí)存儲(chǔ)布局,推出包括企業(yè)級(jí)PCIe 4.0 NVMe SSD、企業(yè)級(jí)SATA SSD、企業(yè)級(jí)RDIMM、CXL 2.0內(nèi)存拓展模塊在內(nèi)的多款高性能產(chǎn)品。
曹潯峰指出,對(duì)于AI服務(wù)器,企業(yè)級(jí)SSD的高性能和大容量特性,能夠有效支持復(fù)雜的機(jī)器學(xué)習(xí)模型訓(xùn)練、數(shù)據(jù)分析和內(nèi)容生成等AI應(yīng)用,加速AI計(jì)算過程,提高整體的系統(tǒng)效率和智能分析能力。同時(shí),隨著AI服務(wù)器計(jì)算密度的顯著提升,單機(jī)的功耗密度也相應(yīng)增加,不僅對(duì)服務(wù)器的能源管理提出了更高要求,也加速了SSD取代傳統(tǒng)機(jī)械硬盤(HDD)的進(jìn)程,以實(shí)現(xiàn)更優(yōu)的能效比。
曹潯峰進(jìn)一步指出,AI訓(xùn)練應(yīng)用主要涉及順序讀寫操作,QLC SSD在順序讀寫性能上與TLC相近,且成本更具優(yōu)勢(shì)。隨著PCIe Gen5帶寬的提升,QLC技術(shù)完全能夠滿足AI訓(xùn)練過程中Checkpoint數(shù)據(jù)存儲(chǔ)的高帶寬高并發(fā)需求,預(yù)示著QLC SSD有望成為大語言模型AI訓(xùn)練應(yīng)用的更優(yōu)選擇。曹潯峰介紹,江波龍未來有望推出更具有性價(jià)比的QLC SSD產(chǎn)品。
曹潯峰強(qiáng)調(diào):“對(duì)于企業(yè)級(jí)產(chǎn)品而言,性能并不是唯一的指標(biāo),更為關(guān)鍵的是產(chǎn)品的可靠性和穩(wěn)定性。”江波龍對(duì)此投入巨大,通過顆粒研究和測(cè)試算法等手段將產(chǎn)品的抖動(dòng)降至最低,可靠性和穩(wěn)定性具有較大的競(jìng)爭(zhēng)優(yōu)勢(shì)。”
從標(biāo)準(zhǔn)化到定制化,PTM模式為客戶提供全棧式服務(wù)和一站式交付
訪談中,曹潯峰重點(diǎn)介紹了江波龍新近提出的PTM(存儲(chǔ)產(chǎn)品技術(shù)制造)模式,該模式的核心在于將公司的自研存儲(chǔ)控制芯片、自研固件和硬件以及自有的先進(jìn)封測(cè)制造等技術(shù)優(yōu)勢(shì)進(jìn)行無縫銜接,實(shí)現(xiàn)更靈活、高效的全棧式定制化服務(wù)和一站式交付。
不難看出,PTM模式的兩個(gè)關(guān)鍵詞分別是“全棧式定制”和“一站式交付”。與這種創(chuàng)新的商業(yè)模式相匹配的是江波龍布局多年的自主研發(fā)與智能制造能力,以及隨之構(gòu)建的高端存儲(chǔ)全棧能力。“存儲(chǔ)全棧式定制服務(wù)就像高級(jí)西裝的量身定制,每一細(xì)節(jié)都經(jīng)過一對(duì)一精心打造,確保每款產(chǎn)品方案‘裁剪’出來都能貼合、匹配客戶的獨(dú)特需求。”曹潯峰說。
在技術(shù)領(lǐng)域,江波龍擁有自主研發(fā)NAND Flash芯片、主控芯片、固件和硬件的能力,并采用多顆粒類型產(chǎn)品布局,能夠根據(jù)客戶的特定技術(shù)需求提供定制化的存儲(chǔ)解決方案。此外,江波龍匯聚了眾多行業(yè)資深專家,積累了豐富的技術(shù)經(jīng)驗(yàn),特別是在顆粒研究、測(cè)試算法和設(shè)備開發(fā)等方面,能夠深入分析NAND Flash和DRAM的特性,并與客戶預(yù)先確認(rèn)技術(shù)需求。通過建立專業(yè)、專項(xiàng)的FAE+AE+R&D團(tuán)隊(duì),PTM商業(yè)模式能夠幫助企業(yè)級(jí)客戶高效實(shí)現(xiàn)產(chǎn)品創(chuàng)新和大幅成本優(yōu)化,從而提升客戶的業(yè)務(wù)競(jìng)爭(zhēng)力。
在制造方面,江波龍通過在中山存儲(chǔ)產(chǎn)業(yè)園、蘇州和南美洲封裝測(cè)試基地的國(guó)內(nèi)、海外雙循環(huán)產(chǎn)業(yè)鏈布局,實(shí)現(xiàn)了從存儲(chǔ)芯片到模組產(chǎn)品的全鏈條覆蓋。不僅保證了業(yè)內(nèi)領(lǐng)先的企業(yè)級(jí)生產(chǎn)產(chǎn)能,還實(shí)現(xiàn)了高效的全站點(diǎn)追溯能力,如同餐廳的開放式廚房,確保每道工序都可視化、透明化,讓客戶對(duì)產(chǎn)品品質(zhì)和生產(chǎn)流程擁有更為清晰而直觀的了解。
通過上述綜合措施,PTM商業(yè)模式已經(jīng)實(shí)現(xiàn)了從技術(shù)到制造再到產(chǎn)品的全方位支持,成功為華勤等客戶提供定制化的一站式交付產(chǎn)品,產(chǎn)品性價(jià)比得到客戶高度評(píng)價(jià)。
對(duì)于存儲(chǔ)產(chǎn)品未來的發(fā)展方向,曹潯峰認(rèn)為是存儲(chǔ)池化,以適應(yīng)AI大模型應(yīng)用發(fā)展的緩存需求。曹潯峰表示,江波龍將聚焦于開發(fā)性能更好、容量更大、成本更低存儲(chǔ)產(chǎn)品,并引入QLC NAND Flash作為資源補(bǔ)充,以滿足不同客戶的差異化需求,與產(chǎn)業(yè)鏈合作伙伴共同推動(dòng)算力產(chǎn)業(yè)進(jìn)步。