C114通信網(wǎng)  |  通信人家園

人工智能
2024/10/11 10:13

解析Advancing AI 2024:端到端AI,AMD開啟下一個黃金十年

C114通信網(wǎng)  岳明

C114訊 10月11日消息(岳明)讓我們把時鐘撥回到7年前,2017年6月,AMD推出了公司面向數(shù)據(jù)中心市場的EPYC系列,憑借多核設(shè)計(jì)、PCIe 擴(kuò)展選項(xiàng)以及原始內(nèi)存帶寬等優(yōu)勢,EPYC開始展露頭腳。

七年后的今天,AMD EPYC CPU市場份額已經(jīng)從原來的不足2%,持續(xù)成長到今年上半年的34%,七年之內(nèi)實(shí)現(xiàn)了17倍的份額提升!但這顯然不是AMD的終極目標(biāo)。

在本周舉行的Advancing AI 2024大會上,AMD董事會主席兼首席執(zhí)行官蘇姿豐博士指出,“展望未來,我們看到,2028年,數(shù)據(jù)中心、人工智能、加速器市場將增長至5000億美元。通過我們擴(kuò)展的芯片、軟件、網(wǎng)絡(luò)和集群級解決方案,我們致力于提供大量開放式創(chuàng)新!

端到端的AI,這將是AMD的新戰(zhàn)場,而且AMD已經(jīng)做好了全方位的準(zhǔn)備。

全方位升級第五代EPYC處理器重磅登場

作為AMD的明星產(chǎn)品,在今天的Advancing AI 2024大會上,AMD正式發(fā)布了家族代號為“Turin”的第五代EPYC處理器,全系采用臺積電3/4nm制程工藝打造,最高支持192核384線程,頻率最高達(dá)到5GHz,AVX512指令集支持完整的512位寬的數(shù)據(jù)路徑,整體IPC提升17%,并且兼容現(xiàn)有的SP5平臺,在密度、能效、寬開路堆棧方面實(shí)現(xiàn)了全方位升級。

具體來看,得益于Zen5架構(gòu)高度的靈活性,第五代EPYC處理器在架構(gòu)封裝方面更為靈活。既能夠打造出最高16個Zen5 CCD的128核256核全大核處理器,也能夠打造出最高12個Zen5c CCD的192核384線程的全小核處理器,可以為不同客戶提供豐富的、多元化的選擇。

同時,第五代EPYC處理器家族在ISA和IPC方面得到提升,其核心數(shù)量從8核延展到192核心,TDP從155W到500W,并且升級支持12通道DDR5-6400內(nèi)存,支持128 PCIe5.0/CXL 2.0,并且提供更高度安全性的I/O。

以全新的AMD EPYC 9005系列處理器中的EPYC 9965為例,對比英特爾相關(guān)產(chǎn)品,SPEC CPU 2017整數(shù)吞吐量是其2.7倍;在視頻轉(zhuǎn)碼、商用APP、開源數(shù)據(jù)庫、圖片渲染等工作負(fù)載性能方面,最高達(dá)到了4倍的性能提升;企業(yè)級HPC性能方面,性能提升3.9倍;基于CPU的AI性能提升3.8倍,Llama3.1-70B大模型為基準(zhǔn)的GPU Host節(jié)點(diǎn)提升1.2倍。

在數(shù)據(jù)中心服務(wù)器升級換代方面,第五代EPYC的升級難度以及成本相對更低。1000臺老舊英特爾至強(qiáng)白金8280服務(wù)器可以用131臺EPYC 9965服務(wù)器替代,能耗僅為原來的68%,服務(wù)器數(shù)量減少87%,3年TCO降低67%,可以有效幫助企業(yè)用戶節(jié)約空間與能耗。

根基已穩(wěn)AMD Instinct穩(wěn)步前行

作為智算算力的重要載體,GPU是市場關(guān)注的焦點(diǎn);作為為數(shù)不多能與英偉達(dá)正面抗衡的廠商,AMD在AI加速器市場的舉措,無疑備受關(guān)注。

在Advancing AI 2024大會上,AMD也拿出了自己的誠意,正式發(fā)布了更新版本的Instinct MI325X加速器。

作為MI300X的升級版本GPU,MI325X配置了288GB HBM3E內(nèi)存和6TB/秒的內(nèi)存帶寬;也正是因?yàn)樵趦?nèi)存和帶寬方面的優(yōu)化,AMD Instinct MI325X在多個模型的推理表現(xiàn)領(lǐng)域優(yōu)于英偉達(dá)H200。

AMD提供的測試數(shù)據(jù)顯示,在多個模型的推理表現(xiàn)領(lǐng)域,AMD Instinct MI325X優(yōu)于英偉達(dá)H200。在訓(xùn)練方面,無論是在單GPU還是在8 GPU的Meta Llama-2訓(xùn)練場景,AMD Instinct MI325X平臺的表現(xiàn)也都優(yōu)于英偉達(dá)H200。

對于芯片廠商而言,清晰明確是技術(shù)路線圖是取信于用戶與市場的關(guān)鍵。AMD Instinct 加速器的下一代產(chǎn)品——AMD Instinct MI350系列應(yīng)該將于2025年面世;AMD Instinct MI400系列或?qū)⒂?026年亮相。

與前兩代產(chǎn)品不同,AMD Instinct MI350系列產(chǎn)品預(yù)計(jì)基于AMD CDNA 4架構(gòu)設(shè)計(jì);同時,AMD Instinct MI350系列產(chǎn)品還將使用了先進(jìn)的3nm工藝技術(shù)構(gòu)建,搭載高達(dá)288 GB的HBM3E內(nèi)存,并支持FP4和FP6 AI數(shù)據(jù)類型,進(jìn)一步提升了整體的性能表現(xiàn)。

同時,為了降低開發(fā)者的使用門檻,AMD還將持續(xù)更新其ROCm系列,推動最廣泛使用的AI框架、庫和模型對AMD計(jì)算引擎的支持,最終實(shí)現(xiàn)AMD Instinct加速器在流行的生成 AI 模型(如 Stable Diffusion 3、Meta Llama3、3.1 和 3.2 以及 Hugging Face 上的一百多萬個模型)上的開箱即用的性能和支持。

加速AI網(wǎng)絡(luò)擴(kuò)展以太網(wǎng)+DPU+AI NIC將是“神組合”

談到AI,可能很多人的第一反應(yīng)是CPU/GPU,是算力短缺;但實(shí)際上,網(wǎng)絡(luò)正在成為制約AI系統(tǒng)性能的關(guān)鍵,平均30%的訓(xùn)練時間被用來等待聯(lián)網(wǎng);而在分布式推理中,通信更是占40%-75%的時間。這對于動輒部署萬卡集群的用戶而言是難以承受的。

如何去構(gòu)建這張網(wǎng)絡(luò),在此次Advancing AI 2024大會上,AMD給出的答案是以太網(wǎng)+DPU+AI NIC。在此次大會上,AMD正式發(fā)布了基于P4引擎的第三代DPU產(chǎn)品Pensando Salina 400以及Pensando Pollara 400。

Pensando Salina 400是一個面向前端網(wǎng)絡(luò)的DPU,也是是全球性能最高、可編程性最強(qiáng)的DPU產(chǎn)品。與上一代產(chǎn)品相比,其性能、帶寬和規(guī)模提高了2倍。同時,該DPU還支持400G吞吐量以實(shí)現(xiàn)快速數(shù)據(jù)傳輸速率,可優(yōu)化數(shù)據(jù)驅(qū)動型 AI 應(yīng)用的性能、效率、安全性和可擴(kuò)展性。

Pensando Pollara 400則是業(yè)內(nèi)首個UEC ready AI NIC,支持下一代RDMA軟件和開放的網(wǎng)絡(luò)生態(tài)系統(tǒng),可以在后端網(wǎng)絡(luò)中提供加速器到加速器通信的領(lǐng)先性能、可擴(kuò)展性和效率。在產(chǎn)品上市時間方面,Pensando Salina DPU和Pensando Pollara 400 均在今年第四季度向客戶提供樣品,并有望在明年上半年上市。

聚焦商用PC市場銳龍 AI PRO 300實(shí)現(xiàn)端到端AI

對于企業(yè)級用戶而言,AI不能飄在空中。作為當(dāng)前最主要的生產(chǎn)力工具,PC則是實(shí)現(xiàn)AI落地的最佳載體。

在Advancing AI 2024大會上上,AMD就正式推出了面向移動商用市場的銳龍AI PRO 300系列,搶占商用AI PC市場的先機(jī)。

作為首款專為企業(yè)Copilot+PC而設(shè)計(jì)的芯片,銳龍AI PRO 300 CPU部分采用Zen 5架構(gòu),NPU采用XDNA 2架構(gòu),GPU采用RDNA 3.5架構(gòu)。其中NPU算力提升到至高55 TOPS,完全滿足微軟Copilot+PC 40 TOPS以上的條件。

為了滿足多個應(yīng)用場景的需求,AMD 銳龍AI PRO 300提供了三個SKU供選擇。與競爭對手的同類型產(chǎn)品相比,銳龍AI PRO 300系列的表現(xiàn)全面領(lǐng)先。例如在與Intel Core Ultra 7 165U相比時,AMD銳龍AI 7 PRO 360的CPU性能領(lǐng)先30% ;與Intel Core Ultra 7 165H相比時,銳龍AI 9 HX PRO 375 CPU的性能更是領(lǐng)先40%。

作為終端生產(chǎn)力工具,續(xù)航能力同樣非常重要。由于采用了領(lǐng)先的4nm制程,搭載這款移動商用處理器的AI PC一般使用時間可達(dá)23小時;連續(xù)使用Microsoft Teams進(jìn)行視頻會議,續(xù)航也可超過9小時。

寫在最后

面向確定性的AI未來,無論是CPU、GPU、DPU,還是軟件,或亦是網(wǎng)絡(luò)和集群解決方案,AMD已經(jīng)做好了準(zhǔn)備,開啟新的黃金十年。正如蘇姿豐博士在社交媒體上所言:“10年前,我有幸被任命為AMD的首席執(zhí)行官。這是一段令人難以置信的旅程,有很多值得驕傲的時刻。今天,我要感謝全球的AMD團(tuán)隊(duì)所做的一切。盡管過去的10年令人驚嘆,但最好的還在后面!

給作者點(diǎn)贊
0 VS 0
寫得不太好

版權(quán)說明:凡注明來源為“C114通信網(wǎng)”的文章皆屬C114版權(quán)所有,除與C114簽署內(nèi)容授權(quán)協(xié)議的單位外,其他單位未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。如需使用,請聯(lián)系021-54451141。其中編譯類僅出于傳遞更多信息之目的,系C114對海外相關(guān)站點(diǎn)最新信息的翻譯稿,僅供參考,不代表證實(shí)其描述或贊同其觀點(diǎn),投資者據(jù)此操作,風(fēng)險自擔(dān);翻譯質(zhì)量問題請指正

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141