亞馬遜準備推出其最新的人工智能(AI)芯片,因為這家大型科技集團尋求從其數(shù)十億美元的半導(dǎo)體投資中獲得回報,并減少對市場領(lǐng)導(dǎo)者英偉達的依賴。
亞馬遜云計算部門的高管正在大舉投資定制芯片,希望提高其數(shù)十個數(shù)據(jù)中心的效率,最終降低其自身以及亞馬遜AWS客戶的成本。
這項工作由位于奧斯汀的芯片初創(chuàng)公司Annapurna Labs牽頭,亞馬遜于2015年初以3.5億美元收購了該公司。Annapurna的最新成果預(yù)計將于12月展示,屆時亞馬遜將宣布廣泛提供“Trainium 2”,這是旨在訓(xùn)練最大模型的AI芯片系列的一部分。
Trainium 2已經(jīng)在接受Anthropic(OpenAI的競爭對手,已獲得亞馬遜40億美元的支持)以及Databricks、德國電信、日本理光和Stockmark的測試。
亞馬遜AWS和Annapurna的目標是與英偉達競爭,后者憑借在AI芯片市場的主導(dǎo)地位,成為全球最有價值的公司之一。
“我們希望成為運行英偉達芯片的最佳場所,”亞馬遜AWS計算和網(wǎng)絡(luò)服務(wù)副總裁Dave Brown表示。“但與此同時,我們認為采用替代方案是有益的。”亞馬遜表示,其另一款專業(yè)AI芯片“Inferentia”的運行成本已經(jīng)降低40%,可用于生成式AI模型的響應(yīng)。
亞馬遜現(xiàn)在預(yù)計2024年資本支出約為750億美元,其中大部分用于技術(shù)基礎(chǔ)設(shè)施。在該公司最新的財報電話會議上,首席執(zhí)行官Andy Jassy表示,他預(yù)計該公司在2025年的支出將更多。
這比2023年全年支出484億美元有所增長。包括微軟和谷歌在內(nèi)的最大云提供商都在大舉投資人工智能,而且這種趨勢幾乎沒有減弱的跡象。
亞馬遜、微軟和Meta都是英偉達的大客戶,但它們也在設(shè)計自己的數(shù)據(jù)中心芯片,為他們所期待的AI增長浪潮奠定基礎(chǔ)。
Futurum Group的Daniel Newman表示:“每家大型云提供商都在狂熱地轉(zhuǎn)向更垂直化,如果可能的話,向同質(zhì)化和集成化的 ‘芯片技術(shù)’ 堆棧邁進。”
Newman指出:“從OpenAI到蘋果,每個人都在尋求打造自己的芯片”,因為他們尋求“更低的生產(chǎn)成本、更高的利潤率、更高的可用性和更多的控制力”。
在開始為AWS構(gòu)建“Nitro”安全芯片后,Annapurna已開發(fā)出幾代Graviton,這是基于Arm的中央處理器(CPU),為英特爾或AMD提供的傳統(tǒng)服務(wù)器主力機提供了低功耗替代方案。
TechInsights分析師G Dan Hutcheson表示:“AWS的一大優(yōu)勢是他們的芯片可以使用更少的電量,他們的數(shù)據(jù)中心可能可以更高效”,從而降低成本。他說,如果英偉達的圖形處理單元(GPU)是強大的通用工具(就汽車而言,如旅行車),那么亞馬遜可以針對特定任務(wù)和服務(wù)(如緊湊型或掀背車)優(yōu)化其芯片。
然而,到目前為止,AWS和Annapurna幾乎沒有削弱英偉達在AI基礎(chǔ)設(shè)施方面的主導(dǎo)地位。
英偉達在2024財年第二季度的AI數(shù)據(jù)中心芯片銷售收入達到263億美元。這一數(shù)字與亞馬遜在其第二財季宣布的整個AWS部門的收入相同。據(jù)稱,其中只有一小部分可以歸因于在Annapurna基礎(chǔ)設(shè)施上運行AI工作負載的客戶。
至于AWS芯片與英偉達芯片的原始性能,亞馬遜避免進行直接比較,也不會將其芯片提交給獨立的性能基準測試。
Moor Insights &Strategy芯片顧問Patrick Moorhead表示,他相信亞馬遜聲稱Trainium 1和Trainium 2之間的性能提升4倍的說法是準確的,因為他多年來一直在審查該公司。但性能數(shù)據(jù)可能不如簡單地為客戶提供更多選擇那么重要。
“人們欣賞英偉達帶來的所有創(chuàng)新,但沒有人愿意看到英偉達占據(jù)90%的市場份額。”他補充道,“這種情況不會持續(xù)太久。”