北京時間今日中午 12 時,馬斯克旗下人工智能公司 xAI 發(fā)布了其最新一代大模型 Grok 3。馬斯克稱,Grok 3 能力較前代產(chǎn)品 Grok 2 提升了“一個數(shù)量級”。
在數(shù)學(xué)推理、科學(xué)邏輯推理和代碼寫作等能力表現(xiàn)方面,Grok-3 在多項 benchmark 測試中均取得了比 DeepSeek-v3、GPT-4o、Gemini-2 pro 更優(yōu)的成績。馬斯克更是毫不吝嗇地稱贊 Grok 3 為“地球上最聰明的人工智能”。
據(jù)介紹,Grok 3 開發(fā)周期大幅縮短,這得益于其強(qiáng)大的 Colossus 超級計算機(jī)。據(jù)報道,Colossus 超級計算機(jī)僅用了八個月時間完成建設(shè),為 Grok 3 的開發(fā)提供了強(qiáng)大支持。Grok 3 使用了 10 萬個英偉達(dá) H100 GPU,累計訓(xùn)練時長達(dá)到 2 億 GPU 小時,這一規(guī)模是前代產(chǎn)品 Grok 2 的十倍。如此大規(guī)模的計算能力部署,使得 Grok 3 能夠在更短時間內(nèi)處理海量數(shù)據(jù)集,同時顯著提升了模型的準(zhǔn)確性。
xAI 團(tuán)隊不僅在硬件上進(jìn)行了升級,還在軟件層面進(jìn)行了優(yōu)化。Grok 3 通過改進(jìn)訓(xùn)練流程,引入合成數(shù)據(jù)集、自我糾錯以及強(qiáng)化學(xué)習(xí)等技術(shù),進(jìn)一步提升了模型的性能。這些技術(shù)的綜合應(yīng)用,使得 Grok 3 在處理復(fù)雜任務(wù)時表現(xiàn)得更為出色。
不過,xAI 也指出,Grok 3 的推理模型目前仍處于測試階段(Beta 版),并且仍在訓(xùn)練中。此外,該公司還推出了推理模型的迷你版本。Grok 3 還引入了一項名為“DeepSearch”的新功能,該公司將其描述為一種新型搜索引擎,同時也是類似代理功能的早期版本。
馬斯克此前發(fā)布了一段視頻,闡述了 xAI 和 Grok 的使命 —— 理解宇宙的本質(zhì)。然而,原計劃在此次發(fā)布中推出的語音模式并未如期上線。馬斯克在 X 平臺上確認(rèn)了這一情況,并解釋稱:“語音模式目前還存在一些問題,預(yù)計將在大約一周后推出,但它非常出色。”
此次 Grok 3 的發(fā)布正值馬斯克與 OpenAI 之間的競爭不斷升級。雙方的矛盾不僅包括法律訴訟和口水戰(zhàn),最近更是出現(xiàn)了馬斯克對 OpenAI 發(fā)起的無邀約 974 億美元收購提案。