OpenAI 宣布推出兩款開源模型 GPT-oss-120b 和 GPT-oss-20b,這是自 2020 年發(fā)布 GPT-2 以來,OpenAI 首次推出開源語言模型。這兩款模型均可在 Hugging Face 在線開發(fā)者平臺上免費(fèi)下載,OpenAI 稱其在多個(gè)用于比較開源模型的基準(zhǔn)測試中表現(xiàn)“處于前沿水平”。
據(jù) OpenAI 介紹,Gpt-oss-120b 模型在核心推理基準(zhǔn)測試中與 OpenAI o4-mini 模型幾乎持平,同時(shí)能在單個(gè) 80GB GPU 上高效運(yùn)行。Gpt-oss-20b 模型在常見基準(zhǔn)測試中與 OpenAI o3 mini 模型取得類似結(jié)果,且可在僅配備 16GB 內(nèi)存的邊緣設(shè)備上運(yùn)行,使其成為設(shè)備端應(yīng)用、本地推理或無需昂貴基礎(chǔ)設(shè)施的快速迭代的理想選擇。
OpenAI 表示,其開源模型能夠向云端的 AI 模型發(fā)送復(fù)雜查詢,這意味著如果開源模型無法完成某項(xiàng)任務(wù)(如圖像處理),開發(fā)者可以將其連接到 OpenAI 更強(qiáng)大的閉源模型。
OpenAI 以 Apache 2.0 許可證發(fā)布 gpt-oss-120b 和 gpt-oss-20b,這是一種被認(rèn)為是最寬松的許可證之一。該許可證允許企業(yè)在無需向 OpenAI 支付費(fèi)用或獲得許可的情況下,將 OpenAI 的開源模型商業(yè)化。不過,與 AI2 等 AI 實(shí)驗(yàn)室的完全開源產(chǎn)品不同,OpenAI 表示不會公開用于創(chuàng)建其開源模型的訓(xùn)練數(shù)據(jù)。
據(jù)了解,盡管 OpenAI 在早期曾開源 AI 模型,但近年來公司主要采用專有、閉源的開發(fā)方式,并通過 API 向企業(yè)和開發(fā)者出售其 AI 模型的訪問權(quán)限,從而構(gòu)建了龐大的商業(yè)帝國。然而,今年 1 月,OpenAI 首席執(zhí)行官薩姆 奧爾特曼(Sam Altman)曾表示,公司在開源技術(shù)方面“站在了歷史的錯(cuò)誤一邊”。
奧爾特曼在一份提供給 TechCrunch 的聲明中表示:“自 2015 年成立以來,OpenAI 的使命就是確保開發(fā)出造福全人類的通用人工智能(AGI)。為此,我們很高興看到世界正在構(gòu)建一個(gè)基于美國民主價(jià)值觀的開源 AI 平臺,該平臺對所有人免費(fèi)開放,帶來廣泛的利益。”