科技媒體 NeoWin 昨日(10 月 21 日)發(fā)布博文,報(bào)道稱 IBM 在其年度 TechXchange 活動(dòng)上,發(fā)布了全新的 Granite 3.0 系列 AI 模型,在學(xué)術(shù)和行業(yè)基準(zhǔn)測(cè)試中可以持平或超越同等規(guī)模的模型。
Granite 3.0 系列包含多種新模型,IT之家附上相關(guān)模型如下:
通用 / 語(yǔ)言模型:
Granite 3.0 8B Instruct
Granite 3.0 2B Instruct
Granite 3.0 8B Base
Granite 3.0 2B Base
安全與防護(hù):
Granite Guardian 3.0 8B
Granite Guardian 3.0 2B
專家混合模型:
Granite 3.0 3B-A800M Instruct
Granite 3.0 1B-A400M Instruct
Granite 3.0 3B-A800M Base
Granite 3.0 1B-A400M Base
IBM 表示,Granite 3.0 的 8B 和 2B 模型是企業(yè) AI 的最佳選擇,具備更強(qiáng)的穩(wěn)健性和可靠性,能夠處理更廣泛的任務(wù)。這些模型在檢索增強(qiáng)生成(RAG)、分類(lèi)、總結(jié)、實(shí)體提取和工具使用等任務(wù)中表現(xiàn)優(yōu)異。
新模型現(xiàn)已在 HuggingFace 平臺(tái)上以 Apache 2.0 許可證提供下載;Granite Guardian 3.0 的 8B 和 2B 模型也可通過(guò) IBM 的 watsonx 平臺(tái)進(jìn)行商業(yè)使用。
此外,部分 Granite 3.0 模型將進(jìn)入 Nvidia NIM 微服務(wù)和 Google Cloud 的 Vertex AI Model Garden。
對(duì)于開(kāi)發(fā)者而言,Granite 的代碼能力可以通過(guò) Visual Studio Code 擴(kuò)展 IBM Granite.Code來(lái)利用。該擴(kuò)展支持多種編程語(yǔ)言,包括 C、C++、Go、Java 和 Python,幫助程序員更高效地完成任務(wù)。
Granite 3.0 系列為 IBM 的智能體 AI(agentic AI)努力奠定了基礎(chǔ)。Granite 3.0 8B 模型具備高級(jí)推理能力和高度結(jié)構(gòu)化的聊天模板,適用于實(shí)現(xiàn)工具使用工作流。IBM 表示,明年將推出更多關(guān)于智能體 AI 的內(nèi)容,包括針對(duì)特定領(lǐng)域和用例的預(yù)構(gòu)建代理。
總之,IBM 的 Granite 3.0 系列不僅提升了 AI 模型的性能和可用性,還為未來(lái)的智能體 AI 發(fā)展鋪平了道路。