2025/2/11 13:23

IBM企業(yè)級(jí)AI開(kāi)發(fā)平臺(tái)watsonx.ai上線DeepSeek R1蒸餾模型

IT之家清源

IBM 日前宣布，DeepSeek-R1 蒸餾版 Llama 3.1 8B 和 Llama 3.3 70B 現(xiàn)已上線 IBM 的企業(yè)級(jí) AI 開(kāi)發(fā)平臺(tái) watsonx.ai。

根據(jù)官方介紹，DeepSeek 還借助知識(shí)蒸餾技術(shù)，利用 R1 模型生成的數(shù)據(jù)優(yōu)化了多個(gè) Llama 和 Qwen 變體。用戶可通過(guò)以下方式在 watsonx.ai上使用 DeepSeek 蒸餾模型：

在 watsonx.ai的“按需部署”目錄中，IBM 提供 Llama 蒸餾版，用戶可以部署專用實(shí)例以進(jìn)行安全推理。

用戶還可通過(guò)“自定義基礎(chǔ)模型”導(dǎo)入功能，上傳 DeepSeek-R1 其他變體，例如 Qwen 蒸餾模型。

DeepSeek-R1 具備強(qiáng)大的推理能力，適用于多個(gè)領(lǐng)域：

規(guī)劃：其“鏈?zhǔn)剿季S”邏輯有助于處理需要逐步推理的任務(wù)，特別適合智能體（agentic）應(yīng)用。

編程：可用于代碼生成、調(diào)試和優(yōu)化，提升開(kāi)發(fā)效率。

數(shù)學(xué)問(wèn)題求解：具備處理復(fù)雜數(shù)學(xué)問(wèn)題的能力，在科研、工程和科學(xué)計(jì)算等領(lǐng)域表現(xiàn)突出。

開(kāi)發(fā)者可在 watsonx.ai上利用 DeepSeek-R1 進(jìn)行 AI 解決方案開(kāi)發(fā)，并使用以下解決方案能力：

直觀測(cè)試和評(píng)估模型輸出

通過(guò)連接向量數(shù)據(jù)庫(kù)和嵌入模型構(gòu)建 RAG（檢索增強(qiáng)生成）管道

支持 LangChain、CrewAI 等主流 AI 框架

IBM watsonx.ai提供靈活的開(kāi)源模型定制選項(xiàng)，支持 DeepSeek-R1 在不同環(huán)境下的部署，并簡(jiǎn)化智能體開(kāi)發(fā)、微調(diào)、RAG、提示工程等工作流。此外，watsonx.ai內(nèi)置安全機(jī)制，保障用戶應(yīng)用的安全性。

據(jù)此前報(bào)道，IBM 首席執(zhí)行官本月初曾發(fā)表長(zhǎng)文稱，他們（DeepSeek）僅用約 2000 枚英偉達(dá)芯片，以大約 600 萬(wàn)美元的成本訓(xùn)練了最新的模型，遠(yuǎn)低于行業(yè)預(yù)期。這再次證明，小型、高效的模型也能帶來(lái)實(shí)際成果，無(wú)需依賴龐大而昂貴的專有系統(tǒng)。

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

IBM 測(cè)試

IBM CEO：DeepSeek 證明我們是正確的，小型且高效的模型同樣能有實(shí)際成果
IT之家清源2-7
IBM發(fā)布2024年第四季度業(yè)績(jī)報(bào)告：軟件業(yè)務(wù)雙位數(shù)增長(zhǎng)，自由現(xiàn)金流超全年預(yù)期
C114通信網(wǎng) 2-6
IBM原全球副總裁謝東加入北電數(shù)智！
C114通信網(wǎng) 1-2
IBM發(fā)布全新光電共封裝工藝：AI模型訓(xùn)練速度將提升5倍
快科技鹿角12-12