C114通信網(wǎng)  |  通信人家園

人工智能
2025/2/26 10:20

DeepSeek第三彈:開(kāi)源DeepGEMM!

快科技  秋白

今天上午9點(diǎn),DeepSeek繼續(xù)履行開(kāi)源周承諾,發(fā)布了開(kāi)源DeepGEMM。該帖子一經(jīng)轉(zhuǎn)發(fā),立即引來(lái)了2.1萬(wàn)閱讀量,足以見(jiàn)其在國(guó)內(nèi)外受到追捧的熱度。

據(jù)了解,DeepGEMM是一個(gè)專注于為FP8高效通用矩陣乘法(GEMM)庫(kù),支持普通及混合專家(MoE)分組的矩陣計(jì)算需求,可動(dòng)態(tài)優(yōu)化資源分配以提升算力效率。

該庫(kù)基于CUDA開(kāi)發(fā),采用輕量級(jí)即時(shí)編譯(JIT)模塊,在運(yùn)行時(shí)動(dòng)態(tài)編譯內(nèi)核,無(wú)需預(yù)先編譯安裝。

值得一提的是,DeepGEMM設(shè)計(jì)目標(biāo)是為DeepSeek-V3/R1模型的訓(xùn)練與推理提供簡(jiǎn)潔高效的底層支持,尤其針對(duì)Hopper架構(gòu)GPU(如H800)優(yōu)化,兼顧高性能與低成本。

作為開(kāi)源周的第三項(xiàng)成果,DeepGEMM的發(fā)布延續(xù)了DeepSeek此前開(kāi)源模型與工具(如FlashMLA)的策略,進(jìn)一步降低高性能計(jì)算技術(shù)的應(yīng)用門(mén)檻。

另外,本次開(kāi)源屬于DeepSeek“開(kāi)源周”(2月24日-28日)的第三項(xiàng)項(xiàng)目,此前已發(fā)布FlashMLA(高效解碼內(nèi)核)和DeepEP(專家并行通信庫(kù))。

DeepSeek第三彈:開(kāi)源DeepGEMM!

給作者點(diǎn)贊
0 VS 0
寫(xiě)得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門(mén)文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141