2025/3/6 09:48

阿里推出開源推理模型QwQ-32B 性能媲美DeepSeek-R1滿血版

C114通信網(wǎng) 顏翊

C114訊 3月6日消息（顏翊）今日，阿里旗下通義千問Qwen推出最新的推理模型 QwQ-32B。這是一款擁有 320 億參數(shù)的模型，其性能可與具備 6710 億參數(shù)（其中 370 億被激活）的 DeepSeek-R1 媲美。

QwQ-32B 在一系列基準測試中進行了評估，測試了數(shù)學(xué)推理、編程能力和通用能力。測試結(jié)果顯示，QwQ-32B 的性能和 DeepSeek-R1-671B 不相上下，遠勝于相同尺寸的R1蒸餾模型。

通義千問表示，希望能夠證明強大的基礎(chǔ)模型疊加大規(guī)模強化學(xué)習(xí)也許是一條通往通用人工智能的可行之路。

其近期的研究表明，強化學(xué)習(xí)可以顯著提高模型的推理能力。例如，DeepSeek-R1 通過整合冷啟動數(shù)據(jù)和多階段訓(xùn)練，實現(xiàn)了最先進的性能，使其能夠進行深度思考和復(fù)雜推理。

目前，QwQ-32B 已在 Hugging Face和 ModelScope開源，并采用了 Apache 2.0 開源協(xié)議，同時還貼心提供了在線體驗地址。

阿里巴巴近日宣布將不遺余力加速云和AI硬件基礎(chǔ)設(shè)施建設(shè)。阿里巴巴集團CEO吳泳銘表示，未來三年，阿里將投入超過3800億元，用于建設(shè)云和AI硬件基礎(chǔ)設(shè)施，總額超過去十年總和。這也創(chuàng)下中國民營企業(yè)在云和AI硬件基礎(chǔ)設(shè)施建設(shè)領(lǐng)域有史以來最大規(guī)模投資紀錄。

給作者點贊

0 VS 0

寫得不太好

版權(quán)說明：凡注明來源為“C114通信網(wǎng)”的文章皆屬C114版權(quán)所有，除與C114簽署內(nèi)容授權(quán)協(xié)議的單位外，其他單位未經(jīng)允許禁止轉(zhuǎn)載、摘編，違者必究。如需使用，請聯(lián)系021-54451141。其中編譯類僅出于傳遞更多信息之目的，系C114對海外相關(guān)站點最新信息的翻譯稿，僅供參考，不代表證實其描述或贊同其觀點，投資者據(jù)此操作，風(fēng)險自擔(dān)；翻譯質(zhì)量問題請指正。

相關(guān)鏈接

測試整合阿里巴巴

中國移動、阿里云和中興通訊聯(lián)合打造的能力開放解決方案榮獲GSMA GLOMO “Open Gateway挑戰(zhàn)獎”
C114通信網(wǎng) 3-6
中國移動重磅發(fā)布自研終端大模型引領(lǐng)AI終端產(chǎn)業(yè)新變革
廠商供稿 3-6
阿里云推出最新通義千問 QwQ-32B 推理模型，僅 1/20 參數(shù)媲美 DeepSeek R1
IT之家問舟3-6
阿里推出全新推理模型：僅1/21參數(shù)媲美DeepSeek R1
快科技隨心3-6