從超算互聯(lián)網(wǎng)官微獲悉,本周,超算互聯(lián)網(wǎng)平臺上線阿里巴巴開源推理模型QwQ-32B API接口服務,現(xiàn)在用戶可獲得免費的100萬Tokens。
據(jù)了解,基于國產(chǎn)深算智能加速卡以及全國一體化算力網(wǎng),平臺支持海量用戶便捷調用QwQ-32B、DeepSeek-R1等國產(chǎn)開源大模型的接口服務。
超算互聯(lián)網(wǎng)QwQ-32B API接口服務頁面
超算互聯(lián)網(wǎng)QwQ-32B模型鏡像創(chuàng)建頁面
超算互聯(lián)網(wǎng)AI社區(qū)QwQ-32B模型快速開發(fā)頁面
用戶無需下載本地,只需一鍵啟動Notebook功能,即可在平臺快速開發(fā)QwQ-32B模型,或引入專有數(shù)據(jù)進一步私有化部署。
QwQ-32B是阿里Qwen團隊最新發(fā)布的推理模型,基于Qwen2.5-32B+強化學習構建。
據(jù)官方公示的基準評測結果,在測試數(shù)學能力的 AIME24 評測集上,以及評估代碼能力的LiveCodeBench中,QwQ-32B表現(xiàn)與DeepSeek-R1相當,遠勝于o1-mini 及相同尺寸的R1蒸餾模型。
QwQ-32B API調用服務具體步驟如下:
1、用戶在超算互聯(lián)網(wǎng)商城首頁中搜索QwQ-32B,點擊“QwQ-32B 接口服務”商品,購買完成后,點擊“去使用”。
2、進入API接口信息頁面:點擊“去使用”后會進入API接口信息頁面。
3、按需選擇訪問形式,有三種訪問形式可選:使用Postman、Apifox等http工具訪問;使用python代碼訪問;以及在終端頁面直接訪問。
目前,超算互聯(lián)網(wǎng)除提供QwQ-32B模型API接口服務外,近期還上線有DeepSeek-R1全家桶、最高671B滿血版的API部署與AI Web應用服務。
QwQ-32B API接口服務:點此進入
模型快速開發(fā):點此進入
3月6日,阿里巴巴通義千問最新開源模型QwQ-32B正式發(fā)布,擁有比DeepSeek更小的尺寸,性能卻可比肩全球最強開源推理模型。
據(jù)了解,通過大規(guī)模強化學習,千問QwQ-32B在數(shù)學、代碼及通用能力上實現(xiàn)質的飛躍,整體性能比肩DeepSeek-R1。
而且在保持強勁性能的同時,千問QwQ-32B還大幅降低了部署使用成本,在消費級顯卡上也能實現(xiàn)本地部署。