久久九九精品,中文字幕av无码不卡免费

C114
通信人家園
English
公眾號(hào)矩陣

投稿
舉報(bào)

量子大觀

通信人家園

C114通信網(wǎng)

光通信觀察

DVBCN中廣5G

2025/7/31 08:18

阿里通義千問(wèn)推出全新推理模型 Qwen3-30B-A3B-Thinking-2507，多項(xiàng)能力顯著提升

IT之家浩渺

阿里通義千問(wèn)今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相較于 4 月 29 日開(kāi)源的 Qwen3-30-A3B 模型，新模型在推理能力、通用能力及上下文長(zhǎng)度上有了顯著提升：

新模型在聚焦數(shù)學(xué)能力的 AIME25 評(píng)測(cè)中斬獲 85.0 的高分，在代碼能力測(cè)試 LiveCodeBench v6 中得分 66.0，兩項(xiàng)核心推理能力均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）；新模型的知識(shí)水平（GPQA、MMLU-Pro）也較上一版本進(jìn)步顯著。

在寫(xiě)作（WritingBench）、Agent 能力（BFCL-v3）、多輪對(duì)話和多語(yǔ)言指令遵循（MultiIF）等通用能力評(píng)測(cè)中，Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）。

更長(zhǎng)的上下文理解，原生支持 256K tokens，可擴(kuò)展至 1M tokens。

此外，新模型的思考長(zhǎng)度（thinking length）也增加了，官方推薦在高度復(fù)雜的推理任務(wù)中設(shè)置更長(zhǎng)的思考預(yù)算，以充分發(fā)揮它的潛力。

官方透露，目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社區(qū)、HuggingFace 上開(kāi)源，其輕量體積可輕松實(shí)現(xiàn)消費(fèi)級(jí)硬件的本地部署；同時(shí)，其也在 Qwen Chat 上同步上線了新模型。

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

給作者點(diǎn)贊

0 VS 0

寫(xiě)得不太好

相關(guān)鏈接

測(cè)試

TC610引入CEI寬帶體驗(yàn)評(píng)測(cè)標(biāo)準(zhǔn)，杭州電信首批通過(guò)L4級(jí)認(rèn)證
C114通信網(wǎng) 7-30
阿里通義千問(wèn)更新 Qwen3-30B 非思考模型：AI 性能媲美 GPT-4o，推理、代碼、數(shù)學(xué)等能力全面躍升
IT之家故淵7-30
TC610引入CEI寬帶業(yè)務(wù)體驗(yàn)評(píng)測(cè)，北京移動(dòng)率先獲得L4認(rèn)證
C114通信網(wǎng) 7-28
中國(guó)移動(dòng)九天GUI　Agent模型登頂評(píng)測(cè)國(guó)際榜單榜首
C114通信網(wǎng) 7-25

特別策劃