2024/12/20 08:38

谷歌首個(gè)通用推理模型登場(chǎng)：揭秘AI推理“黑匣子”，登頂Arena LLM排行榜

IT之家故淵

谷歌 AI Studio 平臺(tái)昨日（12 月 19 日）發(fā)布實(shí)驗(yàn)性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展現(xiàn)思考過(guò)程”，是谷歌第一個(gè)通用推理模型。

該模型不僅能夠解答復(fù)雜問(wèn)題，還能模仿人類(lèi)逐步推理，展現(xiàn)其“思考”步驟，這一創(chuàng)新功能有望革新 AI 領(lǐng)域，和 OpenAI 的 o1 推理模型展開(kāi)競(jìng)爭(zhēng)。IT之家附上相關(guān)演示如下：

Google DeepMind 首席科學(xué)家 Jeff Dean 演示了該模型如何通過(guò)一系列“思考”步驟解決物理問(wèn)題；而 Google 產(chǎn)品負(fù)責(zé)人 Logan Kilpatrick 展示了模型如何處理包含圖像和文本信息的推理問(wèn)題。

該模型基于 Gemini 2.0 Flash 的速度和性能構(gòu)建，在 Chatbot Arena LLM 排行榜上，Gemini 2.0 Flash Thinking 模型在所有類(lèi)別中均排名第一，較之前的 Gemini-2.0-Flash 模型有顯著提升，尤其在“硬提示”和“視覺(jué)”兩項(xiàng)分別提升了 14 分和 16 分。

該模型目前已在 Google AI Studio 和 Vertex AI 平臺(tái)上線(xiàn)。谷歌表示，這只是推理之旅的第一步，未來(lái)這些推理能力可能會(huì)集成到 Gemini 2.0 系列的主要模型中。

給作者點(diǎn)贊

0 VS 0

寫(xiě)得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

Google

中興通訊聯(lián)合合作伙伴成立開(kāi)放智算產(chǎn)業(yè)聯(lián)盟，加速AI及大模型行業(yè)落地
C114通信網(wǎng) 12-20
最新研究：AI版本越老越糊涂
快科技秋白12-20
“高校人人學(xué)AI”時(shí)代，升級(jí)AI通識(shí)教育老師先卷起來(lái)
C114通信網(wǎng) 12-20
阿爾特曼暗示OpenAI明日發(fā)布o(jì)3，新一代AI推理王者模型
IT之家故淵12-20

谷歌首個(gè)通用推理模型登場(chǎng)：揭秘AI推理“黑匣子”，登頂Arena LLM排行榜

谷歌首個(gè)通用推理模型登場(chǎng)：揭秘AI推理“黑匣子”，登頂Arena LLM排行榜