谷歌 AI Studio 平臺(tái)昨日(12 月 19 日)發(fā)布實(shí)驗(yàn)性的“Gemini 2.0 Flash Thinking”模型,主打“清晰展現(xiàn)思考過(guò)程”,是谷歌第一個(gè)通用推理模型。
該模型不僅能夠解答復(fù)雜問(wèn)題,還能模仿人類(lèi)逐步推理,展現(xiàn)其“思考”步驟,這一創(chuàng)新功能有望革新 AI 領(lǐng)域,和 OpenAI 的 o1 推理模型展開(kāi)競(jìng)爭(zhēng)。IT之家附上相關(guān)演示如下:
Google DeepMind 首席科學(xué)家 Jeff Dean 演示了該模型如何通過(guò)一系列“思考”步驟解決物理問(wèn)題;而 Google 產(chǎn)品負(fù)責(zé)人 Logan Kilpatrick 展示了模型如何處理包含圖像和文本信息的推理問(wèn)題。
該模型基于 Gemini 2.0 Flash 的速度和性能構(gòu)建,在 Chatbot Arena LLM 排行榜上,Gemini 2.0 Flash Thinking 模型在所有類(lèi)別中均排名第一,較之前的 Gemini-2.0-Flash 模型有顯著提升,尤其在“硬提示”和“視覺(jué)”兩項(xiàng)分別提升了 14 分和 16 分。
該模型目前已在 Google AI Studio 和 Vertex AI 平臺(tái)上線(xiàn)。谷歌表示,這只是推理之旅的第一步,未來(lái)這些推理能力可能會(huì)集成到 Gemini 2.0 系列的主要模型中。