Cloud&AI
`
2025/6/6 08:52
谷歌更新 Gemini 2.5 Pro 預(yù)覽版模型至 06-05 版本,多項(xiàng) AI 性能基準(zhǔn)測(cè)試評(píng)分提升
0
0

谷歌于今年 3 月底發(fā)布了 Gemini 2.5 Pro 模型,緊接著又在 4 月推出了面向更廣泛用戶(hù)的輕量級(jí)版本 Gemini 2.5 Flash。兩者目前仍處于預(yù)覽階段,但 Flash 版本已可通過(guò) Gemini App 向全球用戶(hù)開(kāi)放體驗(yàn)。

目前,谷歌再度更新 Google AI Studio 中的 Gemin 2.5 Pro 預(yù)覽版模型(IT之家注:更新至 06-05 版本),并聲稱(chēng)該模型刷新了多項(xiàng) AI 性能基準(zhǔn)“跑分”:

LMArena Elo 評(píng)分上升 24 分

WebDevArena Elo 評(píng)分上升 35 分至 1443 分,取得業(yè)界領(lǐng)先地位

在 GPQA 和 Humanity's Last Exam 等高難度測(cè)試中“表現(xiàn)出色”

谷歌還回應(yīng)了上一個(gè) Gemini 2.5 Pro 預(yù)覽版(05-06 版本)用戶(hù)們對(duì)于“模型性能短暫下滑”的抱怨,聲稱(chēng)模型“已在風(fēng)格與結(jié)構(gòu)方面進(jìn)行了優(yōu)化”,使模型“更具創(chuàng)意、回答格式更清晰”,提升了交互體驗(yàn)。

值得注意的是,谷歌近期還放寬了 Pro 版用戶(hù)的請(qǐng)求限制(query limits),這也許預(yù)示著該版本在本月正式上線后會(huì)有更具吸引力的價(jià)格策略。

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

給作者點(diǎn)贊
0 VS 0
寫(xiě)得不太好

C114簡(jiǎn)介     聯(lián)系我們     網(wǎng)站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號(hào)-4

C114通信網(wǎng)版權(quán)所有 舉報(bào)電話:021-54451141 用戶(hù)注銷(xiāo)