谷歌于今年 3 月底發(fā)布了 Gemini 2.5 Pro 模型,緊接著又在 4 月推出了面向更廣泛用戶(hù)的輕量級(jí)版本 Gemini 2.5 Flash。兩者目前仍處于預(yù)覽階段,但 Flash 版本已可通過(guò) Gemini App 向全球用戶(hù)開(kāi)放體驗(yàn)。
目前,谷歌再度更新 Google AI Studio 中的 Gemin 2.5 Pro 預(yù)覽版模型(IT之家注:更新至 06-05 版本),并聲稱(chēng)該模型刷新了多項(xiàng) AI 性能基準(zhǔn)“跑分”:
LMArena Elo 評(píng)分上升 24 分
WebDevArena Elo 評(píng)分上升 35 分至 1443 分,取得業(yè)界領(lǐng)先地位
在 GPQA 和 Humanity's Last Exam 等高難度測(cè)試中“表現(xiàn)出色”
谷歌還回應(yīng)了上一個(gè) Gemini 2.5 Pro 預(yù)覽版(05-06 版本)用戶(hù)們對(duì)于“模型性能短暫下滑”的抱怨,聲稱(chēng)模型“已在風(fēng)格與結(jié)構(gòu)方面進(jìn)行了優(yōu)化”,使模型“更具創(chuàng)意、回答格式更清晰”,提升了交互體驗(yàn)。
值得注意的是,谷歌近期還放寬了 Pro 版用戶(hù)的請(qǐng)求限制(query limits),這也許預(yù)示著該版本在本月正式上線后會(huì)有更具吸引力的價(jià)格策略。