谷歌今日推出了一款名為 Gemini 2.5 Flash 的全新 AI 模型,該模型注重高效能,并提供強(qiáng)勁的性能。
據(jù)IT之家了解,Gemini 2.5 Flash 即將登陸谷歌的 AI 開發(fā)平臺(tái) Vertex AI。谷歌公司表示,該模型具備“動(dòng)態(tài)且可控”的計(jì)算能力,開發(fā)者能夠根據(jù)查詢請(qǐng)求的復(fù)雜程度靈活調(diào)整處理時(shí)間。谷歌在一篇博客文章中寫道:“你可以針對(duì)特定需求來(lái)調(diào)整速度、準(zhǔn)確性和成本之間的平衡。這種靈活性對(duì)于優(yōu)化 Flash 在大批量、成本敏感型應(yīng)用中的性能至關(guān)重要。”
當(dāng)前,旗艦 AI 模型的成本呈現(xiàn)不斷上升的趨勢(shì),而像 Gemini 2.5 Flash 這樣價(jià)格較低且性能出色(盡管在準(zhǔn)確性上可能稍遜一籌)的模型,為用戶提供了更具吸引力的替代選擇。
Gemini 2.5 Flash 是一款“推理”模型,與 OpenAI 的 o3-mini 和 DeepSeek 的 R1 類似,意味著其在回答問(wèn)題時(shí)會(huì)花費(fèi)稍長(zhǎng)的時(shí)間來(lái)進(jìn)行事實(shí)核查。
谷歌指出,Gemini 2.5 Flash 非常適合用于“高容量”和“實(shí)時(shí)”的應(yīng)用場(chǎng)景,例如客戶服務(wù)和文檔解析。谷歌在其博客文章中提到:“這款工作型模型專門針對(duì)低延遲和降低成本進(jìn)行了優(yōu)化,是響應(yīng)式虛擬助手和實(shí)時(shí)總結(jié)工具的理想引擎,在大規(guī)模應(yīng)用中,效率是關(guān)鍵。”
然而,谷歌尚未發(fā)布 Gemini 2.5 Flash 的安全或技術(shù)報(bào)告,這使得人們難以明確了解該模型在哪些方面表現(xiàn)出色,又在哪些方面存在不足。此前,谷歌曾表示,對(duì)于其認(rèn)為是“實(shí)驗(yàn)性”的模型,公司不會(huì)發(fā)布相關(guān)報(bào)告。
此外,谷歌在本周三宣布,計(jì)劃從第三季度開始將 Gemini 模型(如 2.5 Flash)引入本地環(huán)境。谷歌的 Gemini 模型將在谷歌分布式云(GDC)上提供,這是谷歌為有嚴(yán)格數(shù)據(jù)治理要求的客戶提供的一種本地解決方案。谷歌表示,公司正在與英偉達(dá)合作,將 Gemini 模型引入符合 GDC 標(biāo)準(zhǔn)的英偉達(dá) Blackwell 系統(tǒng),客戶可以通過(guò)谷歌或其首選渠道購(gòu)買這些系統(tǒng)。