谷歌于 8 月 27 日發(fā)布博文,宣布旗下 Gemini AI 支持更多類型的文件,通過(guò)分析、摘錄、洞察文檔內(nèi)容,為用戶提供更優(yōu)質(zhì)的 AI 服務(wù)。
谷歌表示擁有 Gemini Business、Enterprise、Education 或 Education Premium 許可證的 Google Workspace 用戶,現(xiàn)在可從 Google Drive 或本地設(shè)備上傳各種文件到 Gemini(gemini.google.com):
電子表格:Gemini AI 現(xiàn)在可以處理 CSV、XLSX 和 ODS 等格式的電子表格,使用戶能夠分析數(shù)字?jǐn)?shù)據(jù)、跟蹤趨勢(shì),并從財(cái)務(wù)模型、銷售報(bào)告等生成洞察力。
演示文稿:用戶現(xiàn)在可以上傳 PPTX、PDF 和 KEY 等格式的演示文稿,讓 Gemini AI 可以提取要點(diǎn)、總結(jié)內(nèi)容并識(shí)別圖表和圖像等視覺元素。
圖像:Gemini AI 現(xiàn)在可以分析 JPEG、PNG 和 GIF 等格式的圖像,提取文本、識(shí)別對(duì)象并為視覺內(nèi)容提供上下文。
音頻:用戶現(xiàn)在可以上傳 MP3、WAV 和 FLAC 等格式的音頻文件,讓 Gemini AI 能夠轉(zhuǎn)錄語(yǔ)音、識(shí)別發(fā)言人,并總結(jié)訪談、播客和講座中的要點(diǎn)。
視頻:Gemini AI 現(xiàn)在可以處理 MP4、MOV 和 AVI 等格式的視頻文件,從演示文稿、紀(jì)錄片和培訓(xùn)視頻中提取腳本、識(shí)別場(chǎng)景并總結(jié)關(guān)鍵事件。
IT之家援引新聞稿,Gemini 可以根據(jù)用戶輸入的提示詞,更有針對(duì)性地分析用戶上傳文件,總結(jié)復(fù)雜的主題、識(shí)別趨勢(shì)和洞察力,以及改進(jìn)寫作和文檔組織的建議,幫助用戶提高理解、研究和寫作能力。