5 月 9 日消息,據(jù)泄露的內(nèi)部文件顯示,人工智能將成為谷歌今年開發(fā)者大會(huì) Google I / O 的中心主題,該公司計(jì)劃發(fā)布一系列生成式人工智能(AIGC)功能更新,包括推出通用的大型語言模型 (LLM)。
這份內(nèi)部文件顯示,谷歌將推出其最新、最先進(jìn)的 LLM——PaLM 2。PaLM 2 支持 100 多種語言,在內(nèi)部以“統(tǒng)一語言模型”的代號(hào)運(yùn)行。谷歌還對(duì)其進(jìn)行了廣泛的編碼和數(shù)學(xué)測(cè)試,以及創(chuàng)意性的寫作測(cè)試和分析。
文件還顯示,在這次活動(dòng)上,谷歌將宣布人工智能如何“幫助人們充分發(fā)揮其潛力”的主題,包括 Bard 和搜索的“生成式體驗(yàn)”。谷歌及其母公司 Alphabet 首席執(zhí)行官桑達(dá)爾 皮查伊(Sundar Pichai)將向現(xiàn)場(chǎng)的開發(fā)者發(fā)表演講,介紹該公司在人工智能領(lǐng)域取得的進(jìn)步。
谷歌此次更新正值人工智能領(lǐng)域的競(jìng)爭(zhēng)加劇之際,該公司和微軟都在競(jìng)相將聊天人工智能技術(shù)融入自己的產(chǎn)品中。微軟正在利用對(duì) ChatGPT 創(chuàng)建者 OpenAI 的投資來支持其必應(yīng)搜索引擎,而谷歌也迅速行動(dòng)起來,試圖在不同的團(tuán)隊(duì)中整合其 Bard 技術(shù),并推出自己的 LLM。
谷歌于 2022 年 4 月首次宣布推出 PaLM Language 模型。今年 3 月,該公司推出了一款適用于 PaLM 的 API 以及一系列人工智能企業(yè)工具,稱這將幫助企業(yè)“通過簡(jiǎn)單的自然語言提示生成文本、圖像、代碼、視頻、音頻等”。
上個(gè)月,谷歌稱其名為“Med-PaLM 2”的醫(yī)學(xué) LLM 可以回答“專家醫(yī)生級(jí)別”的醫(yī)學(xué)檢查問題,準(zhǔn)確率達(dá) 85%。
文件顯示,谷歌還計(jì)劃分享 Bard 和搜索方面取得的進(jìn)展,提供所謂的“生成式體驗(yàn)”,包括將 Bard 用于編碼、數(shù)學(xué)和“邏輯”,以及擴(kuò)展到日語和韓語。谷歌始終在開發(fā)一系列功能更強(qiáng)大的 Bard 模型,并于 3 月份正式將其作為實(shí)驗(yàn)推出。
另一份內(nèi)部文件顯示,谷歌還在內(nèi)部開發(fā)了一個(gè)名為“Multi-Bard”的多模態(tài)模型版本,它使用了更大的數(shù)據(jù)集,可以幫助解決復(fù)雜的數(shù)學(xué)和編碼問題。此外,谷歌還測(cè)試了名為“Big Bard”和“Giant Bard”的版本。
谷歌還計(jì)劃擴(kuò)展其“Workspace AI collaborator”,包括在工作表中討論模板生成,以及在幻燈片和 Meet 產(chǎn)品中討論圖像生成。今年 3 月,該公司表示,作為測(cè)試的一部分,它將允許一小部分用戶訪問 Gmail 和 Google Docs 中的人工智能功能,并計(jì)劃在其會(huì)議、工作表和幻燈片應(yīng)用程序中引入更多生成式人工智能功能。
其中一張圖片顯示了一個(gè)帶有聊天框的幻燈片側(cè)邊欄,允許用戶輸入文本,并可以選擇根據(jù)這些文字創(chuàng)建圖像。其他更新包括圖像識(shí)別工具 Google Lens 的用例。繼去年允許用戶詢問他們正在觀看的圖像中的內(nèi)容后,谷歌將展示對(duì)攝像頭和語音的“多搜索”技術(shù)的改進(jìn)。
此前有報(bào)道稱,在人工智能領(lǐng)域之外,谷歌將展示其新款可折疊手機(jī) Pixel Fold。該公司聲稱 Pixel Fold 將擁有“可折疊手機(jī)上最耐用的鉸鏈”,并將提供手機(jī)以舊換新選項(xiàng)。谷歌宣稱,Pixel Fold 的最大賣點(diǎn)為防水和只有口袋大小。