2023/5/17 10:07

人工智能軍備競(jìng)賽白熱化：谷歌最新 AI 大語(yǔ)言模型 PaLM2 數(shù)據(jù)量擴(kuò)充 5 倍

新浪科技

北京時(shí)間 5 月 17 日早間消息，據(jù)報(bào)道，谷歌上周發(fā)布的最新大語(yǔ)言模型使用的訓(xùn)練數(shù)據(jù)，幾乎是 2022 年的上一代模型的 5 倍。得益于此，該模型在編程、數(shù)學(xué)和創(chuàng)意寫(xiě)作方面的表現(xiàn)更為優(yōu)秀。

谷歌是在其 I / O 開(kāi)發(fā)者大會(huì)上發(fā)布最新通用大語(yǔ)言模型 PaLM2 的。內(nèi)部文件顯示，該模型采用了 3.6 萬(wàn)億個(gè)令牌（token）進(jìn)行訓(xùn)練。令牌指的是單詞串，這是訓(xùn)練大語(yǔ)言模型的重要基礎(chǔ)，因?yàn)檫@可以教給模型如何預(yù)測(cè)字符串中可能出現(xiàn)的下一個(gè)單詞。

之前版本的 PaLM 發(fā)布于 2022 年，當(dāng)時(shí)使用的令牌為 7800 億個(gè)。

雖然谷歌很希望展示其人工智能技術(shù)的實(shí)力，以及嵌入搜索、電子郵件、字處理和電子表格后的效果，但該公司卻不愿發(fā)布其訓(xùn)練數(shù)據(jù)的規(guī)模和其他細(xì)節(jié)。微軟支持的 OpenAI 也對(duì)其最新的 GPT-4 大語(yǔ)言模型的細(xì)節(jié)信息保密。

這些公司表示，之所以不披露這些信息，是出于商業(yè)競(jìng)爭(zhēng)考慮。谷歌和 OpenAI 都在努力吸引想要用聊天機(jī)器人代替?zhèn)鹘y(tǒng)搜索引擎，從而直接獲取答案的用戶(hù)。

但隨著人工智能軍備競(jìng)賽日趨白熱化，相關(guān)研究人員也呼吁企業(yè)加大透明度。

自從發(fā)布 PaLM2 之后，谷歌一直表示新的模型比之前的大語(yǔ)言模型更小，這就意味著該公司的技術(shù)效率得以提升，但卻可以完成更加復(fù)雜的任務(wù)。內(nèi)部文件顯示，PaLM2 基于 3400 億個(gè)參數(shù)訓(xùn)練 —— 這項(xiàng)指標(biāo)可以說(shuō)明該模型的復(fù)雜程度。最初的 PaLM 則基于 5400 億個(gè)參數(shù)訓(xùn)練。

目前，谷歌尚未對(duì)此置評(píng)。

谷歌在一篇關(guān)于 PaLM2 的博文中表示，該模型使用了一種名為“計(jì)算機(jī)優(yōu)化擴(kuò)張”的新技術(shù)。這就讓大語(yǔ)言“更高效、整體性能更好，包括加快推理速度、減少參數(shù)調(diào)用和降低服務(wù)成本。”

在宣布 PaLM2 時(shí)，谷歌證實(shí)了此前的媒體報(bào)道，計(jì)該模型針對(duì) 100 種語(yǔ)言進(jìn)行訓(xùn)練，可以執(zhí)行更廣泛的任務(wù)。它已經(jīng)被用于 25 項(xiàng)功能和產(chǎn)品，包括該公司的實(shí)驗(yàn)性聊天機(jī)器人 Bard。按照從小到大的規(guī)模劃分，該模型共有 4 種，分別是壁虎（Gecko）、水獺（Otter）、野牛（Bison）和獨(dú)角獸（Unicorn）。

根據(jù)公開(kāi)披露的信息，PaLM2 比現(xiàn)有的任何模型都更加強(qiáng)大。Facebook 在 2 月份宣布的的 LLaMA 大語(yǔ)言模型采用 1.4 萬(wàn)億個(gè)令牌。OpenAI 上一次披露 GPT-3 的訓(xùn)練規(guī)模時(shí)表示，它當(dāng)時(shí)基于 3000 億個(gè)令牌。OpenAI 今年 3 月發(fā)布 GPT-4 時(shí)表示，它在許多專(zhuān)業(yè)測(cè)試中展示出“與人類(lèi)媲美的表現(xiàn)”。

LaMDA 是谷歌兩年前推出的一個(gè)對(duì)話型大語(yǔ)言模型，在今年 2 月還與 Bard 一同對(duì)外宣傳。該模型基于 1.5 萬(wàn)億個(gè)令牌訓(xùn)練。

隨著新的人工智能應(yīng)用快速進(jìn)入主流，圍繞底層技術(shù)的爭(zhēng)議也越來(lái)越激烈。

谷歌高級(jí)研究科學(xué)家艾爾邁赫迪艾爾麥哈麥迪（El Mahdi El Mhamdi）于今年 2 月辭職，主要原因就是人工智能技術(shù)缺乏透明度。本周二，OpenAI CEO 山姆阿爾特曼（Sam Altman）出席美國(guó)國(guó)會(huì)針對(duì)隱私和技術(shù)舉行的聽(tīng)證會(huì)，他也認(rèn)為需要設(shè)立一套新的制度來(lái)應(yīng)對(duì)人工智能的潛在問(wèn)題。

“對(duì)于一種全新的技術(shù)，我們需要一套全新的框架。”阿爾特曼說(shuō)，“當(dāng)然，像我們這樣的公司應(yīng)當(dāng)為我們推出的工具承擔(dān)許多責(zé)任。”

給作者點(diǎn)贊

0 VS 0

寫(xiě)得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

Palm 微軟搜索引擎計(jì)算機(jī)Facebook

AI+機(jī)器人：谷歌攜手Apptronik，推動(dòng)人形機(jī)器人商業(yè)化落地
IT之家故淵12-20
美國(guó)哥倫比亞大學(xué)研究：大語(yǔ)言模型正在變得越來(lái)越像人類(lèi)大腦
IT之家清源12-20
AI 搜索引擎 Perplexity 完成新一輪融資，估值升至 90 億美元
DoNews 楊亮12-20
AI搜索引擎Perplexity完成最新一輪融資，估值從今年4月10億美元升至90億美元
IT之家清源12-20