C114訊 11月14日消息(艾斯)阿瑪拉定律說,人們總是高估技術(shù)短期變化,卻低估長期的變革。
顯然,這一觀點放置于眼下如日中天的人工智能(AI)浪潮背景中也是恰如其分的。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏作為AI的堅定支持者之一,顯然并不迷信于由這一波生成式AI推動的“超級應用”會如眾人期待那般短期內(nèi)就從天而降,而是更愿意將這一由智能化開啟的新時代比作“新工業(yè)革命”的到來。
但同時,這也意味著更長遠的發(fā)展周期與更深刻的顛覆性。
為什么是“應用來了”
本周,百度世界2024于上海世博中心舉辦,今年的大會主題是“應用來了”。
過去一兩年,大模型成為全球各行業(yè)談及AI行業(yè)的核心聚焦點,同時也成為一部分加入這一賽道的創(chuàng)業(yè)企業(yè)的焦慮點。利用不斷迭代的大模型,究竟可以做些什么?機會在哪里?
“模型本身不產(chǎn)生直接價值,只有在模型之上開發(fā)各種應用,在各種場景找到所謂的PMF,才能真正產(chǎn)生價值。如果說2023年大家還在卷模型,讓模型能力逐步達到可用的話,那未來所謂的‘可用’,就是真的有東西用,應用的‘用’!崩顝┖暝谄陂g接受媒體采訪時強調(diào),只有把大模型真正化作能夠產(chǎn)生價值的實用應用,才能讓更多從業(yè)者找到發(fā)展的路徑和方向。
因此,無代碼秒噠和文生圖檢索增強(iRAG)的發(fā)布,成為了此次百度世界的重點。
需要了解的一個背景是,去年10月,百度發(fā)布了智能體機制,并研制了系統(tǒng)2。其核心是思考模型,包括理解、規(guī)劃、反思和進化,能夠做到可靠執(zhí)行,自我進化,并在一定程度上將思考過程白盒化,從而讓機器像人一樣思考和行動,自主完成復雜任務,同時在環(huán)境中持續(xù)學習、自主進化。
無代碼秒噠和文生圖檢索增強(iRAG)則是激發(fā)智能體爆發(fā)的關鍵。
百度表示,無代碼秒噠能夠讓任何人,用自然語言開發(fā)應用,實現(xiàn)想法。其中,零代碼工具就是多智能體協(xié)作的應用,采用了智能體的中心化模式,其中的代碼智能體通過場景知識的增強,顯著提升復雜代碼生成的質(zhì)量與穩(wěn)定性,高效實現(xiàn)用戶需要的功能,讓人人都可以成為程序員。
關于文生圖檢索增強(iRAG),百度研發(fā)了「理解-檢索-生成」協(xié)同優(yōu)化的檢索增強技術(shù),提升了大模型技術(shù)及應用效果;面向不同應用場景的生圖需求,進一步研發(fā)了檢索增強的文生圖技術(shù),既可以生成精確的圖片,也可以進行泛化生圖。
所有這些都建立在百度文心一言快速成長的基礎之上。自去年3月16日發(fā)布文心一言以來,“文心一言用戶規(guī)模達到4.3億,”百度首席技術(shù)官王海峰在會上宣布了這一數(shù)據(jù)。同時,文心大模型日均調(diào)用量已超過15億。
超級應用一定會有,只是時機未到
正如從4G跨越到5G時代,移動通信行業(yè)在苦等一個顛覆性Killer APP一樣,AI行業(yè)經(jīng)過過去兩年生成式AI浪潮的轟炸式席卷,也在翹首期盼一個讓大家為之興奮的“超級應用”。
對此,李彥宏表示,百度的愿景并不是要推出一個“超級應用”,而是希望不斷地幫助更多人、更多企業(yè)打造出數(shù)以百萬“超級有用”的應用。
從商業(yè)邏輯上講,這對于百度這樣一家擁有如此體量和歷史積累的企業(yè)來說是合理的。做平臺型的企業(yè),賦能更多開發(fā)者基于其平臺底座打造更多的應用,而不是成為一家實力雄厚的應用開發(fā)商,這意味著更廣闊的生態(tài)和更響亮的話語權(quán)以及更多元的收入機會。
但也如開篇所說,從李彥宏所述的產(chǎn)業(yè)發(fā)展邏輯來講,這樣的做法是將眼光放置到了更長遠的發(fā)展周期。
“大家很容易把這波生成式AI和上一波移動互聯(lián)網(wǎng)或者上上一波PC互聯(lián)網(wǎng)相比,那之后的確出現(xiàn)了超級應用。但人工智能很像是一次新的工業(yè)革命,這意味著它不是三五年就結(jié)束,不是一兩年就出現(xiàn)超級應用的過程,它更像是三五十年對于整個社會的方方面面一個非常徹底的重構(gòu)!袄顝┖暾f,AI的超級應用會有,只是現(xiàn)在時機未到。
另外,他在本次峰會上提出的另一個觀點亦引發(fā)了極大關注與反響——過去24個月,這個行業(yè)最大的變化是大模型基本消除了幻覺,回答問題的準確性大幅提升。
實際上,正是得益于文生圖檢索增強(iRAG)這類技術(shù)的逐漸成熟,才使得AI工具在落地使用時能夠減少幻覺,提升準確性與可控性。
務實的AI理想主義者
這里面還繞不開的一部分則包括百度自身在大模型等底層技術(shù)與框架的不斷增強升級。
C114了解到,在文生圖檢索增強(iRAG)的實現(xiàn)中,首先,基于大模型對用戶的需求進行分析理解,自動規(guī)劃精確或泛化方案,比如對哪些實體進行增強;接著在增強階段,對需要增強的實體,檢索并選擇相應的參考圖。最后在生成階段,百度自研了多?煽厣鷪D大模型,一方面,通過局部注意力計算,在保持實體特征不變的情況下,實現(xiàn)了圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風格的牛頓;另一方面,通過整體注意力計算,進行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。
不過,這并非李彥宏在大會上的演講重點。比起追逐大模型不斷迭代衍生的超級能力,他更愿意討論應用的場景和真正的市場需求,而且這些應用是被千千萬萬普羅大眾用戶所使用。
說回上面提到的“無代碼秒噠”。利用AI來進行輔助代碼生成已非什么新鮮事,而百度這一有望于明年第一季度上線試用的新產(chǎn)品,則是希望將這樣的先進生產(chǎn)力能力下沉到規(guī)模更大的、可能毫不具備相關基礎知識的用戶群。簡單來說,通過無代碼編程,由大模型直接生成代碼,不需要人寫一行代碼,這意味著門檻低,人人可上手。按李彥宏的話來說,這將開啟一個“只靠想法就能賺錢的時代”。
身處AI這樣一個瞬息萬變的前沿行業(yè),他認為面向未來做出判斷時并不是在做猜謎游戲。而是先擁有一個愿景,然后再去實現(xiàn)這個愿景。在C114看來,李彥宏所描述的愿景中,既有手可摘星辰的浪漫主義,也有堅持普惠大眾的務實精神。
李彥宏表示,“今天,隨著基礎模型和智能體的能力逐步提升,我們把這些能力綜合在一起,就可以讓普通人,一行代碼都看不懂的人,具備程序員的能力。當幾億、十幾億人都具備這種能力的時候,它對于創(chuàng)造力的爆發(fā),是輔助代碼生成工具沒法比的。輔助代碼工具還是讓金字塔塔尖的人更加powerful。而我們希望金字塔中間層和底層的人,擁有金字塔塔尖這些人的能力,這個意義更大”。李彥宏在采訪中說到。