C114通信網  |  通信人家園

會展
2024/7/8 11:31

構建未來,共話AI基礎設施|2024WAIC“探索下一代大模型的基礎研究”論壇成功舉辦

C114通信網  

在2024世界人工智能大會論壇上,國內外院士、專家學者齊聚“超越邊界:探索下一代大模型的基礎研究”論壇,共同探討“AI for Science 基礎設施建設”和“下一代通用人工智能方法”兩大前沿技術話題。本次論壇由世界人工智能大會組委會辦公室主辦,上海算法創(chuàng)新研究院和北京科學智能研究院承辦,上海市人工智能行業(yè)協(xié)會提供支持。論壇旨在搭建推動下一代人工智能技術交流協(xié)作的平臺,推動基礎設施建設,激發(fā)創(chuàng)新效能。

共建AI for Science基礎設施,邁向平臺科研時代

“AI for Science在材料、生命科學、能源化工等領域落地成果的不斷涌現(xiàn),讓我們看到其帶來的巨大前景。但AI for Science帶來的不僅僅是點狀的突破,而是系統(tǒng)性地帶動科學研究基礎設施的建設,推進邁向“平臺科研”時代。”論壇伊始,中國科學院院士鄂維南為大會帶來了引導發(fā)言。他深入分析了AI for Science目前所處的發(fā)展階段,以及推動AI for Science的基礎設施建設的重要性,并設計了“四梁N柱”架構,鄂院士提到,“回顧科學研究的基本資源和基本方法,無論哪個科研方向,都少不了基本原理、實驗、文獻、算力的支撐。因此,構建科學研究的通用基礎平臺,即基本原理和數(shù)據(jù)驅動的模型算法與軟件、替代文獻的數(shù)據(jù)庫與知識庫、高效率、高精度的實驗表征方法、高度整合的算力平臺,可以推動共性問題的解決。

AI的方法大大提升了我們的科研能力,但是離真正解決問題還有距離,這剩下的“最后一公里”該如何打通?在會上這場重磅嘉賓陣容的圓桌對話里,中國科學院院士鄂維南、龔新高、丁洪,美國國家工程院院士、香港大學工程學院院長David J. Srolovitz,上?萍即髮W副教務長劉志,上海大學教授劉軼,北京應用物理與計算數(shù)學研究所研究員王涵在圓桌對話中對此進行了探討,從構建科學大模型、科學大裝置等基礎設施方面表達了看法,并共識了一個富有啟發(fā)性的觀點:“AI for Science的基礎設施建設需要跨學科的合作,這是實現(xiàn)科學突破的關鍵。我們應聚焦產業(yè)關鍵問題,賦能工業(yè)應用的實際場景。”那么,我們采取什么樣的道路才能實現(xiàn)真正的科學大模型呢?專家們指出,“在聚焦算力和算法的同時,要重點關注數(shù)據(jù),而這些數(shù)據(jù)不單單是計算數(shù)據(jù),還有來自于實驗所產生的數(shù)據(jù),從這些數(shù)據(jù)中誕生新的模型。而驗證這些數(shù)據(jù)的準確性,同樣需要AI的賦能。”

在共性平臺的基礎上,圍繞具體應用(如生物醫(yī)藥、新材料、電池等),可高效率地推動對具體問題的研究。材料是AI for Science的重要應用場景之一。“AI for Materials”(AI4M)已成為材料科學研究與開發(fā)的重要組成部分,加深了我們對成分-結構-性能關系的理解,并促進了具有目標性能的材料設計。“AI技術能夠在全周期加速材料研發(fā),提高材料研發(fā)的成功率”。會上,美國國家工程院院士、香港大學工程學院院長David J. Srolovitz從AI與材料科學的結合與應用展開了報告, “諸如深度勢能等AI for Science代表方法在材料研究方面的廣泛應用,已經推動實現(xiàn)了第一性原理精度的大規(guī)模模擬。”報告內容再次展示了人工智能應用在科學研究中的強大能力,以及AI賦能的原子間作用勢能研究,“整合了提示詞工程的大語言模型在材料發(fā)現(xiàn)和設計領域已經展現(xiàn)了卓越的性能,它能夠解析并理解材料成分、結構、以及性質之間的復雜關系。”

學科的交叉可以碰撞出新的火花,對 AI for Science基礎設施建設的創(chuàng)新思路也有新的啟迪。“AI智能體引入,將為科研人員賦能,激發(fā)創(chuàng)新靈感,大幅縮短研究周期,填補研發(fā)人員的短板,讓科學家有工程思維,工程師有產品思維。從而減少每個研發(fā)步驟之間的隔閡。同樣,材料科學也為AI帶來了新的挑戰(zhàn),AI硬件問題的解決也需要材料科學推動。”中國科學院院士、北京大學副校長、北京大學博雅講席教授張錦院士提到。

 

 

 

 

我們欣喜地看到,業(yè)內已經有產品化與平臺化的成果產出,OpenLAM就是“平臺科研”與“開源共建”的一個典型代表。“語言數(shù)據(jù)的爆炸性增長孕育了大語言模型,同樣地,微觀尺度數(shù)據(jù)的累積也催生了一種創(chuàng)新的模型——大原子模型。”北京科學智能研究院院長、深勢科技創(chuàng)始人張林峰表示“這一模型的誕生,將帶來仿真設計在時空尺度與覆蓋范圍的量級式提升,實驗表征信號將能被更好地解析,它將成為原子級生產制造的重要組成部分。”OpenLAM計劃已于2023年底正式發(fā)起,北京科學智能研究院協(xié)同DeepModeling開源社區(qū)以及30多家共建單位,并邀請了原子級建模、表征、制造以及AI產業(yè)的多位院士、專家組成顧問團,共同推動構建大原子模型的“社區(qū)模式”。秉承“廣泛覆蓋、謹慎評估、開源開放、開箱即用”的開發(fā)理念,本論壇上最新發(fā)布了在合金、動態(tài)催化、分子反應、藥物小分子、固態(tài)電池、半導體、高溫超導7個領域模型解決方案,這些模型均以開放社區(qū)的形式發(fā)展而來,并在科學智能廣場可下載。“實驗科學家的語言和視角還未與AI技術和數(shù)據(jù)庫形成有效的連接,為此我們開發(fā)了‘晶體造句’APP,希望更多實驗科學家通過這個APP的窗口,來發(fā)現(xiàn)并合成更多人們尚未充分探索的材料。”

AI for Science的各項基礎設施正在全面落地建設,不僅僅是OpenLAM,本次論壇還同期發(fā)布了AI for Science的另一重要基礎設施,替代文獻的數(shù)據(jù)庫和知識庫的優(yōu)秀實踐產品——Science Navigator 1.0。當前,對學科交叉檢索、原文內容溯源、科研數(shù)據(jù)解讀的需求已經遠遠超出了傳統(tǒng)文獻檢索工具的能力范圍,新一代科研文獻開放平臺Science Navigator應運而生。“Science Navigator 強大的自然語言對話式檢索能力,能夠迅速定位到科研工作者所需的信息,且回答可溯源到文獻原文。”北京科學智能研究院副院長李鑫宇介紹道,“AI向量數(shù)據(jù)庫疊加大語言模型讓訓練和推理成本大幅降低,等效實現(xiàn)3-6倍參數(shù)量模型效果。Science Navigator 1.0不僅僅是一個為科研工作者量身打造的AI平臺,它更是一個全新的科研生態(tài)系統(tǒng)。Science Navigator開放了絕大部分能力的API接口,使用者可以在這個平臺的基礎上構建自己的應用和智能體,以滿足科研復雜的個性需求,釋放更多的時間精力在解決關鍵問題與創(chuàng)新思考上。”

 

 

專家云集,共話下一代人工智能方法路在何方

從基礎理論到通用算法,AI技術的快速發(fā)展不僅改寫了范式,也正在將萬物智聯(lián)的未來視野變?yōu)楝F(xiàn)實。

“雖然目前人工智能算法、大模型已經取得了突出的進步,但是我們還需要繼續(xù)探索新的技術路線,以適合我國的實際發(fā)展需要。”面向下一代通用人工智能方法這一話題,引發(fā)了參會嘉賓們的思考。為此,中國科學院院士鄂維南、中國人民大學高瓴人工智能學院執(zhí)行院長文繼榮、復旦大學教授邱錫鵬、華為云大數(shù)據(jù)與人工智能總裁尤鵬、墨奇科技聯(lián)合創(chuàng)始人/CTO湯林鵬、上海算法創(chuàng)新研究院研究員楊泓康展開了激烈討論,參會嘉賓認為,“必須且亟需建立人工智能的底層能力,探索出一條更加可持續(xù)、能夠解決當前大規(guī)模能源資源消耗問題的通用人工智能方法。也有嘉賓指出,“大模型的完善要從優(yōu)化知識存儲能力和提高知識使用效率雙管齊下,催生模型”慢思考“能力。當模型有了解決復雜問題的能力,可能會帶來一系列的變化,比如在科研和技術的加速,新材料的發(fā)現(xiàn)等等,值得我們的持續(xù)關注。”與會嘉賓在此共識,“要實現(xiàn)下一代通用人工智能,需要在算力資源、數(shù)據(jù)資源、AI數(shù)據(jù)庫能力、下一代模型和人才資源等方面久久為功。”人工智能方法還是有很多沒有被探索,應該與場景去結合,從應用到底層技術進行創(chuàng)新。

針對當下通用人工智能的技術熱點與未來人工智能發(fā)展的必然趨勢,論壇嘉賓分享了他們獨到的技術見解。“生成式AI或者擴散模型遠遠不只于生成視頻或者圖片,使其應用于生命科學和材料科學,如蛋白質結構,RNA序列研究,晶體結構的設計等。”普林斯頓大學教授、普林斯頓人工智能創(chuàng)新中心主任王夢迪分享道。“不管是生成式AI,擴散模型,還是大語言模型,讓它變得更有用,更有意思,和人類的價值對齊,我認為我們需要做到的事情是讓這些模型可控,這是通向AGI的必經之路。”

我們當前正處在一波人工智能真實場景應用的浪潮之中,也為支持人工智能的硬件發(fā)展提出了多功耗,多場景覆蓋等更高的要求。在算力方面,未來我們期望的AI,不僅是解決特定問題的工具,更是能夠跨領域學習和創(chuàng)新的合作伙伴。華為昇騰計算業(yè)務CTO周斌以“大模型算力基礎設施的挑戰(zhàn)和發(fā)展探討”為主線展開報告,分享了他的觀點。“構建彈性靈活的算力基礎設施,并發(fā)展對應的數(shù)據(jù)軟件框架與優(yōu)化算法,是確保下一代人工智能發(fā)展至關重要的基礎環(huán)節(jié)。業(yè)界主流模型從千億稠密到萬億稀疏,并逐步走向百萬級超長序列和多模態(tài),大規(guī)模算力成為支撐高質量大模型創(chuàng)新落地的關鍵基礎。”

 

 

那么下一代通用人工智能模型是什么樣的?論壇上的專家們也給出了各自的見解。其中之一是類比人腦記憶與思考方式的記憶分層大模型。目前記憶分層的大模型已經在上海算法創(chuàng)新研究院實現(xiàn)。會上,上海算法創(chuàng)新研究院大模型中心負責人熊飛宇發(fā)布了最新科研成果——憶3大模型(Memory3),該模型創(chuàng)新地引入了顯性記憶機制,顯著提高了性能并降低了訓練與推理成本。憶3在傳統(tǒng)的模型參數(shù)(隱性記憶)與上下文鍵值(工作記憶)之外,增加了第三種形式的記憶——顯性記憶。模型無需訓練即可將文本轉換為顯性記憶,并在推理時快速且稀疏地使用記憶。通過外部化模型存儲的知識,顯性記憶減輕了模型參數(shù)的負擔,進而提高了模型的參數(shù)效率與訓練效率,使基準測試上憶3能夠實現(xiàn)約3倍參數(shù)量模型的性能;趹3架構的AI搜索引擎,利用顯性記憶的快速讀寫,使回答的時效性更強,準確率更高,內容更完整,還能夠根據(jù)用戶的反饋實時更新和優(yōu)化答案。隱性記憶使搜索引擎能夠理解復雜的上下文關系,提供更精準和個性化的搜索結果;趹3的特性,這款AI搜索引擎不僅提高了用戶的搜索體驗,還在信息檢索領域樹立了新的標桿。此外,憶3已在金融、媒體等行業(yè)落地應用。

隨著以深度學習、大模型為代表的 AI 技術迅速發(fā)展,圖像、視頻、文本、語音等的非結構化數(shù)據(jù)處理的需求和能力也有了爆發(fā)式的增長。高維向量是非結構化數(shù)據(jù)的統(tǒng)一語義表征,但主流的向量數(shù)據(jù)庫存在通用數(shù)據(jù)管理能力不足,面對海量數(shù)據(jù)時性能、可擴展性不佳的問題,難以應對大規(guī)模復雜 AI 應用的需求,而 MyScale 的初衷就是克服這些問題并成為 AI 時代的數(shù)據(jù)底座。墨奇科技聯(lián)合創(chuàng)始人/CTO湯林鵬介紹道,“MyScale 是國際上首個專為大規(guī)模結構化和非結構化數(shù)據(jù)處理設計的 AI 數(shù)據(jù)庫,支持海量結構化、向量、文本等各類異構數(shù)據(jù)的高效存儲和聯(lián)合查詢,綜合性能比國內外其他產品提高 4-10 倍。在實際生產中,MyScale AI 數(shù)據(jù)庫成功扮演了大模型+大數(shù)據(jù)雙輪驅動下的統(tǒng)一 AI 數(shù)據(jù)底座。在金融文檔分析、科研文獻智能問答分析、企業(yè)私域知識管理、工業(yè)/制造業(yè)智能化、零售行業(yè)客戶服務、人力資源行業(yè)智能化、法律行業(yè)智能化等應用場景中均幫助客戶創(chuàng)造了巨大價值,加速了大模型和場景數(shù)據(jù)結合的技術創(chuàng)新和應用落地。”

 

 

此外,本次論壇嘉賓也在人工智能人才培養(yǎng)上提出了建議與期待。目前,我國人工智能領域的人才需求量巨大,亟需打造體系化、高層次的人工智能和基礎研究人才培養(yǎng)平臺,培養(yǎng)使用戰(zhàn)略科學家,支持青年科技人才挑大梁、擔重任,加快凝聚一批跨學科發(fā)展研發(fā)隊伍,鼓勵更多研究人員投身交叉科學研究和基礎研究。

未來,從現(xiàn)在出發(fā)。在不斷探索人工智能邊界的道路上,培植下一代通用人工智能方法、完善AI for Science的基礎設施極為關鍵,它將推動科技向前發(fā)展,解鎖以前難以想象的創(chuàng)新可能性。

給作者點贊
0 VS 0
寫得不太好
熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網站地圖 | 手機版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網 版權所有 舉報電話:021-54451141