2024/7/8 11:31

構建未來，共話AI基礎設施｜2024WAIC“探索下一代大模型的基礎研究”論壇成功舉辦

C114通信網

在2024世界人工智能大會論壇上，國內外院士、專家學者齊聚“超越邊界：探索下一代大模型的基礎研究”論壇，共同探討“AI for Science 基礎設施建設”和“下一代通用人工智能方法”兩大前沿技術話題。本次論壇由世界人工智能大會組委會辦公室主辦，上海算法創(chuàng)新研究院和北京科學智能研究院承辦，上海市人工智能行業(yè)協(xié)會提供支持。論壇旨在搭建推動下一代人工智能技術交流協(xié)作的平臺，推動基礎設施建設，激發(fā)創(chuàng)新效能。

共建AI for Science基礎設施，邁向平臺科研時代

“AI for Science在材料、生命科學、能源化工等領域落地成果的不斷涌現(xiàn)，讓我們看到其帶來的巨大前景。但AI for Science帶來的不僅僅是點狀的突破，而是系統(tǒng)性地帶動科學研究基礎設施的建設，推進邁向“平臺科研”時代。”論壇伊始，中國科學院院士鄂維南為大會帶來了引導發(fā)言。他深入分析了AI for Science目前所處的發(fā)展階段，以及推動AI for Science的基礎設施建設的重要性，并設計了“四梁N柱”架構，鄂院士提到，“回顧科學研究的基本資源和基本方法，無論哪個科研方向，都少不了基本原理、實驗、文獻、算力的支撐。因此，構建科學研究的通用基礎平臺，即基本原理和數(shù)據(jù)驅動的模型算法與軟件、替代文獻的數(shù)據(jù)庫與知識庫、高效率、高精度的實驗表征方法、高度整合的算力平臺，可以推動共性問題的解決。

AI的方法大大提升了我們的科研能力，但是離真正解決問題還有距離，這剩下的“最后一公里”該如何打通？在會上這場重磅嘉賓陣容的圓桌對話里，中國科學院院士鄂維南、龔新高、丁洪，美國國家工程院院士、香港大學工程學院院長David J. Srolovitz，上�？萍即髮W副教務長劉志，上海大學教授劉軼，北京應用物理與計算數(shù)學研究所研究員王涵在圓桌對話中對此進行了探討，從構建科學大模型、科學大裝置等基礎設施方面表達了看法，并共識了一個富有啟發(fā)性的觀點：“AI for Science的基礎設施建設需要跨學科的合作，這是實現(xiàn)科學突破的關鍵。我們應聚焦產業(yè)關鍵問題，賦能工業(yè)應用的實際場景。”那么，我們采取什么樣的道路才能實現(xiàn)真正的科學大模型呢？專家們指出，“在聚焦算力和算法的同時，要重點關注數(shù)據(jù)，而這些數(shù)據(jù)不單單是計算數(shù)據(jù)，還有來自于實驗所產生的數(shù)據(jù)，從這些數(shù)據(jù)中誕生新的模型。而驗證這些數(shù)據(jù)的準確性，同樣需要AI的賦能。”

在共性平臺的基礎上，圍繞具體應用（如生物醫(yī)藥、新材料、電池等），可高效率地推動對具體問題的研究。材料是AI for Science的重要應用場景之一。“AI for Materials”（AI4M）已成為材料科學研究與開發(fā)的重要組成部分，加深了我們對成分-結構-性能關系的理解，并促進了具有目標性能的材料設計。“AI技術能夠在全周期加速材料研發(fā)，提高材料研發(fā)的成功率”。會上，美國國家工程院院士、香港大學工程學院院長David J. Srolovitz從AI與材料科學的結合與應用展開了報告， “諸如深度勢能等AI for Science代表方法在材料研究方面的廣泛應用，已經推動實現(xiàn)了第一性原理精度的大規(guī)模模擬。”報告內容再次展示了人工智能應用在科學研究中的強大能力，以及AI賦能的原子間作用勢能研究，“整合了提示詞工程的大語言模型在材料發(fā)現(xiàn)和設計領域已經展現(xiàn)了卓越的性能，它能夠解析并理解材料成分、結構、以及性質之間的復雜關系。”

學科的交叉可以碰撞出新的火花，對 AI for Science基礎設施建設的創(chuàng)新思路也有新的啟迪。“AI智能體引入，將為科研人員賦能，激發(fā)創(chuàng)新靈感，大幅縮短研究周期，填補研發(fā)人員的短板，讓科學家有工程思維，工程師有產品思維。從而減少每個研發(fā)步驟之間的隔閡。同樣，材料科學也為AI帶來了新的挑戰(zhàn)，AI硬件問題的解決也需要材料科學推動。”中國科學院院士、北京大學副校長、北京大學博雅講席教授張錦院士提到。

我們欣喜地看到，業(yè)內已經有產品化與平臺化的成果產出，OpenLAM就是“平臺科研”與“開源共建”的一個典型代表。“語言數(shù)據(jù)的爆炸性增長孕育了大語言模型，同樣地，微觀尺度數(shù)據(jù)的累積也催生了一種創(chuàng)新的模型——大原子模型。”北京科學智能研究院院長、深勢科技創(chuàng)始人張林峰表示“這一模型的誕生，將帶來仿真設計在時空尺度與覆蓋范圍的量級式提升，實驗表征信號將能被更好地解析，它將成為原子級生產制造的重要組成部分。”OpenLAM計劃已于2023年底正式發(fā)起，北京科學智能研究院協(xié)同DeepModeling開源社區(qū)以及30多家共建單位，并邀請了原子級建模、表征、制造以及AI產業(yè)的多位院士、專家組成顧問團，共同推動構建大原子模型的“社區(qū)模式”。秉承“廣泛覆蓋、謹慎評估、開源開放、開箱即用”的開發(fā)理念，本論壇上最新發(fā)布了在合金、動態(tài)催化、分子反應、藥物小分子、固態(tài)電池、半導體、高溫超導7個領域模型解決方案，這些模型均以開放社區(qū)的形式發(fā)展而來，并在科學智能廣場可下載。“實驗科學家的語言和視角還未與AI技術和數(shù)據(jù)庫形成有效的連接，為此我們開發(fā)了‘晶體造句’APP，希望更多實驗科學家通過這個APP的窗口，來發(fā)現(xiàn)并合成更多人們尚未充分探索的材料。”

AI for Science的各項基礎設施正在全面落地建設，不僅僅是OpenLAM，本次論壇還同期發(fā)布了AI for Science的另一重要基礎設施，替代文獻的數(shù)據(jù)庫和知識庫的優(yōu)秀實踐產品——Science Navigator 1.0。當前，對學科交叉檢索、原文內容溯源、科研數(shù)據(jù)解讀的需求已經遠遠超出了傳統(tǒng)文獻檢索工具的能力范圍，新一代科研文獻開放平臺Science Navigator應運而生。“Science Navigator 強大的自然語言對話式檢索能力，能夠迅速定位到科研工作者所需的信息，且回答可溯源到文獻原文。”北京科學智能研究院副院長李鑫宇介紹道，“AI向量數(shù)據(jù)庫疊加大語言模型讓訓練和推理成本大幅降低，等效實現(xiàn)3-6倍參數(shù)量模型效果。Science Navigator 1.0不僅僅是一個為科研工作者量身打造的AI平臺，它更是一個全新的科研生態(tài)系統(tǒng)。Science Navigator開放了絕大部分能力的API接口，使用者可以在這個平臺的基礎上構建自己的應用和智能體，以滿足科研復雜的個性需求，釋放更多的時間精力在解決關鍵問題與創(chuàng)新思考上。”

專家云集，共話下一代人工智能方法路在何方

從基礎理論到通用算法，AI技術的快速發(fā)展不僅改寫了范式，也正在將萬物智聯(lián)的未來視野變?yōu)楝F(xiàn)實。

“雖然目前人工智能算法、大模型已經取得了突出的進步，但是我們還需要繼續(xù)探索新的技術路線，以適合我國的實際發(fā)展需要。”面向下一代通用人工智能方法這一話題，引發(fā)了參會嘉賓們的思考。為此，中國科學院院士鄂維南、中國人民大學高瓴人工智能學院執(zhí)行院長文繼榮、復旦大學教授邱錫鵬、華為云大數(shù)據(jù)與人工智能總裁尤鵬、墨奇科技聯(lián)合創(chuàng)始人/CTO湯林鵬、上海算法創(chuàng)新研究院研究員楊泓康展開了激烈討論，參會嘉賓認為，“必須且亟需建立人工智能的底層能力，探索出一條更加可持續(xù)、能夠解決當前大規(guī)模能源資源消耗問題的通用人工智能方法。也有嘉賓指出，“大模型的完善要從優(yōu)化知識存儲能力和提高知識使用效率雙管齊下，催生模型”慢思考“能力。當模型有了解決復雜問題的能力，可能會帶來一系列的變化，比如在科研和技術的加速，新材料的發(fā)現(xiàn)等等，值得我們的持續(xù)關注。”與會嘉賓在此共識，“要實現(xiàn)下一代通用人工智能，需要在算力資源、數(shù)據(jù)資源、AI數(shù)據(jù)庫能力、下一代模型和人才資源等方面久久為功。”人工智能方法還是有很多沒有被探索，應該與場景去結合，從應用到底層技術進行創(chuàng)新。

針對當下通用人工智能的技術熱點與未來人工智能發(fā)展的必然趨勢，論壇嘉賓分享了他們獨到的技術見解。“生成式AI或者擴散模型遠遠不只于生成視頻或者圖片，使其應用于生命科學和材料科學，如蛋白質結構，RNA序列研究，晶體結構的設計等。”普林斯頓大學教授、普林斯頓人工智能創(chuàng)新中心主任王夢迪分享道。“不管是生成式AI，擴散模型，還是大語言模型，讓它變得更有用，更有意思，和人類的價值對齊，我認為我們需要做到的事情是讓這些模型可控，這是通向AGI的必經之路。”

我們當前正處在一波人工智能真實場景應用的浪潮之中，也為支持人工智能的硬件發(fā)展提出了多功耗，多場景覆蓋等更高的要求。在算力方面，未來我們期望的AI，不僅是解決特定問題的工具，更是能夠跨領域學習和創(chuàng)新的合作伙伴。華為昇騰計算業(yè)務CTO周斌以“大模型算力基礎設施的挑戰(zhàn)和發(fā)展探討”為主線展開報告，分享了他的觀點。“構建彈性靈活的算力基礎設施，并發(fā)展對應的數(shù)據(jù)軟件框架與優(yōu)化算法，是確保下一代人工智能發(fā)展至關重要的基礎環(huán)節(jié)。業(yè)界主流模型從千億稠密到萬億稀疏，并逐步走向百萬級超長序列和多模態(tài)，大規(guī)模算力成為支撐高質量大模型創(chuàng)新落地的關鍵基礎。”

那么下一代通用人工智能模型是什么樣的？論壇上的專家們也給出了各自的見解。其中之一是類比人腦記憶與思考方式的記憶分層大模型。目前記憶分層的大模型已經在上海算法創(chuàng)新研究院實現(xiàn)。會上，上海算法創(chuàng)新研究院大模型中心負責人熊飛宇發(fā)布了最新科研成果——憶3大模型（Memory3），該模型創(chuàng)新地引入了顯性記憶機制，顯著提高了性能并降低了訓練與推理成本。憶3在傳統(tǒng)的模型參數(shù)（隱性記憶）與上下文鍵值（工作記憶）之外，增加了第三種形式的記憶——顯性記憶。模型無需訓練即可將文本轉換為顯性記憶，并在推理時快速且稀疏地使用記憶。通過外部化模型存儲的知識，顯性記憶減輕了模型參數(shù)的負擔，進而提高了模型的參數(shù)效率與訓練效率，使基準測試上憶3能夠實現(xiàn)約3倍參數(shù)量模型的性能�；趹�3架構的AI搜索引擎，利用顯性記憶的快速讀寫，使回答的時效性更強，準確率更高，內容更完整，還能夠根據(jù)用戶的反饋實時更新和優(yōu)化答案。隱性記憶使搜索引擎能夠理解復雜的上下文關系，提供更精準和個性化的搜索結果�；趹�3的特性，這款AI搜索引擎不僅提高了用戶的搜索體驗，還在信息檢索領域樹立了新的標桿。此外，憶3已在金融、媒體等行業(yè)落地應用。

隨著以深度學習、大模型為代表的 AI 技術迅速發(fā)展，圖像、視頻、文本、語音等的非結構化數(shù)據(jù)處理的需求和能力也有了爆發(fā)式的增長。高維向量是非結構化數(shù)據(jù)的統(tǒng)一語義表征，但主流的向量數(shù)據(jù)庫存在通用數(shù)據(jù)管理能力不足，面對海量數(shù)據(jù)時性能、可擴展性不佳的問題，難以應對大規(guī)模復雜 AI 應用的需求，而 MyScale 的初衷就是克服這些問題并成為 AI 時代的數(shù)據(jù)底座。墨奇科技聯(lián)合創(chuàng)始人/CTO湯林鵬介紹道，“MyScale 是國際上首個專為大規(guī)模結構化和非結構化數(shù)據(jù)處理設計的 AI 數(shù)據(jù)庫，支持海量結構化、向量、文本等各類異構數(shù)據(jù)的高效存儲和聯(lián)合查詢，綜合性能比國內外其他產品提高 4-10 倍。在實際生產中，MyScale AI 數(shù)據(jù)庫成功扮演了大模型+大數(shù)據(jù)雙輪驅動下的統(tǒng)一 AI 數(shù)據(jù)底座。在金融文檔分析、科研文獻智能問答分析、企業(yè)私域知識管理、工業(yè)/制造業(yè)智能化、零售行業(yè)客戶服務、人力資源行業(yè)智能化、法律行業(yè)智能化等應用場景中均幫助客戶創(chuàng)造了巨大價值，加速了大模型和場景數(shù)據(jù)結合的技術創(chuàng)新和應用落地。”

此外，本次論壇嘉賓也在人工智能人才培養(yǎng)上提出了建議與期待。目前，我國人工智能領域的人才需求量巨大，亟需打造體系化、高層次的人工智能和基礎研究人才培養(yǎng)平臺，培養(yǎng)使用戰(zhàn)略科學家，支持青年科技人才挑大梁、擔重任，加快凝聚一批跨學科發(fā)展研發(fā)隊伍，鼓勵更多研究人員投身交叉科學研究和基礎研究。

未來，從現(xiàn)在出發(fā)。在不斷探索人工智能邊界的道路上，培植下一代通用人工智能方法、完善AI for Science的基礎設施極為關鍵，它將推動科技向前發(fā)展，解鎖以前難以想象的創(chuàng)新可能性。

給作者點贊

0 VS 0

寫得不太好

相關鏈接

搜索引擎整合最后一公里電池半導體

2024 WAIC | 現(xiàn)場專訪：中興通訊產品規(guī)劃首席科學家王衛(wèi)斌
C114通信網 7-9
WAIC2024|中興通訊AI創(chuàng)新生態(tài)論壇：開放合作，共建繁榮AI生態(tài)
C114通信網 7-9
以數(shù)智化服務普惠億萬客戶中國移動“AI+10086”數(shù)智實踐成果精彩亮相WAIC
廠商供稿 7-8
蜜巢政務大模型3.0重磅發(fā)布華為昇騰與蜜度合作簽約
C114通信網 7-6

構建未來，共話AI基礎設施｜2024WAIC“探索下一代大模型的基礎研究”論壇成功舉辦

構建未來，共話AI基礎設施｜2024WAIC“探索下一代大模型的基礎研究”論壇成功舉辦