工業(yè)和信息化部近日印發(fā)通知,組織開展算力強基揭榜行動。將面向計算、存儲、網(wǎng)絡(luò)、應(yīng)用、綠色、安全等六大重點方向,發(fā)掘一批掌握關(guān)鍵核心技術(shù)、具備較強創(chuàng)新能力的企事業(yè)單位,突破一批標志性技術(shù)產(chǎn)品和方案。工業(yè)和信息化部將統(tǒng)籌利用各類資源對揭榜入圍、優(yōu)勝單位予以支持,推動優(yōu)秀成果示范應(yīng)用推廣。
各省、自治區(qū)、直轄市工業(yè)和信息化主管部門、通信管理局以及有關(guān)中央企業(yè):
為夯實算力網(wǎng)絡(luò)發(fā)展底座,加快創(chuàng)新技術(shù)和產(chǎn)品應(yīng)用,推動算力網(wǎng)絡(luò)“點、鏈、網(wǎng)、面”體系化發(fā)展,現(xiàn)組織開展算力強基揭榜行動。有關(guān)事項通知如下:
一、揭榜任務(wù)內(nèi)容
面向算力網(wǎng)絡(luò)的計算、存儲、網(wǎng)絡(luò)、應(yīng)用、綠色、安全等六大重點方向,發(fā)掘一批掌握關(guān)鍵核心技術(shù)、具備較強創(chuàng)新能力的企事業(yè)單位,突破一批標志性技術(shù)產(chǎn)品和方案。
計算方面,攻關(guān)智能算力管理、算力加速等技術(shù),提高計算性能與效率;存儲方面,研發(fā)多介質(zhì)存儲設(shè)備管理、跨域存儲資源池協(xié)同等技術(shù),實現(xiàn)海量數(shù)據(jù)可靠與靈活存儲;網(wǎng)絡(luò)方面,突破算內(nèi)網(wǎng)絡(luò)與算間網(wǎng)絡(luò)等技術(shù),促進算力資源高速互聯(lián);應(yīng)用方面,加強算力與行業(yè)深度融合,實現(xiàn)多場景便捷用算;綠色方面,研發(fā)新型制冷、碳排放感知優(yōu)化等技術(shù),推動算力設(shè)施節(jié)能降碳;安全方面,推動智能監(jiān)測、運維機器人等技術(shù)發(fā)展,保障算力中心可靠運行。
二、申報和推薦
(一)申報單位須為在中華人民共和國境內(nèi)注冊、具有獨立法人資格、具有較強技術(shù)創(chuàng)新和產(chǎn)業(yè)化應(yīng)用能力的企事業(yè)單位。申報單位根據(jù)《算力強基揭榜行動任務(wù)榜單》(見附件)選擇揭榜任務(wù),并需承諾揭榜后能夠在指定期限內(nèi)完成相應(yīng)任務(wù),每個單位申報不超過3個項目。有關(guān)企業(yè)、高校、科研機構(gòu)等以聯(lián)合體方式申報的,牽頭單位為1家,聯(lián)合參與單位不超過4家。
(二)各省、自治區(qū)、直轄市工業(yè)和信息化主管部門、通信管理局以及有關(guān)中央企業(yè)按照政府引導、企業(yè)自愿的原則,組織有關(guān)單位積極申報揭榜,并作為推薦單位,遵循公開、公平、公正的原則,審核遴選推薦創(chuàng)新能力突出、產(chǎn)業(yè)化前景好、行業(yè)帶動作用明顯的項目,報工業(yè)和信息化部(信息通信發(fā)展司)。
三、工作程序和要求
(一)申報單位通過申報系統(tǒng)(https://gs.hcp.ac.cn)進行申報,完成注冊后填寫申報所需材料。申報截止時間為2025年3月15日。
(二)各省、自治區(qū)、直轄市工業(yè)和信息化主管部門、通信管理局以及有關(guān)中央企業(yè)作為推薦單位,應(yīng)于2025年3月31日前登錄系統(tǒng)并確認推薦名單(賬號密碼請通過聯(lián)系人獲。。推薦單位在每個方向推薦項目數(shù)量原則上不超過3個,所有方向累計推薦項目總量不超過20個。鼓勵各推薦單位結(jié)合實際情況,對推薦項目單位在政策、資金、資源配套等方面加大扶持力度。
(三)工業(yè)和信息化部組織遴選并公布入圍揭榜單位名單。入圍揭榜單位完成攻關(guān)任務(wù)后(名單公布之日起不超過2年),工業(yè)和信息化部委托第三方專業(yè)機構(gòu)開展測評工作,擇優(yōu)確定揭榜優(yōu)勝單位(每個揭榜方向原則上不超過3家)。工業(yè)和信息化部將統(tǒng)籌利用各類資源對揭榜入圍、優(yōu)勝單位予以支持,推動優(yōu)秀成果示范應(yīng)用推廣。
附件:算力強基揭榜行動任務(wù)榜單
工業(yè)和信息化部辦公廳
2025年2月21日
CAICT
附件
算力強基揭榜行動任務(wù)榜單
一、計算
(一)云邊端算網(wǎng)協(xié)同管理系統(tǒng)
揭榜任務(wù):面向云邊端多層級算力環(huán)境,研發(fā)算網(wǎng)協(xié)同應(yīng)用管理系統(tǒng),設(shè)計面向不同應(yīng)用軟件架構(gòu)的管理機制,支持對不同架構(gòu)應(yīng)用軟件的統(tǒng)一管理;研發(fā)應(yīng)用軟件在算網(wǎng)協(xié)同中的自動化構(gòu)建部署能力,支持應(yīng)用軟件的自動構(gòu)建和分發(fā)部署;研究算網(wǎng)協(xié)同應(yīng)用系統(tǒng)的一體化觀測能力,降低運維復雜度,提高復雜應(yīng)用軟件運行的穩(wěn)定性和可靠性。
預期目標:到2026年,研制應(yīng)用軟件管理系統(tǒng),支持對傳統(tǒng)應(yīng)用軟件、云原生應(yīng)用軟件、AI應(yīng)用軟件、大數(shù)據(jù)應(yīng)用軟件等不少于5種應(yīng)用軟件的全生命周期管理。研究基于算網(wǎng)協(xié)同的分布式構(gòu)建和部署技術(shù),支持上述應(yīng)用軟件的自動分發(fā)和跨算力節(jié)點部署,實現(xiàn)零人工介入。研發(fā)算網(wǎng)應(yīng)用一體化觀測功能,具備白盒化動態(tài)分析以及智能故障根因定位能力。在不少于3個行業(yè)完成試點驗證。
(二)支持超大規(guī)模參數(shù)模型的訓推一體化異構(gòu)智算平臺
揭榜任務(wù):面向人工智能大模型訓練和推理對計算資源的需求,研發(fā)支持超大規(guī)模參數(shù)模型的訓練、推理一體化智算平臺,包括資源調(diào)度策略、訓推加速套件等,并可支持多種硬件架構(gòu),屏蔽底層硬件差異,提升超大規(guī)模模型在訓練、推理過程中穩(wěn)定性、資源利用率和運行效率。
預期目標:到2026年,研發(fā)一套支持萬億參數(shù)模型的超大規(guī)模訓推一體化智算平臺,萬卡環(huán)境下穩(wěn)定訓練時間不低于30天,有效訓練時長不低于95%,訓練效率較當前主流水平提升不低于30%,推理效率提升不低于50%。支持主流深度學習框架,兼容多種硬件架構(gòu),并提供統(tǒng)一的編程接口和開發(fā)環(huán)境,實現(xiàn)不低于10個行業(yè)用戶的落地驗證。
(三)異構(gòu)算力跨域任務(wù)編排系統(tǒng)
揭榜任務(wù):針對跨域異構(gòu)算力協(xié)同,研發(fā)跨域異構(gòu)算力管理系統(tǒng),實現(xiàn)跨域異構(gòu)算力的管理和應(yīng)用。研發(fā)針對多樣性算力的規(guī)范化開放互聯(lián)功能,支持對不同類型的異構(gòu)算力模型統(tǒng)一抽象封裝;研發(fā)跨域異構(gòu)算力的管理功能,支持對跨域異構(gòu)算力的統(tǒng)一管理和協(xié)同;研究跨域多主體算力的安全認證和控制方法,保障跨域協(xié)同安全。
預期目標:到2026年,研發(fā)不少于6種跨域協(xié)同調(diào)度算法,支持數(shù)據(jù)處理、函數(shù)計算、機器學習等不少于3個場景的計算任務(wù)部署,完成不少于5個跨域算力中心的統(tǒng)一管理。研發(fā)跨域多主體算力的安全認證方法,支持云邊端等不同層級算力協(xié)同的安全要求。在不少于2個行業(yè)完成試點驗證。
(四)訓推算力一體機
揭榜任務(wù):面向人工智能訓練、推理場景,研發(fā)基于基礎(chǔ)設(shè)施即服務(wù)(IaaS)和平臺即服務(wù)(PaaS)的高性能訓推一體化解決方案,覆蓋對大模型開發(fā)訓練和部署推理的全流程,包括數(shù)據(jù)準備、模型訓練、模型評測和模型部署。同時,支持大模型加密、攻擊防御等能力,解決針對大模型數(shù)據(jù)泄露、指令攻擊等安全問題和風險。
預期目標:到2026年,研發(fā)支持至少3種指令集芯片的訓推一體機,針對至少5個行業(yè)開展人工智能訓推一體機應(yīng)用,為用戶提供多元化訓推一體化服務(wù),并在至少10種不同的場景進行人工智能訓推一體機落地。
(五)大規(guī)模異構(gòu)算力集群推理加速技術(shù)
揭榜任務(wù):研發(fā)存儲、網(wǎng)絡(luò)、計算的協(xié)同優(yōu)化技術(shù),通過模型加速、調(diào)度加速等方法實現(xiàn)大規(guī)模異構(gòu)算力集群在大模型推理方面的加速,從而支持更大的模型、更長的上下文、更高的性能及更低的能耗,促進算力芯片在大模型推理方面的更好應(yīng)用。
預期目標:到2026年,實現(xiàn)集群有效吞吐量5倍以上提升,實際應(yīng)用場景中可處理的請求數(shù)提升1倍以上,首字延遲性能提升1倍以上,芯片利用率提升50%以上。通過優(yōu)化算力中心計算、存儲、網(wǎng)絡(luò)的配比以及拓撲結(jié)構(gòu)和系統(tǒng)調(diào)度策略,實現(xiàn)千卡以上異構(gòu)集群在推理加速領(lǐng)域的突破。
二、存儲
(六)磁光電融合存儲系統(tǒng)
揭榜任務(wù):針對單一存儲介質(zhì)難以滿足多樣化數(shù)據(jù)存儲需求的現(xiàn)狀,依托磁、光、電存儲在性能、壽命、功耗等方面的差異化特性,將磁、光、電存儲技術(shù)進行融合,研發(fā)磁光電融合存儲系統(tǒng),構(gòu)建基于固態(tài)硬盤(SSD)、機械硬盤(HDD)和光存儲的多級存儲架構(gòu)。根據(jù)業(yè)務(wù)特征,將數(shù)據(jù)保存在不同級別的存儲設(shè)備中,實現(xiàn)海量數(shù)據(jù)的集中、統(tǒng)一存儲管理,支撐算力中心高效、低碳、安全持續(xù)發(fā)展。
預期目標:到2026年,研發(fā)磁、光、電融合存儲系統(tǒng),支持適配分布式文件、分布式塊和分布式對象等至少3種存儲類型,系統(tǒng)可以根據(jù)數(shù)據(jù)的訪問時間、訪問頻率、文件屬性等自定義分級策略,根據(jù)業(yè)務(wù)負載動態(tài)調(diào)整遷移。系統(tǒng)可通過介質(zhì)安全、系統(tǒng)安全、軟件安全等夯實底層安全能力,通過防勒索、加密算法、遠程監(jiān)控、光存儲預警檢測等增強數(shù)據(jù)安全能力。打造磁光電融合存儲應(yīng)用示范,完成至少20個業(yè)務(wù)系統(tǒng)應(yīng)用,實現(xiàn)至少4個東部地區(qū)數(shù)據(jù)流動至西部磁光電存儲系統(tǒng),且數(shù)據(jù)存儲量不少于10PB。
(七)存儲調(diào)度管理及應(yīng)用技術(shù)
揭榜任務(wù):針對海量數(shù)據(jù)存儲和算力孤島問題,研發(fā)跨域多算的存力調(diào)度、存網(wǎng)編排和存算網(wǎng)一體化系統(tǒng),實現(xiàn)數(shù)據(jù)的智能冷熱分級、應(yīng)用的跨域無感訪問等能力,有效降低成本、提高性能和支撐業(yè)務(wù)。系統(tǒng)具備資源規(guī)劃、策略調(diào)整能力,可優(yōu)化和調(diào)整全網(wǎng)數(shù)據(jù)存儲布局,實現(xiàn)對不斷變化的需求的適應(yīng)。
預期目標:到2026年,研制具備高效、可擴展性的存儲系統(tǒng),基于智能算法,對數(shù)據(jù)進行分析和調(diào)度,實現(xiàn)應(yīng)用無感訪問和智能流動。研究存力調(diào)度策略,使數(shù)據(jù)召回率控制在30%以下;研究基于潮汐網(wǎng)絡(luò)調(diào)度算法,實現(xiàn)網(wǎng)絡(luò)帶寬利用率提升50%以上,達到存網(wǎng)一體的目標。集成存儲、計算和網(wǎng)絡(luò)的能力,支持存算網(wǎng)一體化調(diào)度,在算力中心資源池落地應(yīng)用。
三、網(wǎng)絡(luò)
(八)高性能數(shù)據(jù)處理器(DPU)
揭榜任務(wù):開展基于芯粒(Chiplet)和第五代精簡指令集(RISC-V)技術(shù)的軟硬件一體DPU芯片技術(shù)研究,支持算力中心、智算中心、超算中心場景所需的超高帶寬和超低時延,突破Chiplet異構(gòu)芯片封裝技術(shù)、高速Serdes通信、大規(guī)模無損網(wǎng)絡(luò)擁塞算法、硬件密碼算法、高性能虛擬化、硬件可編程等技術(shù),實現(xiàn)基于ARM、X86、RISC-V等異構(gòu)核心的DPU應(yīng)用,提升算力中心基礎(chǔ)設(shè)施處理能力和數(shù)據(jù)傳輸能效比。
預期目標:到2026年,完成超高性能DPU芯片研發(fā)工作,吞吐能力達到400Gbps,單向流量時延不高于30us,支持與國內(nèi)外主流CPU、GPU芯片平臺的適配,支持主流操作系統(tǒng)兼容,支持數(shù)據(jù)報文硬件處理邏輯可編程。
(九)基于RoCE的智算網(wǎng)絡(luò)
揭榜任務(wù):面向RoCE網(wǎng)絡(luò)開展設(shè)備及管控系統(tǒng)研發(fā),通過提高設(shè)備帶寬、優(yōu)化負載均衡算法、強化網(wǎng)絡(luò)流量規(guī)劃及運維能力等方式,提升RoCE網(wǎng)絡(luò)的吞吐量和時延性能。研制新一代智能化管控工具,引入AI大模型能力,簡化RoCE網(wǎng)絡(luò)的部署和配置工作,實現(xiàn)全局、多維度的可視化運維。在網(wǎng)絡(luò)波動、業(yè)務(wù)變更、故障等情況下,網(wǎng)絡(luò)參數(shù)自動調(diào)整,流量快速切換,從而達到提升網(wǎng)絡(luò)效率和降低運維成本的目標。
預期目標:到2026年,實現(xiàn)新型RoCE網(wǎng)絡(luò)整體方案的商用部署,網(wǎng)絡(luò)性能提升10%以上。通過智能化管控及運維工具,網(wǎng)絡(luò)部署難度大幅降低,運維效率提升50%以上,可支撐更大規(guī)模部署和應(yīng)用。
(十)光交換智算網(wǎng)絡(luò)技術(shù)研究與驗證
揭榜任務(wù):面向智算集群低功耗、高帶寬、低延遲技術(shù)需求,開展智算集群光交換組網(wǎng)關(guān)鍵技術(shù)研究與驗證,重點突破智算集群光交換組網(wǎng)、路由協(xié)議適配等關(guān)鍵技術(shù)。針對智算集群的功能、性能、可靠性和擴展性等要求,研究光拓撲映射、光電混合路由、多路徑負載均衡等技術(shù)。
預期目標:到2026年,實現(xiàn)支持智算集群的易操作、高可靠、可平滑過渡升級的光網(wǎng)絡(luò),支持人工智能等關(guān)鍵業(yè)務(wù)承載;光交換設(shè)備單端口速率支持100GE/400GE/800GE,交換容量彈性可擴展,可支持不少于3種異構(gòu)算力資源互聯(lián),在不少于2個智算集群完成驗證,并完成不少于3種智算業(yè)務(wù)承載驗證。
(十一)面向分布式智算中心的網(wǎng)絡(luò)關(guān)鍵技術(shù)研究與驗證
揭榜任務(wù):針對智算集群從集中式向分布式部署探索的趨勢,攻關(guān)算力中心間網(wǎng)絡(luò)技術(shù),研發(fā)面向智算中心間的高可靠傳輸設(shè)備,構(gòu)建智算中心間超大容量、超低時延、超高可靠光電協(xié)同網(wǎng)絡(luò),實現(xiàn)智算中心高速、可靠互聯(lián)。
預期目標:到2026年,突破智算中心間超大容量、超高可靠網(wǎng)絡(luò)傳輸關(guān)鍵技術(shù),研制面向智算中心間網(wǎng)絡(luò)的傳輸設(shè)備,單波速率不低于1.6Tbps,設(shè)備時延不超過30us,支撐分布式智算中心間業(yè)務(wù)的高可靠傳輸。
四、應(yīng)用
(十二)智算中心跨域互聯(lián)應(yīng)用
揭榜任務(wù):優(yōu)化人工智能算力基礎(chǔ)設(shè)施布局,構(gòu)建跨地域互補、協(xié)同算力調(diào)度的超大規(guī)模人工智能算力服務(wù)能力。加強與人工智能芯片廠商的兼容適配,構(gòu)筑大規(guī)模高性能異構(gòu)算力池,提供面向大模型訓推場景深度優(yōu)化的彈性調(diào)度、彈性容錯、高資源利用率的人工智能算力服務(wù)。
預期目標:到2026年,形成覆蓋5個以上全國重點算力樞紐節(jié)點的人工智能算力中心,支持跨地域、跨云的算力需求感知和動態(tài)調(diào)度,完成3款以上算力芯片適配,聚焦大模型訓練和推理場景,構(gòu)建大規(guī)模、高性能、彈性調(diào)度、高容錯的訓推一體算力資源池,具備分鐘級斷點續(xù)訓能力,支持萬卡級別并行訓練。
(十三)算力電力協(xié)同應(yīng)用
揭榜任務(wù):研發(fā)基于算力調(diào)度技術(shù)與能源大模型的多云異構(gòu)算電協(xié)同管理平臺,構(gòu)建基于數(shù)據(jù)驅(qū)動的算力集群用電負荷特性模型、基于計算任務(wù)的時空轉(zhuǎn)移特性的能源大模型,推動算力預測與調(diào)度技術(shù)在智算中心應(yīng)用落地,提升整體資源利用率,基于新能源、新型儲能系統(tǒng)開展算力負荷與電力系統(tǒng)的協(xié)同優(yōu)化,實現(xiàn)精準、動態(tài)、實時的能源調(diào)度與交易,實現(xiàn)算力與電力等能源的深度協(xié)同。
預期目標:到2026年,實現(xiàn)智算場景下能源與算力全鏈路的數(shù)據(jù)穿透及流程整合,構(gòu)建“算”隨“電”動的直接控制及間接引導機制,實現(xiàn)算力需求預測精準度達到70%、集群有效負載率提升25%以上,智算中心整體集群資源利用率提高10%。結(jié)合算力集群用電數(shù)據(jù)、時間周期、氣象數(shù)據(jù)、工作負載等多種因素,實現(xiàn)“電”隨“算”用的能源效率優(yōu)化與算效提升,實現(xiàn)基礎(chǔ)設(shè)施用能決策精準度85%以上,響應(yīng)時效性達到提前15分鐘響應(yīng)級別,智算中心整體算力能效水平提升30%,算力中心用電成本降低5%以上。
(十四)大規(guī)模通信業(yè)務(wù)場景中的算力應(yīng)用
揭榜任務(wù):圍繞網(wǎng)絡(luò)功能虛擬化(NFV)系統(tǒng)架構(gòu),針對NFV中網(wǎng)絡(luò)性能、資源利用和靈活展性等方面的挑戰(zhàn),研發(fā)面向NFV架構(gòu)的高性能虛擬化、智能化網(wǎng)絡(luò)管理和資源編排算法等技術(shù)和系統(tǒng),突破虛擬化層與硬件加速器(如FPGA、DPU、GPU)之間的協(xié)同能力。
預期目標:到2026年,NFV算力平臺系統(tǒng)中實現(xiàn)對虛擬化網(wǎng)絡(luò)功能的智能調(diào)度,支持異構(gòu)集群部署、動態(tài)擴展,資源動態(tài)分配,虛擬化資源利用率提升20%以上;支持GPU、FPGA等硬件加速器的虛擬化調(diào)度,加速網(wǎng)絡(luò)處理性能至Tbps以上;支持智能化網(wǎng)絡(luò)虛擬化功能管理,提升NFV系統(tǒng)的自動化運維能力和管理效能,故障修復時間縮減不低于30%。
五、綠色低碳
(十五)綠色算力技術(shù)研究及應(yīng)用
揭榜任務(wù):圍繞算力的綠色節(jié)能技術(shù)突破,面向算力中的任務(wù)調(diào)度特性、能源使用模式、負載均衡要求等關(guān)鍵要素,研發(fā)適應(yīng)于綠色計算的動態(tài)資源調(diào)度算法、能耗優(yōu)化管理系統(tǒng),以及面向多場景的協(xié)同節(jié)能機制,突破節(jié)能算法的智能化程度,提升算力網(wǎng)絡(luò)中多節(jié)點的能源利用效率。
預期目標:到2026年,能耗管理系統(tǒng)實現(xiàn)對算力中心和網(wǎng)絡(luò)節(jié)點的實時監(jiān)控與節(jié)能調(diào)度,通過計算節(jié)點支持動態(tài)調(diào)頻、動態(tài)電壓調(diào)節(jié),單節(jié)點平均能耗降低30%以上,滿足AI推理等應(yīng)用需求。
(十六)企業(yè)綠色計算碳感知平臺
揭榜任務(wù):建立企業(yè)算力中心碳排放度量體系,能夠?qū)崟r、精準地統(tǒng)計企業(yè)各個算力中心碳排放,并能將碳排放量分攤到不同的業(yè)務(wù)部門、應(yīng)用場景和工作負載,實現(xiàn)精細化的碳排放的管理。同時,基于碳排放的數(shù)據(jù),實現(xiàn)碳感知調(diào)度能力,通過在保證業(yè)務(wù)體驗和連續(xù)性的情況下將工作負載調(diào)度到更加低碳的算力中心,進一步降低碳排放。
預期目標:到2026年,圍繞千萬核級別跨域的算力中心,構(gòu)建企業(yè)級綠色計算碳感知平臺,形成一套行業(yè)通用的、可精確度量不同類型工作負載碳排放的技術(shù)方法和指標體系,通過生態(tài)共建形成綠色度量衡標準體系。構(gòu)建碳感知調(diào)度能力,達到算力中心可再生能源比例30%的目標。
(十七)冷板式液冷原生整機柜服務(wù)器
揭榜任務(wù):面向新一代液冷算力中心,研發(fā)冷板式液冷整機柜,包括液冷服務(wù)器節(jié)點、無源液冷門等,突破高密算力、多樣性算力的散熱技術(shù)及架構(gòu)要求,實現(xiàn)支持供電總線、網(wǎng)絡(luò)互聯(lián)總線、液冷管路可盲插運維的液冷設(shè)備,具備液冷機柜及液冷服務(wù)器等多級漏液檢測能力,有效降低業(yè)務(wù)中斷范圍與損失。
預期目標:到2026年,液冷整機柜實現(xiàn)100%液冷散熱,制冷PUE低于1.15。整機柜服務(wù)器內(nèi)部實現(xiàn)全盲插設(shè)計,管理模塊可實現(xiàn)整機柜功耗管理、漏液檢測、資產(chǎn)管理等功能;通用算力單柜功率不低于20kW,智能算力單機柜功率不低于30kW,實現(xiàn)不少于500臺液冷節(jié)點的規(guī)模落地應(yīng)用。
(十八)算力中心節(jié)能調(diào)優(yōu)平臺
揭榜任務(wù):研制高精確度、高仿真效率、多場景覆蓋的算力中心PUE仿真平臺,突破物理機理模型構(gòu)建、仿真引擎集群、模型自動生成等關(guān)鍵技術(shù),實現(xiàn)對算力中心不同運行狀態(tài)下細分時間顆粒度PUE的快速、精準評估。研發(fā)基于大數(shù)據(jù)分析技術(shù)的算力中心制冷系統(tǒng)AI節(jié)能優(yōu)化系統(tǒng),通過自動化數(shù)據(jù)治理、自動推理等關(guān)鍵技術(shù),準確匹配制冷需求,在滿足可靠性要求條件下實現(xiàn)算力中心制冷系統(tǒng)整體動態(tài)實時優(yōu)化,優(yōu)化算力中心PUE。
預期目標:到2026年,支持液冷、水冷等至少2類典型制冷場景進行能效優(yōu)化,支持制冷系統(tǒng)和配電系統(tǒng)聯(lián)合仿真,系統(tǒng)可輸出不同負載及運行工況條件下的PUE運行曲線、系統(tǒng)設(shè)備運行模擬工況等參數(shù),PUE仿真精度達到97%以上;谀苄(yōu)化平臺,支持AI自動推理,小時級策略自動下發(fā),實現(xiàn)對算力中心能耗的可視、可管、可控。通過AI能效優(yōu)化,實現(xiàn)算力中心PUE降低5%以上,通過算力中心基礎(chǔ)設(shè)施與IT聯(lián)動節(jié)能,實現(xiàn)總能耗降低5%以上,在5個以上算力中心落地應(yīng)用。
(十九)新型制冷系統(tǒng)
揭榜任務(wù):研發(fā)人工智能節(jié)能系統(tǒng),針對算力中心基礎(chǔ)設(shè)施的運行調(diào)控和環(huán)境監(jiān)測。提出全新自適應(yīng)算法,突破原有常見算法的局限性,提升數(shù)據(jù)的分析和處理效果,搭建基于專家經(jīng)驗的人工智能算法數(shù)據(jù)庫,提升包括能耗管理、能源調(diào)度、安全監(jiān)測、故障診斷、輔助運維等功能的節(jié)能性、可靠性、經(jīng)濟性。
預期目標:到2026年,在滿足制冷要求的基礎(chǔ)上,提高冷卻系統(tǒng)的可靠性和自適應(yīng)性,提高能源使用效率、水資源使用效率和運維效率,其中節(jié)電率提升10%以上。支持冷卻系統(tǒng)數(shù)據(jù)采集、標注、治理、存儲,具備系統(tǒng)運行異常告警、告警收斂、自動診斷、遠程通信、自動控制等功能,支持冷卻系統(tǒng)智能化調(diào)優(yōu)、智能化控制的核心能力,并開展不少于5個實際業(yè)務(wù)場景所提供的AI節(jié)能調(diào)優(yōu)案例。
六、安全可靠
(二十)算力中心智能運維機器人
揭榜任務(wù):研發(fā)算力中心智能運維機器人以及智能機器人管理平臺,基于云邊端三層架構(gòu),實現(xiàn)智能機器人在多層、多房間樓宇機房內(nèi)的設(shè)備設(shè)施識別、多模態(tài)環(huán)境感知、精準空間定位、智能人機協(xié)同、多任務(wù)聯(lián)合調(diào)度等方面的技術(shù)與算法優(yōu)化。支撐機器人在算力中心設(shè)施運維和IT運營等典型場景的應(yīng)用,提升巡檢質(zhì)量,促進算力中心運維、運營的降本增效。
預期目標:到2026年,實現(xiàn)大型算力中心內(nèi)智能機器人的多機房、多樓層協(xié)同應(yīng)用部署;機器人巡檢任務(wù)成功率不低于95%,設(shè)備識別準確率達到97%,環(huán)境巡檢召回率不低于90%,保障算力中心巡檢業(yè)務(wù)持續(xù)運行。實現(xiàn)云邊端協(xié)同調(diào)度,支持不同場景下的自主作業(yè),提高任務(wù)并發(fā)執(zhí)行效率,促進穩(wěn)定、安全、可靠、可控的算力中心智能運維體系建設(shè)。
(二十一)云邊端一體化智能監(jiān)測平臺
揭榜任務(wù):開發(fā)高性能云邊端一體化系統(tǒng),研發(fā)以智能化終端或機器人為硬件載體、以多算法模型融合和平臺工具為軟件載體的軟硬結(jié)合的集中監(jiān)測管理與運維巡檢方案。突破多層級自動化運維、多維度診斷、多平臺覆蓋、多模型量化等關(guān)鍵技術(shù)。構(gòu)建綜合運維健康度數(shù)字化評估體系與模型,實現(xiàn)算力設(shè)施從規(guī)劃、設(shè)計、建設(shè)、部署、運行、維護的全生命周期數(shù)字化管理。
預期目標:到2026年,建立大規(guī)模集群的智能化運維能力,設(shè)備實現(xiàn)跨平臺及系統(tǒng)穩(wěn)定性風險和安全風險識別能力,綜合視頻識別技術(shù)等,結(jié)構(gòu)化告警收斂推送,準確率超過98%。算力設(shè)施全生命周期數(shù)字化聯(lián)動,平臺自動化流程推進,實現(xiàn)云端直控覆蓋超10棟算力中心,落地數(shù)字化算力中心健康度評估,智能化終端或機器人的自驅(qū)動巡檢,視頻流識別與告警的聯(lián)動,系統(tǒng)的智能化運維問答,并保障業(yè)務(wù)服務(wù)級別協(xié)議(SLA)達標率99%以上。
七、其他
(二十二)其他算力領(lǐng)域的特色化技術(shù)、產(chǎn)品、服務(wù)和平臺等,應(yīng)具有技術(shù)先進性,技術(shù)成熟度較高,產(chǎn)業(yè)化前景較好。
附:
1.算力強基揭榜單位推薦表
2.算力強基揭榜單位申報材料
聯(lián)系方式