英偉達當?shù)貢r間昨日在 SC24 超算大會上推出了 2 款新的 AI 硬件,分別是 H200 NVL PCIe GPU 和 GB200 NVL4 超級芯片。
英偉達表示約七成的企業(yè)機架僅可提供不到 20kW 的電力供應,并采用空氣冷卻,而 PCIe AIC 形態(tài)的 H200 NVL就是為這些環(huán)境推出的相對低功耗風冷 AI 計算卡。
▲ 四路 NVLink 橋接器互聯(lián)的 H200 NVL
H200 NVL 為雙槽厚度,最高 TDP 功耗從 H200 SXM 的 700W 降至 600W,各算力也均有一定下降(IT之家注:如 INT8 Tensor Core 算力下滑約 15.6% ),不過 HBM 內(nèi)存容量和帶寬是與 H200 SXM 相同的 141GB、4.8TB/s。
此外 H200 NVL PCIe GPU 支持雙路或四路的 900GB/s 每 GPU 的 NVLink 橋接器互聯(lián)。
英偉達表示 H200 NVL 內(nèi)存容量是此前 H100 NVL 的 1.5 倍,帶寬也達 1.2 倍,擁有 1.7 倍的 AI 推理性能,而在 HPC 應用中性能也高出 30%。
英偉達此次還推出了面向單服務器解決方案的 GB200 NVL4 超級芯片,該模塊聚合了 2 個 Grace CPU 和 4 個 Blackwell GPU,HBM 內(nèi)存池容量達 1.3TB,相當于 2 組 GB200 Grace Blackwell 超級芯片,整體功耗自然也來到了 5.4kw。
▲ 圖片引自德媒 Hardwareluxx
相較于包含 4 個 Grace CPU 和 4 個 Hopper GPU 的上代 GH200 NVL4 系統(tǒng),新的 GB200 NVL4 擁有 2.2 倍的模擬性能、1.8 倍的 AI 訓練性能和 1.8 倍的 AI 推理性能。