|
|
從分析師估計(jì)到首席執(zhí)行官黃仁勛的評(píng)論,Nvidia 的 Blackwell 平臺(tái)的定價(jià)已經(jīng)陸續(xù)出爐。簡(jiǎn)而言之,部署這些性能強(qiáng)大的產(chǎn)品將花費(fèi)買家高昂的成本。摩根士丹利估計(jì),Nvidia 將在 2025 年出貨 60,000 到 70,000 臺(tái) B200 服務(wù)器機(jī)柜,相當(dāng)于每年至少 2100 億美元的收入。盡管成本高昂,但對(duì)這些強(qiáng)大的 AI 服務(wù)器的需求仍然很強(qiáng)烈。
據(jù)報(bào)道,Nvidia 已投資約 100 億美元開發(fā) Blackwell 平臺(tái),約有 25,000 人參與其中。由于所有性能都集成在單個(gè) Blackwell GPU 中,因此這些產(chǎn)品的價(jià)格高昂也就不足為奇了。
據(jù)匯豐銀行分析師稱,Nvidia 的 GB200 NVL36 服務(wù)器機(jī)架系統(tǒng)售價(jià)為 180 萬美元,NVL72 售價(jià)為 300 萬美元(約2175萬人民幣)。功能更強(qiáng)大的GB200 超級(jí)芯片結(jié)合了 CPU 和 GPU,預(yù)計(jì)每顆售價(jià)為 6 萬至 7 萬美元。這些超級(jí)芯片包括兩個(gè) GB100 GPU 和單個(gè) Grace Hopper 芯片,并配有一個(gè)大型系統(tǒng)內(nèi)存池(HBM3E)。
今年早些時(shí)候,首席執(zhí)行官黃仁勛告訴 CNBC,Blackwell GPU 的價(jià)格為 3 萬至 4 萬美元,摩根士丹利根據(jù)此信息計(jì)算了買家的總成本。每臺(tái) AI 服務(wù)器機(jī)柜的價(jià)格約為 200 萬至 300 萬美元,而 Nvidia 計(jì)劃出貨 6 萬至 7 萬臺(tái) B200 服務(wù)器機(jī)柜,預(yù)計(jì)年收入至少為 2100 億美元。
但客戶支出在某個(gè)時(shí)候會(huì)證明這是合理的嗎?紅杉資本分析師戴維·卡恩估計(jì),支付其投資所需的年度人工智能收入已攀升至每年 6000 億美元。
但目前,毫無疑問,無論代價(jià)有多大,公司都會(huì)付出代價(jià)。B200 擁有 2080 億個(gè)晶體管,可提供高達(dá) 20 petaflops 的 FP4 計(jì)算能力。訓(xùn)練一個(gè) 1.8 萬億參數(shù)模型需要 8,000 個(gè) Hopper GPU,消耗 15 兆瓦的功率。
這項(xiàng)任務(wù)需要 2,000 個(gè) Blackwell GPU,功耗僅為 4 兆瓦。對(duì)于大型語言模型推理工作負(fù)載,GB200 超級(jí)芯片的性能是 H100 GPU 的 30 倍,并且顯著降低了功耗。
據(jù)摩根士丹利稱,由于需求旺盛,Nvidia 將臺(tái)積電的訂單量增加了約 25%。可以毫不夸張地說,Blackwell 將成為AI 訓(xùn)練和許多推理工作負(fù)載的事實(shí)標(biāo)準(zhǔn),它旨在為一系列下一代應(yīng)用提供支持,包括機(jī)器人、自動(dòng)駕駛汽車、工程模擬和醫(yī)療保健產(chǎn)品。
NVIDIA GB200 NVL72 系統(tǒng)細(xì)節(jié)
最近,我們有機(jī)會(huì)看到了 Supermicro 版本的 NVIDIA GB200 NVL72。 Supermicro NVIDIA GB200 NVL72 是 Supermicro 的 NVIDIA Grace Blackwell 200 NVLink 72 GPU 機(jī)架版本。
在頂部,我們看到了 Supermicro 的標(biāo)志、網(wǎng)絡(luò)和電源。
然后我們得到十個(gè)雙節(jié)點(diǎn) GB200 1U 機(jī)箱。
Grace Blackwell GB200 節(jié)點(diǎn)背面有用于連接 NVLink 背板的接口。這些節(jié)點(diǎn)為半寬節(jié)點(diǎn),因此兩個(gè)節(jié)點(diǎn)可以并排安裝在 1U 機(jī)架式機(jī)箱中。
有兩個(gè) Blackwell GPU。
然后我們得到了帶有 LPDDR 內(nèi)存的 NVIDIA Grace CPU。
以及節(jié)點(diǎn)底部的 I/O 連接。
中間是用于連接系統(tǒng)的 NVLink 交換機(jī)。底部是另外八個(gè)雙 GB200 節(jié)點(diǎn)。十八個(gè) 1U 機(jī)箱,每個(gè)機(jī)箱有兩個(gè) GB200 組件,每個(gè)組件有兩個(gè) Blackwell GPU,總共有 72 個(gè) GPU。
下面是電源和由 Supermicro 制造的冷卻劑分配裝置。 這是一個(gè)與我們?cè)?Supermicro 定制液體冷卻機(jī)架中看到的設(shè)計(jì)類似的 CDU。
這個(gè)機(jī)架是一個(gè)集群,每小時(shí)使用約 120kW 的電量,大約相當(dāng)于每小時(shí)的電量,這些電量存儲(chǔ)在 123kWh 的特斯拉 Cybertruck 電池中。在視頻中,我們討論了 GB200 NVL72 機(jī)架如何像駕駛一輛約 7000 磅重的卡車行駛 300 英里。我們預(yù)計(jì)未來幾個(gè)月內(nèi),更高功率的數(shù)據(jù)中心將使用這些 GB200 NVL72 解決方案?紤]到我們?cè)谝后w冷卻方面所做的努力,這是我們想要關(guān)注功率方面的原因之一。
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個(gè)人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表北京漢深對(duì)該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
|
|