|
|
可以看出,這不是第一代產(chǎn)品,包含了產(chǎn)品迭代的經(jīng)驗(yàn),這也不是最后一代產(chǎn)品,透露了長期的發(fā)展計(jì)劃。
如引言所介紹,英偉達(dá)的介紹干貨比較多。 其中一些設(shè)計(jì)挑戰(zhàn),目前在我們的設(shè)計(jì)過程中也發(fā)現(xiàn)了同樣的問題,所以對于經(jīng)驗(yàn)的學(xué)習(xí)還是比較重要的。 當(dāng)然,這些經(jīng)驗(yàn)在其他的GPU機(jī)架的設(shè)計(jì)中,會遇到一些不適用的情況,比較明顯的就是GB系列super chip對于面積的優(yōu)化。
同時,英偉達(dá)也介紹了對于未來的想法,可以看出英偉達(dá)對于整機(jī)架形態(tài)的推進(jìn),是一個持續(xù)化的過程,對于液冷和整機(jī)架電源傳輸也是一致的方向。
與視頻搭配,我整理了以下幾個關(guān)鍵的信息。 1、整機(jī)架雖然和ORv3比較類似,但是在尺寸上有一些明顯差異,例如MGX機(jī)架是19英寸,而ORv3是21英寸。MGX機(jī)架是RU,而ORv3是OU。 2、為什么要使用19英寸?有兩個主要原因,其一是統(tǒng)一的參考設(shè)計(jì):目標(biāo)是希望用一個參考設(shè)計(jì)來滿足不同客戶的數(shù)據(jù)中心需求,而19英寸的機(jī)箱可以適配到21英寸的機(jī)架中。在介紹中也特別提到了中國市場對于19英寸機(jī)架的使用。其二是因?yàn)榍懊娴木W(wǎng)線繞線空間,19英寸的機(jī)架有更多的繞線空間。 3、由于盲插設(shè)計(jì),機(jī)架設(shè)計(jì)的公差挑戰(zhàn)較大,需要輔助設(shè)計(jì)來達(dá)到公差要求,例如橫向和縱向的加強(qiáng)筋。 4、目前的機(jī)架內(nèi),液冷和空冷的占比約為一半一半,將來計(jì)劃實(shí)施全液冷。 5、液冷接頭采用了UQD,目前是UQD04,將來有計(jì)劃升級,支持更高的液流。 6、目前的整機(jī)架功耗是120KW,將來有可能會更高。當(dāng)然同時也解釋了,120KW是目前參考設(shè)計(jì)的最高值,針對于不同的需求,25KW到40KW的機(jī)架功耗可能是更為標(biāo)準(zhǔn)和通用的范圍。 7、將來整機(jī)架供電有計(jì)劃實(shí)施全部power bus bar 供電。
QCT和Supermicro率先使用這項(xiàng)支持100多種系統(tǒng)配置的服務(wù)器規(guī)范來加速AI、HPC、元宇宙工作負(fù)載 COMPUTEX——2023年5月29日——為了滿足全球數(shù)據(jù)中心多樣化的加速計(jì)算需求,NVIDIA今天在COMPUTEX發(fā)布了 NVIDIA MGX? 服務(wù)器規(guī)范。該規(guī)范為系統(tǒng)制造商提供了一個模塊化參考架構(gòu),以快速、經(jīng)濟(jì)高效地制造100多種服務(wù)器機(jī)型,適用于廣泛的AI、高性能計(jì)算和元宇宙應(yīng)用。 ASRock Rack、ASUS、GIGABYTE、Pegatron、QCT和 Supermicro 將采用MGX,它可將開發(fā)成本削減四分之三,并將開發(fā)時間縮短三分之二至僅6個月。 NVIDIA GPU產(chǎn)品副總裁Kaustubh Sanghani表示:“在構(gòu)建滿足特定業(yè)務(wù)和應(yīng)用需求的數(shù)據(jù)中心時,企業(yè)正在尋求更多的加速計(jì)算選項(xiàng)。我們設(shè)計(jì)MGX是為了幫助各個機(jī)構(gòu)可以自行開發(fā)企業(yè)AI,同時節(jié)省他們大量時間和金錢。” 通過MGX,制造商以一個為加速計(jì)算優(yōu)化的服務(wù)器機(jī)箱作為基礎(chǔ)系統(tǒng)架構(gòu)入手,然后選擇適合自己的GPU、DPU和CPU。不同的設(shè)計(jì)可以滿足特定的工作負(fù)載,如HPC、數(shù)據(jù)科學(xué)、大型語言模型、邊緣計(jì)算、圖形和視頻、企業(yè)AI以及設(shè)計(jì)與模擬。AI訓(xùn)練和5G等多種任務(wù)可以在一臺機(jī)器上處理,而且可以輕松地升級到未來多代硬件。MGX還可以輕松集成到云和企業(yè)數(shù)據(jù)中心。
與行業(yè)領(lǐng)導(dǎo)廠商合作 QCT和Supermicro將率先在8月份上市采用MGX設(shè)計(jì)的機(jī)型。Supermicro今天發(fā)布的ARS-221GL-NR系統(tǒng)將采用NVIDIA Grace? CPU超級芯片,而QCT今天宣布的S74G-2U系統(tǒng)將采用 NVIDIA GH200 Grace Hopper超級芯片。 此外,SoftBank Corp計(jì)劃在日本各地推出多個超大規(guī)模數(shù)據(jù)中心,并使用MGX在生成式AI和5G應(yīng)用之間動態(tài)分配GPU資源。 SoftBank Corp總裁兼首席執(zhí)行官Junichi Miyakawa表示:“隨著生成式AI日益進(jìn)入商業(yè)和消費(fèi)者的生活方式中,以合適的成本構(gòu)建合適的基礎(chǔ)設(shè)施是網(wǎng)絡(luò)運(yùn)營商面臨的最大挑戰(zhàn)之一。我們期待NVIDIA MGX能夠應(yīng)對這些挑戰(zhàn),以滿足多用途AI、5G以及更多依賴實(shí)時工作負(fù)載的需求!
不同的設(shè)計(jì)滿足不同的需求 數(shù)據(jù)中心越來越需要滿足不斷增長的算力需求并降低碳排放,以應(yīng)對氣候變化,同時還要降低成本。 由NVIDIA加速計(jì)算加速的服務(wù)器長期以來一直提供卓越的計(jì)算性能和能效,F(xiàn)在,MGX模塊化的設(shè)計(jì)使系統(tǒng)制造商能夠更有效地滿足每個客戶獨(dú)特的預(yù)算、供電、散熱設(shè)計(jì)和機(jī)械要求。
多種規(guī)格尺寸提供最大的靈活性 MGX提供不同的規(guī)格尺寸,并兼容當(dāng)前和未來多代NVIDIA硬件,包括: 機(jī)箱:1U、2U、4U(風(fēng)冷或液冷)
軟件進(jìn)一步驅(qū)動加速 除硬件外,MGX還得到NVIDIA完整軟件棧的支持,使開發(fā)人員和企業(yè)能夠開發(fā)并加速AI、HPC和其他應(yīng)用。其中包括 NVIDIA AI Enterprise,即NVIDIA AI平臺的軟件層,它涵蓋100多個框架、預(yù)訓(xùn)練模型和開發(fā)工具,可為AI和數(shù)據(jù)科學(xué)加速,從而全面支持企業(yè)AI的開發(fā)和部署。 MGX兼容開放計(jì)算項(xiàng)目(Open Compute Project)和電子工業(yè)聯(lián)盟(Electronic Industries Alliance)的服務(wù)器機(jī)架,可快速集成到企業(yè)和云數(shù)據(jù)中心。 觀看NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在2023年 COMPUTEX 主題演講中介紹MGX服務(wù)器規(guī)范。
|
|