|
|
一、引言
二、H20簡介與對比Nvidia H20是從Nvidia H200裁剪而來的[1, 2, 3],保留了900GB/s的卡間高速互聯(lián)帶寬(NVLink4.0和NVSwitch3.0)[4],并支持PCIe Gen5(128GB/s雙向帶寬)。PCIe Gen5連接支持400GbE集群網(wǎng)絡(luò),有利于組建超大規(guī)模GPU集群和保持較高的集群線性加速比。 在算力方面,H20峰值算力只有H200峰值算力的14.96%(~15%),H20峰值算力相對較低(被嚴重裁剪)。 在L2 Cache配置方面,H20配置了60MB的L2 Cache,比H200有更大的L2 Cache。 Nvidia H20擁有96GB的HBM3顯存,顯存帶寬高達4TB/s。雖然Nvidia H20的顯存配置相對于H200有所裁剪,但是H20的顯存配置相對于國產(chǎn)AI芯片還是有明顯優(yōu)勢的。
當前國內(nèi)大模型廠商的訓(xùn)練算力主要集中在Nvidia A800和H800 [5, 6],以及華為昇騰910B-A2 [7, 8],與現(xiàn)有的算力資源相比,Nvidia H20也有其獨特的優(yōu)勢。 例如,相較于Nvidia A800,Nvidia H20在FP8算力、顯存配置、卡間互聯(lián)帶寬、PCIe連接等方面都有顯著優(yōu)勢;相較于Nvidia H800,Nvidia H20在L2 Cache、顯存配置、卡間互聯(lián)帶寬等方面都有顯著優(yōu)勢;相較于華為昇騰910B-A2,Nvidia H20在FP8算力、顯存配置、卡間互聯(lián)帶寬等方面都有顯著優(yōu)勢。
三、H20 for 大模型訓(xùn)練Nvidia H20擁有非常高的卡間互聯(lián)帶寬,并支持PCIe Gen5,在配備400GbE集群網(wǎng)絡(luò)情況下,H20集群線性加速比接近于1,使得H20卡非常適合用來組建大規(guī)模集群。 使用Nvidia H20執(zhí)行大模型訓(xùn)練任務(wù),基于目前的一些測試結(jié)果,對于BF16混合精度訓(xùn)練,在集群規(guī)模較小的情況下(例如,512 x H20),Nvidia H20訓(xùn)練吞吐大概可以達到Nvidia A800訓(xùn)練吞吐的62%(即集群規(guī)模較小的情況下,H20的性能是A800的性能的~60%)[11, 12];在集群規(guī)模較大的情況下(例如,4096 x H20),Nvidia H20訓(xùn)練吞吐大概可以達到Nvidia A800訓(xùn)練吞吐的70%(即集群規(guī)模較大的情況下,H20的性能是A800的性能的~70%)。
值得說明的是,F(xiàn)P8混合精度訓(xùn)練方法還不成熟,在現(xiàn)階段只能支持規(guī)模較小的LLM模型訓(xùn)練(例如,34B及以下)。未來隨著技術(shù)的演講,F(xiàn)P8混合精度訓(xùn)練會成為主流技術(shù)。 四、H20 for 大模型推理Nvidia H20擁有非常好的顯存配置以及較好的FP8峰值算力,適合用于LLM推理。使用Nvidia H20執(zhí)行大模型推理任務(wù),特別是LLM推理任務(wù), Nvidia H20推理性能比Nvidia H800推理性能高出20% (例如,對比顯存帶寬:4/3.35 ~= 1.19 = 120%)[2, 9, 10]。 隨著未來LLM模型參數(shù)規(guī)模越來越大,需要使用擁有高配顯存的AI芯片來進行推理服務(wù),使用Nvidia H20執(zhí)行超大LLM模型推理任務(wù),是性價比更高的選擇[1, 2, 9, 10]。 此外,也可以使用Nvidia H20置換現(xiàn)在推理服務(wù)中使用A800和H800卡,這樣就可以有更多的A800卡和H800卡用于大模型訓(xùn)練。
綜上所述,Nvidia H20核心價值在于: (1)使用H20組建大規(guī)模集群用于大模型訓(xùn)練(例如,F(xiàn)P8混合精度訓(xùn)練);(2)H20適合用于超大規(guī)模LLM推理(FP8計算);(3)H20價格適中(性價比高 )。
一、背景與挑戰(zhàn) 在過去的幾年里,國際形勢的變化對高科技產(chǎn)業(yè)產(chǎn)生了深遠影響。特別是針對尖端技術(shù)的出口管制政策,使得像英偉達這樣的國際巨頭不得不重新審視其全球戰(zhàn)略。面對這一現(xiàn)實,英偉達采取了一系列措施,包括推出H20芯片以適應(yīng)新的市場環(huán)境。
由于美國政府對尖端AI芯片實施了新的出口管制措施,英偉達需要調(diào)整其產(chǎn)品線以符合這些規(guī)定,并繼續(xù)在中國市場銷售其產(chǎn)品。 黃仁勛(英偉達創(chuàng)始人兼CEO)曾表示,這些限制可能會影響英偉達的市場份額,并可能促使中國企業(yè)加速自主研發(fā)。 二、H20芯片的技術(shù)特點 架構(gòu)與設(shè)計 H20芯片基于英偉達最新的Hopper架構(gòu),這一架構(gòu)代表了公司在GPU領(lǐng)域的最新成果。盡管H20在某些方面進行了“閹割”,以滿足特定市場的法規(guī)要求,但其核心架構(gòu)依然保留了許多創(chuàng)新元素,確保了較高的性能表現(xiàn)。 性能指標 H20芯片在計算能力和功耗管理方面進行了優(yōu)化,以適應(yīng)不同的應(yīng)用場景。雖然與旗艦級別的H100相比存在差距,但對于大多數(shù)用戶而言,H20已經(jīng)能夠提供足夠的算力支持。
H20芯片是經(jīng)過算力閹割的版本,相較于其他高性能芯片(如A100和H100)有所降級。 在算力方面,H20芯片大約只有H100芯片的20%到30%。 H20芯片基于最新的Hopper架構(gòu),這表明它在架構(gòu)上仍然較為先進。
H20和H100綜合對比 計算能力 顯存 功耗 架構(gòu)與互聯(lián) H20在計算能力上遠不如H100,但是在顯存容量和帶寬方面有一定的優(yōu)勢,并且在特定的應(yīng)用場景中,比如大語言模型推理,它能夠提供更好的性能。H20的設(shè)計更多地考慮了能效比和成本效益,而H100則定位為頂級的高性能計算GPU。
三、市場定位與策略 目標市場 H20芯片主要面向中國市場,旨在滿足那些受到出口管制影響但仍希望使用英偉達技術(shù)的企業(yè)。通過調(diào)整產(chǎn)品規(guī)格,英偉達能夠在遵守法規(guī)的同時繼續(xù)保持與中國市場的聯(lián)系。 定價策略 為了提高市場競爭力,H20芯片在定價上采取了相對保守的策略。相較于競爭對手的產(chǎn)品,H20提供了更具吸引力的價格點,這對于預(yù)算有限的企業(yè)來說是一個重要的考慮因素。
H20芯片的價格區(qū)間大致在8.6萬到11萬人民幣之間,略低于華為昇騰910B的價格。 盡管性能較低,但由于其價格優(yōu)勢以及與英偉達現(xiàn)有平臺的兼容性,對于某些客戶來說仍具有吸引力。有些情況下,可能需要使用多塊H20芯片才能達到與單塊更高性能芯片相當?shù)乃懔λ健?/p>
預(yù)計營收
行業(yè)分析機構(gòu)預(yù)測,H20芯片能夠為英偉達帶來顯著的收入。據(jù)估計,僅這款芯片就能為英偉達貢獻超過120億美元的營收(接近870億人民幣)。 四、競爭格局 國內(nèi)廠商崛起 國內(nèi)AI芯片企業(yè)如華為、寒武紀、百度等已經(jīng)有成熟的產(chǎn)品可以批量出貨,這些產(chǎn)品在市場上與英偉達形成了競爭。一些大廠如阿里巴巴、騰訊、百度和字節(jié)跳動等已經(jīng)開始將部分訂單轉(zhuǎn)向國內(nèi)供應(yīng)商。 隨著國際貿(mào)易環(huán)境的變化,國內(nèi)AI芯片廠商如華為、寒武紀、百度等開始嶄露頭角。這些企業(yè)在過去幾年里迅速成長,不僅在國內(nèi)市場上取得了顯著的成績,也在國際市場上贏得了一席之地。 市場份額與趨勢 盡管面臨來自國內(nèi)廠商的競爭,英偉達憑借其深厚的技術(shù)積累和廣泛的生態(tài)系統(tǒng)支持,在中國市場仍保持著一定的市場份額。不過,隨著國內(nèi)企業(yè)的不斷進步,這種態(tài)勢可能會發(fā)生變化。 五、未來展望 技術(shù)發(fā)展 隨著AI技術(shù)的不斷進步,對于更高效、更強大的計算資源的需求將持續(xù)增長。英偉達將繼續(xù)投資研發(fā),推出更多創(chuàng)新產(chǎn)品以滿足市場需求。 合作與伙伴關(guān)系 英偉達認識到,單一企業(yè)無法獨自解決所有問題。因此,加強與其他企業(yè)、研究機構(gòu)的合作將是未來發(fā)展的關(guān)鍵。 結(jié)語 英偉達H20芯片不僅是公司在特定市場環(huán)境下的一次戰(zhàn)略調(diào)整,也是其在全球范圍內(nèi)持續(xù)推動技術(shù)創(chuàng)新的一個縮影。面對復(fù)雜多變的市場環(huán)境,英偉達通過靈活的產(chǎn)品策略展現(xiàn)了其應(yīng)對挑戰(zhàn)的能力。
關(guān)于我們 北京漢深流體技術(shù)有限公司是丹佛斯中國數(shù)據(jù)中心簽約代理商。產(chǎn)品包括FD83全流量自鎖球閥接頭,UQD系列液冷快速接頭、EHW194 EPDM液冷軟管、電磁閥、壓力和溫度傳感器及Manifold的生產(chǎn)和集成服務(wù)。在國家數(shù)字經(jīng)濟、東數(shù)西算、雙碳、新基建戰(zhàn)略的交匯點,公司聚焦組建高素質(zhì)、經(jīng)驗豐富的液冷工程師團隊,為客戶提供卓越的工程設(shè)計和強大的客戶服務(wù)。 公司產(chǎn)品涵蓋:丹佛斯液冷流體連接器、EPDM軟管、電磁閥、壓力和溫度傳感器及Manifold。
|
|