国产美女自慰大秀_成人国产黄色毛片_青柠在线观看免费高清电视剧红桃_日韩最新毛片网站_午夜久久亚洲精品_国产最新精品黄色免费三级片_亚洲成av人片不卡无码播放_国产亚洲日韩在线播放更多_国产精品呦另类稀缺_日本1级黄色视频免费在线播放

 
We engineer tomorrow to build a better future.
Solutions to your liquid cooling challenges.
 
 
DANFOSS
數(shù)據(jù)中心液冷產(chǎn)品
  數(shù)據(jù)中心液冷產(chǎn)品
  FD83接頭
  UQD快速接頭
  UQDB盲插接頭
  BMQC盲插接頭
  EHW194液冷軟管
  EHW094液冷軟管
  5400制冷劑接頭
  Manifold 分水器
  液冷系統(tǒng)生產(chǎn)及集成
Danfoss流體管閥件
 
 
 
 
 
非標定制液冷產(chǎn)品
液冷系統(tǒng)生產(chǎn)及集成
閥門
傳感器
選型資料下載
  新聞通告
  成功案例
  資料下載

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


   

 

淺談 Nvidia H20 的實用價值
原文:https://zhuanlan.zhihu.com/p/691287727

 

一、引言

站在這個時間點上看,2024年國內(nèi)通過合規(guī)渠道能采購的英偉達的高端顯卡只有H20 [1, 2]。Nvidia H20擁有高配的顯存、很高的卡間互聯(lián)帶寬和有競爭力的FP8算力,是值得推薦的一款GPU卡(單看96GB的HBM3顯存配置,也推薦大家使用H20)。筆者預(yù)測2024年Nvidia H20的銷售情況與2023年Nvidia H800的銷售情況會比較類似,會從剛開始大家觀望到后來大家搶購(再到買不到)。本文就談?wù)凬vidia H20的實用價值。

 

二、H20簡介與對比

Nvidia H20是從Nvidia H200裁剪而來的[1, 2, 3],保留了900GB/s的卡間高速互聯(lián)帶寬(NVLink4.0和NVSwitch3.0)[4],并支持PCIe Gen5(128GB/s雙向帶寬)。PCIe Gen5連接支持400GbE集群網(wǎng)絡(luò),有利于組建超大規(guī)模GPU集群和保持較高的集群線性加速比。

在算力方面,H20峰值算力只有H200峰值算力的14.96%(~15%),H20峰值算力相對較低(被嚴重裁剪)。

在L2 Cache配置方面,H20配置了60MB的L2 Cache,比H200有更大的L2 Cache。 Nvidia H20擁有96GB的HBM3顯存,顯存帶寬高達4TB/s。雖然Nvidia H20的顯存配置相對于H200有所裁剪,但是H20的顯存配置相對于國產(chǎn)AI芯片還是有明顯優(yōu)勢的。

Nvidia GPU FP16算力(稠密,TFLOPS) FP8算力(稠密,TFLOPS) L2 Cache(MB) 顯存容量(GB) 顯存帶寬(TB/s) 卡間互聯(lián)帶寬(GB/s) PCIe連接
H200 989.5 1979 50 141 4.8 900 Gen5
H20 148 296 60 96 4.0 900 Gen5

當前國內(nèi)大模型廠商的訓(xùn)練算力主要集中在Nvidia A800和H800 [5, 6],以及華為昇騰910B-A2 [7, 8],與現(xiàn)有的算力資源相比,Nvidia H20也有其獨特的優(yōu)勢。

例如,相較于Nvidia A800,Nvidia H20在FP8算力、顯存配置、卡間互聯(lián)帶寬、PCIe連接等方面都有顯著優(yōu)勢;相較于Nvidia H800,Nvidia H20在L2 Cache、顯存配置、卡間互聯(lián)帶寬等方面都有顯著優(yōu)勢;相較于華為昇騰910B-A2,Nvidia H20在FP8算力、顯存配置、卡間互聯(lián)帶寬等方面都有顯著優(yōu)勢。

AI加速卡 FP16算力(稠密,TFLOPS) FP8算力(稠密,TFLOPS) L2 Cache(MB) 顯存容量(GB) 顯存帶寬(TB/s) 卡間互聯(lián)帶寬(GB/s) PCIe連接
H800 989.5 1979 50 80 3.35 400 Gen5
H20 148 296 60 96 4.0 900 Gen5
A800 312 不支持 80 80 2.0 400 Gen4(64 GB/s)
910B-A2 376 不支持 64 64 1.6 56 Gen5

 

三、H20 for 大模型訓(xùn)練

Nvidia H20擁有非常高的卡間互聯(lián)帶寬,并支持PCIe Gen5,在配備400GbE集群網(wǎng)絡(luò)情況下,H20集群線性加速比接近于1,使得H20卡非常適合用來組建大規(guī)模集群。

使用Nvidia H20執(zhí)行大模型訓(xùn)練任務(wù),基于目前的一些測試結(jié)果,對于BF16混合精度訓(xùn)練,在集群規(guī)模較小的情況下(例如,512 x H20),Nvidia H20訓(xùn)練吞吐大概可以達到Nvidia A800訓(xùn)練吞吐的62%(即集群規(guī)模較小的情況下,H20的性能是A800的性能的~60%)[11, 12];在集群規(guī)模較大的情況下(例如,4096 x H20),Nvidia H20訓(xùn)練吞吐大概可以達到Nvidia A800訓(xùn)練吞吐的70%(即集群規(guī)模較大的情況下,H20的性能是A800的性能的~70%)。

Huawei 910B-A2(over A800) Nvidia H20(over A800) Nvidia A800
較小集群規(guī)模(~512卡) 80% 62% 100%
較大集群規(guī)模(~4096卡) 50% 70% 90%(線性加速比)
FP8計算 vs BF16計算 80% 大于100% 100%

值得說明的是,F(xiàn)P8混合精度訓(xùn)練方法還不成熟,在現(xiàn)階段只能支持規(guī)模較小的LLM模型訓(xùn)練(例如,34B及以下)。未來隨著技術(shù)的演講,F(xiàn)P8混合精度訓(xùn)練會成為主流技術(shù)。

 

四、H20 for 大模型推理

Nvidia H20擁有非常好的顯存配置以及較好的FP8峰值算力,適合用于LLM推理。使用Nvidia H20執(zhí)行大模型推理任務(wù),特別是LLM推理任務(wù), Nvidia H20推理性能比Nvidia H800推理性能高出20% (例如,對比顯存帶寬:4/3.35 ~= 1.19 = 120%)[2, 9, 10]。

隨著未來LLM模型參數(shù)規(guī)模越來越大,需要使用擁有高配顯存的AI芯片來進行推理服務(wù),使用Nvidia H20執(zhí)行超大LLM模型推理任務(wù),是性價比更高的選擇[1, 2, 9, 10]。

此外,也可以使用Nvidia H20置換現(xiàn)在推理服務(wù)中使用A800和H800卡,這樣就可以有更多的A800卡和H800卡用于大模型訓(xùn)練。

Huawei 910B-A2(over A800) Nvidia H20(over A800) Nvidia A800
推理實例(~單機8卡) 80% 120% 100%
推理實例(~32卡) 75% 126% 100%

綜上所述,Nvidia H20核心價值在于: (1)使用H20組建大規(guī)模集群用于大模型訓(xùn)練(例如,F(xiàn)P8混合精度訓(xùn)練);(2)H20適合用于超大規(guī)模LLM推理(FP8計算);(3)H20價格適中(性價比高 )。

 

 

英偉達H20芯片:適應(yīng)市場變化的戰(zhàn)略調(diào)整
原創(chuàng) IT技術(shù)訂閱 IT技術(shù)訂閱 2024年08月19日 07:38 中國香港

在全球科技領(lǐng)域中,人工智能(AI)技術(shù)的發(fā)展正以前所未有的速度推動著產(chǎn)業(yè)變革。作為全球領(lǐng)先的GPU制造商之一,英偉達公司始終站在技術(shù)創(chuàng)新的前沿。然而,在國際政治經(jīng)濟形勢的影響下,英偉達面臨著前所未有的挑戰(zhàn)。為了應(yīng)對這些挑戰(zhàn)并保持市場領(lǐng)先地位,英偉達推出了專為中國市場設(shè)計的H20芯片。本文將深入探討H20芯片的技術(shù)特點、市場定位、競爭格局及其對未來AI產(chǎn)業(yè)發(fā)展的影響。

一、背景與挑戰(zhàn)

在過去的幾年里,國際形勢的變化對高科技產(chǎn)業(yè)產(chǎn)生了深遠影響。特別是針對尖端技術(shù)的出口管制政策,使得像英偉達這樣的國際巨頭不得不重新審視其全球戰(zhàn)略。面對這一現(xiàn)實,英偉達采取了一系列措施,包括推出H20芯片以適應(yīng)新的市場環(huán)境。

 

由于美國政府對尖端AI芯片實施了新的出口管制措施,英偉達需要調(diào)整其產(chǎn)品線以符合這些規(guī)定,并繼續(xù)在中國市場銷售其產(chǎn)品。

黃仁勛(英偉達創(chuàng)始人兼CEO)曾表示,這些限制可能會影響英偉達的市場份額,并可能促使中國企業(yè)加速自主研發(fā)。

二、H20芯片的技術(shù)特點

架構(gòu)與設(shè)計

H20芯片基于英偉達最新的Hopper架構(gòu),這一架構(gòu)代表了公司在GPU領(lǐng)域的最新成果。盡管H20在某些方面進行了“閹割”,以滿足特定市場的法規(guī)要求,但其核心架構(gòu)依然保留了許多創(chuàng)新元素,確保了較高的性能表現(xiàn)。

性能指標

H20芯片在計算能力和功耗管理方面進行了優(yōu)化,以適應(yīng)不同的應(yīng)用場景。雖然與旗艦級別的H100相比存在差距,但對于大多數(shù)用戶而言,H20已經(jīng)能夠提供足夠的算力支持。

 

H20芯片是經(jīng)過算力閹割的版本,相較于其他高性能芯片(如A100和H100)有所降級。

在算力方面,H20芯片大約只有H100芯片的20%到30%。

H20芯片基于最新的Hopper架構(gòu),這表明它在架構(gòu)上仍然較為先進。

 

H20和H100綜合對比

計算能力
H100理論峰值性能:1979 TFLOPs(使用TF32精度)。性能密度(TFLOPs/Die size):19.4。

H20理論峰值性能:296 TFLOPs(使用FP8精度或其他精度,具體未明確)。性能密度:2.9。

綜合算力:H20的綜合算力約為H100的20%,這意味著H20的算力大約是H100的六分之一左右。

顯存
H100顯存容量:80GB HBM3。內(nèi)存帶寬:3.4 TB/s。

H20顯存容量:96GB HBM3。內(nèi)存帶寬:4.0 TB/s。

功耗
H20:熱設(shè)計功耗為400W。
H100:熱設(shè)計功耗為700W。

架構(gòu)與互聯(lián)
H100 NVLink高速互聯(lián):900GB/s。支持7路MIG(Multi-Instance GPU)功能。

H20在HGX解決方案中支持8路GPU的配置。

H20在計算能力上遠不如H100,但是在顯存容量和帶寬方面有一定的優(yōu)勢,并且在特定的應(yīng)用場景中,比如大語言模型推理,它能夠提供更好的性能。H20的設(shè)計更多地考慮了能效比和成本效益,而H100則定位為頂級的高性能計算GPU。

 

三、市場定位與策略

目標市場

H20芯片主要面向中國市場,旨在滿足那些受到出口管制影響但仍希望使用英偉達技術(shù)的企業(yè)。通過調(diào)整產(chǎn)品規(guī)格,英偉達能夠在遵守法規(guī)的同時繼續(xù)保持與中國市場的聯(lián)系。

定價策略

為了提高市場競爭力,H20芯片在定價上采取了相對保守的策略。相較于競爭對手的產(chǎn)品,H20提供了更具吸引力的價格點,這對于預(yù)算有限的企業(yè)來說是一個重要的考慮因素。

 

H20芯片的價格區(qū)間大致在8.6萬到11萬人民幣之間,略低于華為昇騰910B的價格。

盡管性能較低,但由于其價格優(yōu)勢以及與英偉達現(xiàn)有平臺的兼容性,對于某些客戶來說仍具有吸引力。有些情況下,可能需要使用多塊H20芯片才能達到與單塊更高性能芯片相當?shù)乃懔λ健?/p>

 

預(yù)計營收

 

行業(yè)分析機構(gòu)預(yù)測,H20芯片能夠為英偉達帶來顯著的收入。據(jù)估計,僅這款芯片就能為英偉達貢獻超過120億美元的營收(接近870億人民幣)。

四、競爭格局

國內(nèi)廠商崛起

國內(nèi)AI芯片企業(yè)如華為、寒武紀、百度等已經(jīng)有成熟的產(chǎn)品可以批量出貨,這些產(chǎn)品在市場上與英偉達形成了競爭。一些大廠如阿里巴巴、騰訊、百度和字節(jié)跳動等已經(jīng)開始將部分訂單轉(zhuǎn)向國內(nèi)供應(yīng)商。

隨著國際貿(mào)易環(huán)境的變化,國內(nèi)AI芯片廠商如華為、寒武紀、百度等開始嶄露頭角。這些企業(yè)在過去幾年里迅速成長,不僅在國內(nèi)市場上取得了顯著的成績,也在國際市場上贏得了一席之地。

市場份額與趨勢

盡管面臨來自國內(nèi)廠商的競爭,英偉達憑借其深厚的技術(shù)積累和廣泛的生態(tài)系統(tǒng)支持,在中國市場仍保持著一定的市場份額。不過,隨著國內(nèi)企業(yè)的不斷進步,這種態(tài)勢可能會發(fā)生變化。

五、未來展望

技術(shù)發(fā)展

隨著AI技術(shù)的不斷進步,對于更高效、更強大的計算資源的需求將持續(xù)增長。英偉達將繼續(xù)投資研發(fā),推出更多創(chuàng)新產(chǎn)品以滿足市場需求。

合作與伙伴關(guān)系

英偉達認識到,單一企業(yè)無法獨自解決所有問題。因此,加強與其他企業(yè)、研究機構(gòu)的合作將是未來發(fā)展的關(guān)鍵。

結(jié)語

英偉達H20芯片不僅是公司在特定市場環(huán)境下的一次戰(zhàn)略調(diào)整,也是其在全球范圍內(nèi)持續(xù)推動技術(shù)創(chuàng)新的一個縮影。面對復(fù)雜多變的市場環(huán)境,英偉達通過靈活的產(chǎn)品策略展現(xiàn)了其應(yīng)對挑戰(zhàn)的能力。

 

H20 平臺NVQD02接頭

- 不銹鋼
- EPDM密封
- 單手連接或斷開
- Cv值高,高流量低壓降
- 連接力小,輕松連接
- 色帶清晰,陰接頭有色套筒,陽接頭有色密封
- 100% 氦氣檢測
- 規(guī)格: NVQD02和NVBQD02

H20 平臺NVBQD02盲插接頭

- 不銹鋼
- EPDM密封
- 單手連接或斷開
- Cv值高,高流量低壓降
- 連接力小,輕松連接
- 色帶清晰,陰接頭有色套筒,陽接頭有色密封
- 100% 氦氣檢測
- 規(guī)格: NVQD02和NVBQD02

 

關(guān)于我們

北京漢深流體技術(shù)有限公司是丹佛斯中國數(shù)據(jù)中心簽約代理商。產(chǎn)品包括FD83全流量自鎖球閥接頭,UQD系列液冷快速接頭、EHW194 EPDM液冷軟管、電磁閥、壓力和溫度傳感器及Manifold的生產(chǎn)和集成服務(wù)。在國家數(shù)字經(jīng)濟、東數(shù)西算、雙碳、新基建戰(zhàn)略的交匯點,公司聚焦組建高素質(zhì)、經(jīng)驗豐富的液冷工程師團隊,為客戶提供卓越的工程設(shè)計和強大的客戶服務(wù)。

公司產(chǎn)品涵蓋:丹佛斯液冷流體連接器、EPDM軟管、電磁閥、壓力和溫度傳感器及Manifold。
未來公司發(fā)展規(guī)劃:數(shù)據(jù)中心液冷基礎(chǔ)設(shè)施解決方案廠家,具備冷量分配單元(CDU)、二次側(cè)管路(SFN)和Manifold的專業(yè)研發(fā)設(shè)計制造能力。


- 針對機架式服務(wù)器中Manifold/節(jié)點、CDU/主回路等應(yīng)用場景,提供不同口徑及鎖緊方式的手動和全自動快速連接器。
- 針對高可用和高密度要求的刀片式機架,可提供帶浮動、自動校正不對中誤差的盲插連接器。以實現(xiàn)狹小空間的精準對接。
- 基于OCP標準全新打造的UQD/UQDB通用快速連接器也將首次亮相, 支持全球范圍內(nèi)的大批量交付。

 

北京漢深流體技術(shù)有限公司 Hansen Fluid
丹佛斯簽約中國經(jīng)銷商 Danfoss Authorized Distributor

地址:北京市朝陽區(qū)望京街10號望京SOHO塔1C座2115室
郵編:100102
電話:010-8428 2935 , 8428 3983 , 13910962635
手機:15801532751,17310484595 ,13910122694
13011089770,15313809303
Http://shanghaining.com.cn
E-mail:sales@cnmec.biz

傳真:010-8428 8762

京ICP備2023024665號
京公網(wǎng)安備 11010502019740

Since 2007 Strong Distribution & Powerful Partnerships