chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

千瓦芯片時代的熱管理變革

半導體芯科技SiSC ? 來源:半導體芯科技SiSC ? 作者:半導體芯科技SiS ? 2024-01-04 17:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:半導體芯科技編譯

隨著摩爾定律的放緩,芯片,尤其是用于人工智能和高性能計算(HPC)的芯片,逐漸變得炙手可熱。2023 年,隨著英偉達(Nvidia)GH200 超級芯片的到來,我們看到加速器的功率進入了千瓦級。

我們早已知道這些芯片會很熱門--Nvidia 在兩年前就已經(jīng)開始預告這款 CPU-GPU 芯片。直到最近,我們才知道原始設(shè)備制造商和系統(tǒng)構(gòu)建商將如何應對這種功率密集型部件。大多數(shù)系統(tǒng)會采用液體冷卻嗎?還是大多數(shù)會堅持使用空氣冷卻?他們會在一個盒子里塞進多少臺這樣的加速器,盒子又有多大?

現(xiàn)在,第一批基于 GH200 的系統(tǒng)已經(jīng)投放市場,很明顯,外形尺寸在很大程度上是由功率密度決定的。從根本上說,這取決于散熱的表面積有多大。

深入研究 Supermicro、Gigabyte、QCT、Pegatron、HPE 等公司目前提供的系統(tǒng),您很快就會注意到一個趨勢。每個機架單元 (RU) 高達 500 W – Supermicro 的 MGX ARS-111GL-NHR 為 1 kW – 這些系統(tǒng)主要采用風冷。雖然溫度較高,但散熱負荷仍在可控范圍內(nèi),每個機架的功率約為 21-24 kW。這完全在現(xiàn)代數(shù)據(jù)中心的供電和熱管理能力范圍內(nèi),尤其是那些使用后門熱交換器的數(shù)據(jù)中心。

但是,當系統(tǒng)制造商開始在每個機箱中安裝超過 1 kW的加速器時,情況就會發(fā)生變化。此時,我們看到的大多數(shù) OEM 系統(tǒng)都改用了直接液冷技術(shù)。例如,Gigabyte的 H263-V11 在一個 2U 機箱中最多可容納四個 GH200 節(jié)點。

也就是說,每個機架單元的功率為 2 kW。因此,雖然像 Nvidia 的風冷 DGX H100 系統(tǒng)(配備 8 個 700 瓦 H100 和雙藍寶石 Rapids CPU)的 TDP 較高,為 10.2 千瓦,但其功率密度實際上較低,為 1.2 kW/RU。

除了能更有效地從這些密集的加速器中傳遞熱量外,液體冷卻還有幾個優(yōu)點。系統(tǒng)功率越高,從系統(tǒng)中帶走熱量所需的靜壓和氣流就越大。這就意味著要使用更熱、更快的風扇,從而消耗更多的功率——在某些情況下可能高達系統(tǒng)功率的 20%。

當每個機架單元的功率超過 500 W 時,大多數(shù)原始設(shè)備制造商和原始設(shè)計制造商似乎都會選擇液冷機箱,因為冷卻網(wǎng)卡、存儲和其他外設(shè)等低功耗組件所需的風扇數(shù)量更少、速度更慢。

只要看看 HPE 的 Cray EX254n 刀片,就能知道液冷機箱的作用有多大。該平臺最多可支持四個 GH200。在 1U 的計算刀片中就有 4 千瓦,這還不算用于為芯片提供數(shù)據(jù)的網(wǎng)卡。

當然,HPE 的 Cray 部門對超高密度計算組件的冷卻確實很有心得。不過,這確實說明了系統(tǒng)構(gòu)建商在服務(wù)器上花費的心思,不僅在系統(tǒng)層面,而且在機架層面。

機架級起飛

正如我們之前在介紹 Nvidia DGX H100 系統(tǒng)時提到的那樣,為多千瓦服務(wù)器單獨散熱是原始設(shè)備制造商非常熟悉的事情。但是,一旦要在機架上安裝這些系統(tǒng),情況就會變得復雜起來,機架電源和設(shè)備冷卻等因素都會發(fā)揮作用。

在我們的同類出版物《下一代平臺》(The Next Platform)上,我們深入探討了像 Digital Reality 這樣的數(shù)據(jù)中心運營商為支持此類系統(tǒng)的密集部署而必須克服的挑戰(zhàn)。

在許多情況下,主機托管服務(wù)提供商需要重新設(shè)計其電源和冷卻基礎(chǔ)設(shè)施,以支持在單個機架中安裝四個 DGX H100 系統(tǒng)所需的 40 多千瓦的功率和熱量。

但是,如果您的數(shù)據(jù)中心或主機托管服務(wù)提供商無法提供這種功率的機架,也無法承受這種熱量,那么在大部分機架都將空置的情況下,將這些系統(tǒng)的密度提高到這種程度就沒有多大意義了。

隨著 GH200 的推出,我們看到 Nvidia 不再關(guān)注單個系統(tǒng),而是更加關(guān)注機架規(guī)模的部署。在今年春季的 Computex 上,我們首次看到了 DGX GH200 集群。

該系統(tǒng)實際上由 256 個 2U 節(jié)點組成,每個節(jié)點都裝有一個 GH200 加速器,而不是一堆密集的 GPU 節(jié)點。組合起來,該系統(tǒng)能夠提供高達 exaFLOPS 的 FP8 性能,但在設(shè)施層面的部署要容易得多?,F(xiàn)在的功耗不再是 1.2 kW/RU,而是接近 500 W/RU,這與大多數(shù)原始設(shè)備制造商使用自己的風冷系統(tǒng)時的情況差不多。

最近,我們看到 Nvidia 在今年秋季的 Re:Invent 大會上與 AWS 合作發(fā)布了 GH200-NVL32,將其縮小到單個機架。

該系統(tǒng)在一個機架上安裝了 16 個 1U 機箱,每個機箱配備兩個 GH200 節(jié)點,并使用九個 NVLink 交換機托盤將它們連接在一起。不用說,這些計算能力為 2 千瓦/RU 的小系統(tǒng)密度很高,因此從一開始就被設(shè)計為液冷系統(tǒng)。

更熱的芯片即將上市

雖然我們一直在關(guān)注 Nvidia 的 Grace Hopper 超級芯片,但這家芯片制造商并不是唯一一家為追求性能和效率而將 TDP 推向新極限的廠商。

本月早些時候,AMD 公布了其最新的 AI 和 HPC GPU 和 APU,該公司的 Instinct 加速器的功耗從上一代的 560 W 躍升至 760 W。

更重要的是,AMD 首席技術(shù)官馬克-帕普馬斯特(Mark Papermaster)告訴《The Register》,未來幾年仍有足夠的空間將 TDP 推得更高。

至于這是否會最終促使芯片制造商強制要求其旗艦產(chǎn)品采用液冷技術(shù),目前還沒有答案。據(jù) Papermaster 稱,AMD 將在其平臺上支持空氣和液體冷卻。但正如我們在 AMD 新的 MI300A APU 上看到的那樣,繼續(xù)選擇風冷幾乎肯定意味著性能上的讓步。

MI300A的額定功率為550瓦,遠遠低于我們所認為的850瓦,但如果有足夠的冷卻,它的運行溫度會更高。在HPC調(diào)整系統(tǒng)中,如HPE、Eviden(Atos)或聯(lián)想開發(fā)的系統(tǒng),芯片可以配置為760 W。

與此同時,英特爾正在探索使用兩相冷卻劑和珊瑚啟發(fā)設(shè)計的散熱片來冷卻 2 千瓦芯片的新方法,以促進氣泡的形成。

這家芯片制造商還宣布與基礎(chǔ)設(shè)施和化學品供應商建立廣泛的合作關(guān)系,以擴大液體冷卻技術(shù)的使用范圍。該公司最新的合作旨在利用 Vertiv 的泵送兩相冷卻技術(shù)為英特爾即將推出的 Guadi3 AI 加速器開發(fā)冷卻解決方案。?

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53499

    瀏覽量

    458527
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5645

    瀏覽量

    138975
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38004

    瀏覽量

    295956
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    在實際網(wǎng)關(guān)設(shè)計中,如何利用電容的高紋波電流能力進行熱管理優(yōu)化?

    在實際網(wǎng)關(guān)設(shè)計中,如何利用電容的高紋波電流能力進行熱管理優(yōu)化?
    發(fā)表于 11-26 07:59

    維諦技術(shù)(Vertiv)“熱管理鏈分論壇”:兆時代需要“全鏈制冷”思維

    面對高密算力帶來的散熱挑戰(zhàn),一場關(guān)于制冷技術(shù)的顛覆性變革正在發(fā)生——“兆時代”智算中心制冷,必須從整個熱管理鏈條上尋找突破,任何單一技術(shù)都無法獨立解決問題?!八紵o界設(shè)享未來——202
    的頭像 發(fā)表于 11-17 16:17 ?962次閱讀
    維諦技術(shù)(Vertiv)“<b class='flag-5'>熱管理</b>鏈分論壇”:兆<b class='flag-5'>瓦</b><b class='flag-5'>時代</b>需要“全鏈制冷”思維

    進芯電子亮相第六屆溧陽熱管理論壇

    10月30日—31日,第六屆溧陽熱管理論壇在江蘇溧陽順利舉辦,余位來自新能源汽車、數(shù)據(jù)中心、AI芯片及低空經(jīng)濟等領(lǐng)域的行業(yè)專家與企業(yè)代表齊聚一堂,圍繞熱管理技術(shù)的前沿趨勢與產(chǎn)業(yè)協(xié)同展
    的頭像 發(fā)表于 11-05 15:35 ?292次閱讀

    30千瓦的廚房電器EMC如何整改呢?

    隨著智能廚房設(shè)備功率密度持續(xù)升級,30千瓦級大功率廚房電器的電磁兼容性(EMC)問題日益凸顯。行業(yè)數(shù)據(jù)顯示,約60%的便攜式電源產(chǎn)品因傳導發(fā)射超標導致認證失敗,不僅延誤上市周期,單次整改成本甚至
    的頭像 發(fā)表于 08-29 17:50 ?450次閱讀

    熱管理技術(shù)設(shè)計革命:主動散熱與被動散熱

    隨著半導體工藝逼近物理極限,集成電路產(chǎn)業(yè)正加速向“超越摩爾”時代躍遷,芯片功率密度與發(fā)熱量劇增。5G、AI、HPC、數(shù)據(jù)中心等新興領(lǐng)域?qū)Ω咝?b class='flag-5'>熱管理技術(shù)提出迫切需求。先進封裝與熱管理技術(shù)
    的頭像 發(fā)表于 08-01 06:23 ?563次閱讀
    <b class='flag-5'>熱管理</b>技術(shù)設(shè)計革命:主動散熱與被動散熱

    30千瓦的顯示屏EMC如何整改呢?

    南柯電子|30千瓦的顯示屏EMC如何整改呢?
    的頭像 發(fā)表于 07-24 09:35 ?434次閱讀

    30千瓦的開關(guān)電源EMC傳導如何整改呢?

    深圳南柯電子|30千瓦的開關(guān)電源EMC傳導如何整改呢?
    的頭像 發(fā)表于 07-17 11:05 ?567次閱讀

    30千瓦的高壓線束EMC如何整改呢?

    深圳南柯電子|30千瓦的高壓線束EMC如何整改呢?
    的頭像 發(fā)表于 07-10 09:36 ?349次閱讀

    30千瓦的掃地機器人EMC如何整改呢?

    南柯電子|30千瓦的掃地機器人EMC如何整改呢?
    的頭像 發(fā)表于 06-19 09:42 ?587次閱讀

    30千瓦的移動電源EMC如何整改呢?

    南柯電子|30千瓦的移動電源EMC如何整改呢?
    的頭像 發(fā)表于 06-06 09:40 ?563次閱讀
    30<b class='flag-5'>千瓦</b>的移動電源EMC如何整改呢?

    30千瓦的便攜式電源EMC如何整改呢?

    南柯電子|30千瓦的便攜式電源EMC如何整改呢?
    的頭像 發(fā)表于 05-22 09:35 ?461次閱讀
    30<b class='flag-5'>千瓦</b>的便攜式電源EMC如何整改呢?

    閃充橫空出世,120kw充電樁面臨淘汰?

    120千瓦直流充電樁短期內(nèi)并不會被淘汰,仍將在未來5-10年保持市場主力地位
    的頭像 發(fā)表于 04-15 10:25 ?862次閱讀
    兆<b class='flag-5'>瓦</b>閃充橫空出世,120kw充電樁面臨淘汰?

    汽車電芯的熱管理設(shè)計

    一、不同電芯熱管理介紹熱管理的意義:人們對電動車續(xù)航里程、充電時間的要求越來越高,行之有效的電池熱管理系統(tǒng),對于提高電池包整體性能具有重要意義。熱管理想要達到的效果:Pack內(nèi)熱過程
    的頭像 發(fā)表于 04-13 15:51 ?916次閱讀
    汽車電芯的<b class='flag-5'>熱管理</b>設(shè)計

    汽車熱管理相關(guān)知識

    在汽車問世以來,熱管理有著不可或缺的作用。從傳統(tǒng)內(nèi)燃機時代發(fā)動機冷卻系統(tǒng),到車內(nèi)溫度調(diào)節(jié)系統(tǒng)。隨著電子控制技術(shù)的發(fā)展,從傳統(tǒng)的機械式驅(qū)動系統(tǒng),引入電子水泵和電動風扇。
    的頭像 發(fā)表于 01-22 13:58 ?1469次閱讀
    汽車<b class='flag-5'>熱管理</b>相關(guān)知識

    經(jīng)緯恒潤熱管理系統(tǒng)研發(fā)服務(wù)全新升級

    為了應對日趨復雜的熱管理系統(tǒng)和降本增效的研發(fā)需求,數(shù)字化技術(shù)在熱管理系統(tǒng)的研發(fā)中將發(fā)揮重要作用。經(jīng)緯恒潤在汽車熱管理領(lǐng)域擁有15年的研發(fā)服務(wù)經(jīng)驗,針對目前新能源汽車熱管理系統(tǒng)設(shè)計研發(fā)問
    的頭像 發(fā)表于 12-30 10:29 ?811次閱讀
    經(jīng)緯恒潤<b class='flag-5'>熱管理</b>系統(tǒng)研發(fā)服務(wù)全新升級