chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HBM的未來

sakobpqhz ? 來源:算力基建 ? 2023-11-15 15:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

01.HBM

高帶寬內(nèi)存(HBM)正在成為超大規(guī)模廠商的首選內(nèi)存,但其在主流市場的最終命運(yùn)仍然存在疑問。雖然它在數(shù)據(jù)中心中已經(jīng)很成熟,并且由于人工智能/機(jī)器學(xué)習(xí)的需求導(dǎo)致使用量不斷增加,但其基本設(shè)計(jì)固有的缺陷阻礙了更廣泛的采用。另一方面,HBM 提供結(jié)構(gòu)緊湊的 2.5D 結(jié)構(gòu)尺寸,可大幅減少延遲。

Rambus產(chǎn)品營銷高級總監(jiān) Frank Ferro 在 Rambus 設(shè)計(jì)展會上發(fā)表演講時(shí)表示:“HBM 的優(yōu)點(diǎn)在于,可以在可變的范圍內(nèi)獲得所有這些帶寬,并且表示獲得了非常好的功耗。”

8e238020-8371-11ee-939d-92fbcf53809c.png

圖1:實(shí)現(xiàn)最大數(shù)據(jù)吞吐量的HBM堆棧

“目前困擾高帶寬內(nèi)存的問題之一是成本,”Cadence IP 團(tuán)隊(duì)產(chǎn)品營銷總監(jiān) Marc Greenberg 說道?!?D 成本相當(dāng)高,相當(dāng)于有一個(gè)邏輯芯片位于芯片的底部,這是你必須支付的額外硅片。然后是硅層,它位于CPUGPU以及HBM內(nèi)存的下面。然后,你需要一個(gè)更大的封裝,等等。目前現(xiàn)存的HBM切割了消費(fèi)者領(lǐng)域,并更早放置在服務(wù)器機(jī)房或數(shù)據(jù)中心,存在許多系統(tǒng)成本。相比之下,GDDR6等圖形內(nèi)存雖然無法提供與HBM一樣多的性能,但成本卻顯著降低。GDDR6的單位成本性能實(shí)際上比 HBM 好,但 GDDR6 器件的最大帶寬與 HBM 的最大帶寬不匹配?!?/p>

Greenberg表示,這些差異為公司選擇 HBM 提供了令人信服的理由,即使它可能不是他們的第一選擇?!癏BM 提供充足的帶寬,并且每比特傳輸?shù)哪芰繕O低。使用 HBM 是因?yàn)槟惚仨氝@樣做,因?yàn)闆]有其他解決方案可以為你提供所需的帶寬或所需的功率?!?/p>

而且 HBM 只會變得越來越快。“我們預(yù)計(jì) HBM3 Gen2 的帶寬將提高 50%,”美光計(jì)算產(chǎn)品事業(yè)部副總裁兼總經(jīng)理 Praveen Vaidyanathan 說道?!皬拿拦獾慕嵌葋砜?,我們預(yù)計(jì) HBM3 Gen2產(chǎn)品將在2024財(cái)年實(shí)現(xiàn)量產(chǎn)。在2024日歷年初,我們預(yù)計(jì)隨著時(shí)間的流逝,它將開始為收入做出貢獻(xiàn)。此外,我們預(yù)測美光的HBM3將貢獻(xiàn)比DRAM更高利潤?!?/p>

盡管如此,成本因素可能會像許多設(shè)計(jì)團(tuán)隊(duì)一樣考慮更有性價(jià)比的替代方案。

Greenberg指出:“如果有任何方法可以將大問題解析為更小的部分,你可能會發(fā)現(xiàn)它提高了成本效益。例如,面對一個(gè)巨大的問題并且必須在一個(gè)硬件上執(zhí)行所有這些操作,而且我必須在那里使用 HBM,也許我可以將其中斷兩個(gè)部分。讓兩個(gè)進(jìn)程任務(wù)運(yùn)行,另外一部分可能連接到 DDR6。如果我能夠?qū)栴}闡釋為更小的部分,那么我可能會以更小成本完成相同數(shù)量的計(jì)算。但如果你需要那么大的帶寬,那么 HBM 就是你唯一的選擇?!?/p>

另一個(gè)主要缺點(diǎn)是HBM 的 2.5D 結(jié)構(gòu)會積聚熱量,而其放置在接近 CPU 和 GPU 的位置會加劇這種情況。事實(shí)上,在嘗試給出不良設(shè)計(jì)的理論樣本時(shí),很難想出比當(dāng)前樣本更糟糕的東西,當(dāng)前布局將 HBM及其熱敏 DRAM 堆棧放置在計(jì)算密集型熱源附近,導(dǎo)致散熱很難處理。

“最大的挑戰(zhàn)是數(shù)據(jù),”Greenberg說。“你有一個(gè)CPU,根據(jù)定義它會生成大量數(shù)據(jù)。你通過這個(gè)接口每秒T bits,即使每次消耗只有皮焦耳熱,但每秒都會執(zhí)行十億次計(jì)算,因此你的CPU會非常熱。它不僅僅是移動周圍的數(shù)據(jù)。它也必須進(jìn)行計(jì)算。最重要的是最不喜歡熱的半導(dǎo)體組件,即DRAM。85 ℃左右它開始忘記東西,125℃左右則心不在焉。這是兩個(gè)完全不同的事情?!?/p>

還有一個(gè)可取之處?!皳碛?.5D堆棧的優(yōu)勢在于,CPU很熱,但可以間隔一定物理距離把HBM位于CPU旁邊,這樣會犧牲延時(shí)性能?!彼f。

但是Synopsys 內(nèi)存接口 IP 解決方案產(chǎn)品線總監(jiān) Brett Murdock說道,“在延遲和熱量之間的權(quán)衡中,延遲是不能變的。我沒有看到任何人犧牲延遲,我希望他們推動物理團(tuán)隊(duì)尋找更多好的冷卻方式,或者更好的放置方式,以保持較低的延遲?!?/p>

02.HBM和AI

雖然很容易想象計(jì)算是 AI/ML 最密集的部分,但如果沒有良好的內(nèi)存架構(gòu),這一切都不會發(fā)生。需要內(nèi)存來存儲和檢索數(shù)萬億次計(jì)算。事實(shí)上,在某種程度上添加更多 CPU 并不會提高系統(tǒng)性能,因?yàn)閮?nèi)存帶寬無法支持它們。這就是臭名昭著的“內(nèi)存墻”瓶頸。

Quadric首席營銷官 Steve Roddy 表示,從最廣泛的定義來看,學(xué)習(xí)機(jī)器只是曲線函數(shù)?!霸谟?xùn)練運(yùn)行的每次迭代中,你都在努力越來越接近曲線的最佳函數(shù)。這是一個(gè)XY圖,就像高中幾何課一樣。大型語言模型基本上是同一件事,但是是100億維,而不是2維?!?/p>

因此,計(jì)算相對簡單,但內(nèi)存架構(gòu)可能非常驚人。

Roddy 解釋說:“其中一些模型擁有 1000 億字節(jié)的數(shù)據(jù),對于每次重新訓(xùn)練迭代,你都必須通過數(shù)據(jù)中心的背板從磁盤上取出 1000 億字節(jié)的數(shù)據(jù)并放入計(jì)算箱中。”“在兩個(gè)月的訓(xùn)練過程中,你必須將這組巨大的內(nèi)存值來回移動數(shù)百萬次。限制因素是數(shù)據(jù)的移入和移出,這就是為什么人們對 HBM 或光學(xué)互連從內(nèi)存?zhèn)鬏數(shù)接?jì)算結(jié)構(gòu)的東西感興趣。所有這些都是人們投入數(shù)億美元風(fēng)險(xiǎn)投資的地方,因?yàn)槿绻隳苓M(jìn)行每周距離或時(shí)間,你就可以最大程度地簡化每周訓(xùn)練過程,無論是切斷電源還是加快速度?!?/p>

由于所有這些原因,高帶寬內(nèi)存被認(rèn)為是 AI/ML 的首選內(nèi)存?!八峁┝艘恍┯?xùn)練算法所需的最大帶寬,”Rambus 的 Ferro 說?!皬目梢該碛卸鄠€(gè)內(nèi)存堆棧從角度來看,它是可配置的,這提供了非常高的帶寬。”

這就是人們對 HBM 如此感興趣的原因。Synopsys的大多數(shù)客戶都是人工智能客戶,所以他們正在 LPDDR5X 接口和 HBM 接口之間進(jìn)行一項(xiàng)重大的基本權(quán)衡。他們忽略了成本。他們真的很渴望 HBM。這是他們對技術(shù)的渴望,因?yàn)橥ㄟ^HBM能夠在一個(gè) SoC 周圍創(chuàng)建可以足夠大的帶寬量。現(xiàn)在,他們可以在SoC 周圍放置了 6 個(gè) HBM 堆棧。

然而,人工智能的需求如此之高,以至于HBM減少延遲的前沿特征又推動了下一代HBM的發(fā)展。

“延遲正在成為一個(gè)真正的問題,”Ferro說?!霸?HBM 的前兩代中,我沒有聽到任何人抱怨延遲。現(xiàn)在我們一直收到有關(guān)延遲的問題?!?/p>

Ferro 建議,抓住當(dāng)前的限制,了解數(shù)據(jù)結(jié)構(gòu)極其重要?!八赡苁沁B續(xù)的數(shù)據(jù),例如視頻或語音識別。也可能是事務(wù)性的,就像財(cái)務(wù)數(shù)據(jù)一樣,可能非常隨機(jī)。如果你知道數(shù)據(jù)是隨機(jī)的,那么設(shè)置內(nèi)存接口的方式將與流式傳輸視頻不同。這些是基本問題,但也有層次的問題。我要在內(nèi)存中使用的字長是多少?內(nèi)存的塊大小是多少?這個(gè)了解得越多,你設(shè)計(jì)系統(tǒng)的效率就越大。如果你了解了,那么你可以定制處理器,從而最大限度地提高計(jì)算能力和內(nèi)存帶寬。我們看到越來越多的 ASIC 式 SoC 正在瞄準(zhǔn)特定的目標(biāo)市場剖析市場,以實(shí)現(xiàn)更高效的處理?!?/p>

降低 HBM 成本將是一項(xiàng)挑戰(zhàn)。由于將 TSV 放置在晶圓上的成本很高,因此加工成本已經(jīng)明顯高于標(biāo)準(zhǔn) DRAM。這使得它無法擁有像標(biāo)準(zhǔn) DRAM 一樣大的市場。由于市場較小,規(guī)模經(jīng)濟(jì)導(dǎo)致成本在一個(gè)自給自足的過程中更高。體積越小,成本越高,但成本越高,使用的體積就越少。沒有簡單的方法可以解決這個(gè)問題。盡管如此,HBM 已經(jīng)是一個(gè)成熟的 JEDEC 標(biāo)準(zhǔn)產(chǎn)品,這是一種獨(dú)特的 DRAM 技術(shù)形式,能夠以比 SRAM 低得多的成本提供極高的帶寬。它還可以通過封裝提供比 SRAM 更高的密度。它會隨著時(shí)間的推移而改進(jìn),就像 DRAM 一樣。隨著接口的成熟,預(yù)計(jì)會看到更多巧妙的技巧來提高其速度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1820

    文章

    50325

    瀏覽量

    266949
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8565

    瀏覽量

    137224
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    2

    文章

    433

    瀏覽量

    15884

原文標(biāo)題:HBM的未來

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    內(nèi)存要取代GPU?HBM之父警告:以英偉達(dá)GPU為核心的架構(gòu)要被顛覆

    主板和CPU成為了主角。 ? 而最近“HBM之父”金正浩教授也語出驚人,提出未來內(nèi)存將成為主角:“GPU和CPU將會被集成到內(nèi)存(HBM和HBF)里,淪為內(nèi)存中的一個(gè)組件”。 ? 倒反天罡,在內(nèi)存里裝GPU? ? 目前AI計(jì)算的
    的頭像 發(fā)表于 04-03 09:54 ?7054次閱讀
    內(nèi)存要取代GPU?<b class='flag-5'>HBM</b>之父警告:以英偉達(dá)GPU為核心的架構(gòu)要被顛覆

    GPU猛獸襲來!HBM4、AI服務(wù)器徹底引爆!

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)日前,多家服務(wù)器廠商表示因AI服務(wù)器需求高漲拉高業(yè)績增長。隨著AI服務(wù)器需求旺盛,以及英偉達(dá)GPU的更新?lián)Q代,勢必帶動HBM供應(yīng)商的積極產(chǎn)品推進(jìn)。三星方面HBM
    的頭像 發(fā)表于 06-02 06:54 ?6997次閱讀

    KV緩存黑科技!SK海力士“H3存儲架構(gòu)”,HBM和HBF技術(shù)加持!

    structure)”,同時(shí)采用了HBM和HBF兩種技術(shù)。 ? 在SK海力士設(shè)計(jì)的仿真實(shí)驗(yàn)中,H3架構(gòu)將HBM和HBF顯存并置于GPU旁,由GPU負(fù)責(zé)計(jì)算。該公司將8個(gè)HBM3E和8個(gè)HBF置于英偉達(dá)
    的頭像 發(fā)表于 02-12 17:01 ?7753次閱讀
    KV緩存黑科技!SK海力士“H3存儲架構(gòu)”,<b class='flag-5'>HBM</b>和HBF技術(shù)加持!

    消息稱英偉達(dá)HBM4訂單兩家七三分,獨(dú)缺這一家

    據(jù)韓媒報(bào)道,三星電子決定最早于本月第三周開始量產(chǎn)HBM4,這批產(chǎn)品將用于英偉達(dá)下一代人工智能計(jì)算平臺“Vera Rubin”。英偉達(dá)有望在下月年度開發(fā)者大會(GTC)上首次公開搭載三星電子HBM
    的頭像 發(fā)表于 02-11 10:27 ?1692次閱讀

    存儲狂飆與HBM擴(kuò)產(chǎn)潮下,高端芯片燒錄的“速度與精度”終極博弈

    當(dāng)前存儲市場上行,HBM 技術(shù)演進(jìn)推動燒錄數(shù)據(jù)量指數(shù)級增長,傳統(tǒng)燒錄與測試方案遇瓶頸。行業(yè)通過高速接口、多芯片協(xié)同、智能校準(zhǔn)與光學(xué)檢測融合等創(chuàng)新方案應(yīng)對,同時(shí)向制造鏈整合的模塊化方案轉(zhuǎn)型。禾洛半導(dǎo)體
    的頭像 發(fā)表于 12-29 16:52 ?1956次閱讀

    AI大算力的存儲技術(shù), HBM 4E轉(zhuǎn)向定制化

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)如今英偉達(dá)GPU迭代速度加快至每年一次,HBM存儲速率如何跟上GPU發(fā)展節(jié)奏。越來越多的超大規(guī)模云廠商、GPU廠商開始轉(zhuǎn)向定制化HBM。而HBM存儲廠商以及晶圓代工廠也
    的頭像 發(fā)表于 11-30 00:31 ?8839次閱讀
    AI大算力的存儲技術(shù), <b class='flag-5'>HBM</b> 4E轉(zhuǎn)向定制化

    半導(dǎo)體“HBM和3D Stacked Memory”技術(shù)的詳解

    3D Stacked Memory是“技術(shù)方法”,而HBM是“用這種方法解決特定問題的產(chǎn)品”。
    的頭像 發(fā)表于 11-07 19:39 ?6716次閱讀
    半導(dǎo)體“<b class='flag-5'>HBM</b>和3D Stacked Memory”技術(shù)的詳解

    美光確認(rèn)HBM4將在2026年Q2量產(chǎn)

    2025年9月24日,美光在2025財(cái)年第四季度財(cái)報(bào)電話會議中確認(rèn),第四代高帶寬內(nèi)存(HBM4)將于2026年第二季度量產(chǎn)出貨,2026年下半年進(jìn)入產(chǎn)能爬坡階段。其送樣客戶的HBM4產(chǎn)品傳輸速率突破
    的頭像 發(fā)表于 09-26 16:42 ?2377次閱讀

    HBM技術(shù)在CowoS封裝中的應(yīng)用

    HBM通過使用3D堆疊技術(shù),將多個(gè)DRAM(動態(tài)隨機(jī)存取存儲器)芯片堆疊在一起,并通過硅通孔(TSV,Through-Silicon Via)進(jìn)行連接,從而實(shí)現(xiàn)高帶寬和低功耗的特點(diǎn)。HBM的應(yīng)用中,CowoS(Chip on Wafer on Substrate)封裝技術(shù)
    的頭像 發(fā)表于 09-22 10:47 ?2680次閱讀

    傳英偉達(dá)自研HBM基礎(chǔ)裸片

    電子發(fā)燒友網(wǎng)綜合報(bào)道,據(jù)臺媒消息,傳聞英偉達(dá)已開始開發(fā)自己的HBM基礎(chǔ)裸片,預(yù)計(jì)英偉達(dá)的自研HBM基礎(chǔ)裸片采用3nm工藝制造,計(jì)劃在2027年下半年進(jìn)行小批量試產(chǎn)。并且這一時(shí)間點(diǎn)大致對應(yīng)"Rubin
    的頭像 發(fā)表于 08-21 08:16 ?3030次閱讀

    性能優(yōu)于HBM,超高帶寬內(nèi)存 (X-HBM) 架構(gòu)來了!

    電子發(fā)燒友網(wǎng)綜合報(bào)道,NEO Semiconductor宣布推出全球首款用于AI芯片的超高帶寬內(nèi)存 (X-HBM) 架構(gòu)。該架構(gòu)旨在滿足生成式AI和高性能計(jì)算日益增長的需求,其32Kbit數(shù)據(jù)總線
    的頭像 發(fā)表于 08-16 07:51 ?5148次閱讀
    性能優(yōu)于<b class='flag-5'>HBM</b>,超高帶寬內(nèi)存 (X-<b class='flag-5'>HBM</b>) 架構(gòu)來了!

    突破堆疊瓶頸:三星電子擬于16層HBM導(dǎo)入混合鍵合技術(shù)

    在當(dāng)今科技飛速發(fā)展的時(shí)代,人工智能、大數(shù)據(jù)分析、云計(jì)算以及高端圖形處理等領(lǐng)域?qū)Ω咚佟⒏邘挻鎯Φ男枨蟪尸F(xiàn)出爆炸式增長。這種背景下,高帶寬內(nèi)存(High Bandwidth Memory,HBM)技術(shù)
    的頭像 發(fā)表于 07-24 17:31 ?1126次閱讀
    突破堆疊瓶頸:三星電子擬于16層<b class='flag-5'>HBM</b>導(dǎo)入混合鍵合技術(shù)

    HBM應(yīng)用在手機(jī)上,可行嗎?

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)最近有不少關(guān)于HBM技術(shù)被應(yīng)用到手機(jī)的消息,此前有消息稱蘋果會在20周年iPhone,也就是2027年推出使用HBM DRAM的iPhone手機(jī),提高端側(cè)AI能力
    的頭像 發(fā)表于 07-13 06:09 ?7567次閱讀

    SK海力士HBM技術(shù)的發(fā)展歷史

    SK海力士在鞏固其面向AI的存儲器領(lǐng)域領(lǐng)導(dǎo)地位方面,HBM1無疑發(fā)揮了決定性作用。無論是率先開發(fā)出全球首款最高性能的HBM,還是確立并保持其在面向AI的存儲器市場的領(lǐng)先地位,這些成就的背后皆源于SK海力士秉持的“一個(gè)團(tuán)隊(duì)”協(xié)作精神(One Team Spirit)。
    的頭像 發(fā)表于 06-18 15:31 ?2297次閱讀

    Cadence推出HBM4 12.8Gbps IP內(nèi)存系統(tǒng)解決方案

    近日,Cadence(NASDAQ:CDNS)近日宣布推出業(yè)界速度最快的 HBM4 12.8Gbps 內(nèi)存 IP 解決方案,以滿足新一代 AI 訓(xùn)練和 HPC 硬件系統(tǒng)對 SoC 日益增長的內(nèi)存帶寬
    的頭像 發(fā)表于 05-26 10:45 ?1737次閱讀