chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

術(shù)業(yè)有專攻——AI系統(tǒng)主控CPU英特爾至強6新品處理器淺析

科技見聞網(wǎng) ? 來源:科技見聞網(wǎng) ? 作者:科技見聞網(wǎng) ? 2025-06-19 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、至強6與NVIDIA GPU協(xié)同的硬件基礎

wKgZO2hTzFKASm6xAAJa9Y5Fzc8048.png

AI 異構(gòu)計算架構(gòu)中,英特爾至強6處理器作為主控CPU可以與NVIDIA最新GPU 很好地協(xié)同。根據(jù)英偉達官網(wǎng)信息,目前其DGX B300系統(tǒng)選擇至強6776P作為唯一主控CPU,采用雙路配置,通過UPI總線實現(xiàn)CPU間互連。這8個GPU通過NVLink高速互連,是性能比較高端的DGX,為訓練等應用而設計。

作為主控CPU,它和GPU協(xié)同工作,而這個系統(tǒng)的性能受到諸多因素的影響,這里列出的是最主要的因素,包括I/O、核心性能、內(nèi)存(包括帶寬和容量)、CPU上的預處理或卸載(offload)能力、整體CPU系統(tǒng)的RAS,以及各種硬件的外形設計等。這些都會影響整個AI系統(tǒng)的端到端性能,因此AI系統(tǒng)通常比較復雜。

wKgZPGhTzFKAdWTCAAHjLwUKPi4936.png

這一設計的性能提升要點在于:

1.業(yè)界領先的I/O通道和內(nèi)存能力

AP平臺的雙路至強6最多可以提供192條PCIe 5.0通道,也就是可以每路提供96條通道,相比上一代提升20%,內(nèi)存通道也可以高達12個。直接匹配多GPU的高速接入需求,避免因通道不足導致的帶寬瓶頸。

在SP平臺上,英特爾還提供了一個差異化的產(chǎn)品,就是在單個CPU插槽上提供了更豐富的I/O資源(Rich I/O one socket),總共有136根的PCIe通道,持單插槽連接多塊加速卡與存儲設備,適用于邊緣端“預處理+推理”一體化場景。同時,其高帶寬內(nèi)存可容納更大模型參數(shù),提升訓練效率。在推理場景中,靈活的核心配置確保資源高效利用,滿足多樣化需求。

2.核心性能優(yōu)化

至強6區(qū)別于上一代產(chǎn)品的關鍵技術(shù)突破是Priority Core Turbo(PCT),其技術(shù)本質(zhì)是通過 Speed Select(SST)將單路CPU核心劃分為兩組:最多8個高頻核心(PCT 核心)與剩余低頻核心。在DGX B300場景中,這一技術(shù)直接服務于 “CPU 驅(qū)動 GPU” 的典型需求,實現(xiàn)高頻核心的精準調(diào)度:當 GPU 需要快速獲取預處理數(shù)據(jù)(如從內(nèi)存讀取原始數(shù)據(jù)并完成清洗、特征工程)時,8個PCT核心可睿頻至4.6GHz(傳統(tǒng)64核SKU最大睿頻為3.9GHz),相比全核睿頻(3.6GHz)提升28%。這一特性縮短了數(shù)據(jù)從CPU到GPU的傳輸延遲。

3.資源分配的靈活性

PCT核心數(shù)量可通過BIOS或 SST-TF工具動態(tài)配置,客戶可根據(jù)實際負載調(diào)整——客戶在使用時可以根據(jù)需要選擇8個、6個、4個或2個PCT核心。例如推理場景中若僅需4塊GPU工作,可配置4個PCT 核心對應驅(qū)動,避免資源浪費。與上一代 Max Turbo 技術(shù)的差異在于:PCT允許全核在線(無需半數(shù)核心休眠),且維持相同 TDP(350W)與散熱設計,確保硬件兼容性,降低客戶部署成本。

4.更強的內(nèi)存架構(gòu)兼容性

更高的內(nèi)存帶寬對于AI工作負載至關重要,因為AI的工作流程是一個完整的數(shù)據(jù)處理管道,而非單一環(huán)節(jié)。在這一過程中,CPU首先負責預處理,從內(nèi)存中讀取數(shù)據(jù)并進行初步處理,隨后將數(shù)據(jù)傳輸至GPU。比如,至強6支持8通道到12通道的DDR5-6400內(nèi)存,還支持MRDIMMs,能提供更高的30%帶寬。

在LLM的生成式推理(如文本續(xù)寫)中,自注意力機制需為每個已處理的Token生成并存儲鍵(Key)和值(Value)矩陣,即KV Cache。KV Cache避免了在解碼階段重復計算歷史Token的注意力狀態(tài),但會隨序列長度線性增長,占用大量GPU顯存,需要卸載到下一級存儲中。對于CXL內(nèi)存來說,有一個典型用例是KV Cache的卸載,通過用CXL內(nèi)存去替代SSD,這樣KV Cache的訪問速度顯著增快,從而提升了性能。

5.RAS和數(shù)據(jù)預處理

在企業(yè)級 AI 訓練場景中,系統(tǒng)可靠性直接影響算力利用率與TCO。至強6的RAS 體系覆蓋全硬件鏈路,可以通過RAS特性來可以提高I/O的穩(wěn)定性、內(nèi)存系統(tǒng)穩(wěn)定性、UPI鏈路穩(wěn)定性、CPU及平臺穩(wěn)定性。CPU卸載則是針對MoE(混合專家)模型的另一種優(yōu)化方式。目前市場上已有諸多關于通過AMX矩陣技術(shù)將部分MoE模型中的專家層卸載至至強處理器的案例。

wKgZO2hTzFOALNAwAAFdw-RiKn0376.png

二、為何是至強6776P?

NVIDIA DGX B300選擇的雙路至強 6776P 的核心價值在于業(yè)界領先的I/O能力、領先的內(nèi)存帶寬、大內(nèi)存容量、領先的RAS能力已經(jīng)為特定AI負載優(yōu)化的PCT產(chǎn)品。

其4.6GHz的睿頻能力顯著加速數(shù)據(jù)處理,PCT核心以4.6GHz頻率加速數(shù)據(jù)預處理(如文本分詞、圖像解碼),通過高速 PCIe 通道將數(shù)據(jù)傳輸至GPU,形成 “CPU 預處理→GPU 計算”的流水線作業(yè)。這款處理器擁有單路88條PCIe通道,雙路則達到176條。

英偉達選擇了2 DPC架構(gòu)(每顆CPU提供8通道內(nèi)存,每通道2個DIMM)進行配置,雙路系統(tǒng)可搭載32根DIMM,內(nèi)存最大容量達8TB。

綜述:開放生態(tài)的實際意義

至強6的核心優(yōu)勢在于開放性與兼容性??蛻粲布x擇自由,可以根據(jù)成本動態(tài)切換,避免被單一供應商鎖定。在軟件生態(tài)兼容層面,至強6也完全支持主流 AI 框架(如 TensorFlow、PyTorch)與云原生技術(shù),無需重新開發(fā)適配層,降低技術(shù)遷移成本。

從英偉達的選擇邏輯看,DGX B300 采用至強6應該并非單一性能導向,而是綜合考量了生態(tài)開放性、成本可控性與技術(shù)成熟度 —— 至強 6 作為量產(chǎn)級產(chǎn)品,其穩(wěn)定性與供應鏈可靠性已通過大規(guī)模數(shù)據(jù)中心驗證。

至強6在搭配NVIDIA GPU場景中的價值,本質(zhì)上源于其對“CPU 角色”的清晰定位:核心數(shù)量或睿頻頻率,都是圍繞 GPU 協(xié)同需求而定,根據(jù)用戶的不同需求,也可以選擇不同的CPU型號。在關鍵路徑(如高頻數(shù)據(jù)傳輸、大內(nèi)存容量、系統(tǒng)穩(wěn)定性)上,至強6可以實現(xiàn)精準優(yōu)化。對于企業(yè)客戶而言,這意味著在 AI 基礎設施建設中,可通過標準化硬件獲取可預期的性能提升,同時避免為冗余功能支付額外成本。這種 “需求導向型” 技術(shù)路線,或許正是其成為英偉達首選主控 CPU 的核心原因。
(來源:微型計算機)

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10319

    瀏覽量

    181064
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11326

    瀏覽量

    225861
  • AI
    AI
    +關注

    關注

    91

    文章

    41027

    瀏覽量

    302553
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    超越臺積電?英特爾首個18A工藝芯片邁向大規(guī)模量產(chǎn)

    Lake作為英特爾首款基于Intel 18A制程工藝打造的產(chǎn)品,意義非凡。這一制程是英特爾研發(fā)并制造的最先進半導體工藝,標志著英特爾在技術(shù)領域邁出了關鍵一步。 ? 英特爾還預覽了
    的頭像 發(fā)表于 10-11 08:14 ?9380次閱讀
    超越臺積電?<b class='flag-5'>英特爾</b>首個18A工藝芯片邁向大規(guī)模量產(chǎn)

    英特爾至強6“芯”動GTC 2026,為英偉達DCG Rubin解鎖系統(tǒng)級性能

    在英偉達GTC 2026大會上,英特爾正式宣布,英特爾至強 6處理器將作為主控
    的頭像 發(fā)表于 03-19 16:43 ?367次閱讀

    性能再越級!英特爾推出全新酷睿Ultra 200HX Plus系列移動處理器

    英特爾酷睿Ultra 200HX Plus系列登場,全新酷睿 Ultra 9 290HX Plus和酷睿Ultra 7 270HX Plus處理器,為極致性能需求注入更強動力。 今日,英特爾發(fā)布全新
    的頭像 發(fā)表于 03-19 16:43 ?317次閱讀

    輕薄、AI、數(shù)日續(xù)航、性能強勁,第三代英特爾酷睿Ultra新品重磅上市

    今日,英特爾在上海舉辦了第三代英特爾酷睿Ultra處理器新品分享會。作為全球首款基于Intel 18A工藝打造的計算平臺,第三代英特爾酷睿
    的頭像 發(fā)表于 03-19 13:12 ?249次閱讀

    探索DeepSeek多樣化技術(shù)路徑,英特爾架構(gòu)師用至強CPU嘗鮮

    近期大模型領域里最火的熱詞,或者說技術(shù)創(chuàng)新點,非Engram (DeepSeek最新論文里設計的Engram機制) 莫屬。今天我們想分享的,是英特爾圍繞Engram開展的早期探索——用至強? 處理器
    的頭像 發(fā)表于 02-05 11:13 ?533次閱讀
    探索DeepSeek多樣化技術(shù)路徑,<b class='flag-5'>英特爾</b>架構(gòu)師用<b class='flag-5'>至強</b><b class='flag-5'>CPU</b>嘗鮮

    18A工藝首發(fā)!英特爾推出下一代PC處理器,77%游戲性能暴漲+180TOPS算力

    1月6日,在CES 2026上,英特爾發(fā)布了代號為Panther Lake 的全新 Core Ultra 3 系列處理器上市產(chǎn)品陣容。該系列處理器基于18A 制程節(jié)點打造的
    的頭像 發(fā)表于 01-07 07:56 ?2w次閱讀
    18A工藝首發(fā)!<b class='flag-5'>英特爾</b>推出下一代PC<b class='flag-5'>處理器</b>,77%游戲性能暴漲+180TOPS算力

    從云到端:英特爾展示全棧AI能力,覆蓋云、邊、PC多場景

    2025年9月25日,杭州——今日,在2025云棲大會上,英特爾與阿里云帶來了多項云基礎設施創(chuàng)新成果,包括兼容多代際服務(支持第五代英特爾??至強??可擴展
    的頭像 發(fā)表于 09-26 17:27 ?1736次閱讀
    從云到端:<b class='flag-5'>英特爾</b>展示全棧<b class='flag-5'>AI</b>能力,覆蓋云、邊、PC多場景

    英特爾288核新至強處理器揭秘:Intel 18A制程,3D堆疊與鍵合,EMIB封裝……

    ? 近日,在Hot Chips 2025大會舉行期間,英特爾新一代至強處理器?Clearwater Forest首次亮相,這是英特爾基于Intel 18A制程打造的首款服務
    的頭像 發(fā)表于 08-29 15:59 ?1963次閱讀

    英特爾至強6助力阿里云第九代企業(yè)級ECS實例100天贏得超萬家客戶青睞

    近日,搭載英特爾? 至強? 6性能核處理器的阿里云第九代企業(yè)級ECS實例g9i正式迎來商業(yè)化100天里程碑,并獲得超過10,000家客戶的信賴與選擇。通過全場景的卓越性能提升,
    的頭像 發(fā)表于 07-29 15:44 ?693次閱讀

    主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉(zhuǎn)

    有什么特殊之處呢? AI加速系統(tǒng)為何看重CPU主控能力? 作為造價極高的AI加速系統(tǒng),DGX B
    的頭像 發(fā)表于 06-27 11:44 ?1017次閱讀
    <b class='flag-5'>主控</b><b class='flag-5'>CPU</b>全能選手,<b class='flag-5'>英特爾</b><b class='flag-5'>至強</b><b class='flag-5'>6</b>助力<b class='flag-5'>AI</b><b class='flag-5'>系統(tǒng)</b>高效運轉(zhuǎn)

    英特爾發(fā)布邊緣AI控制與邊緣智算一體機,創(chuàng)造“AI新視界”

    處理器的邊緣 AI 控制 和 基于英特爾銳炫 ? 顯卡的邊緣智算一體機 ,為工業(yè)AI的規(guī)?;涞刈⑷霃妱艅恿Α?
    發(fā)表于 06-24 17:50 ?1566次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布邊緣<b class='flag-5'>AI</b>控制<b class='flag-5'>器</b>與邊緣智算一體機,創(chuàng)造“<b class='flag-5'>AI</b>新視界”

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    CTO、高級首席AI工程師張宇博士 英特爾客戶端計算事業(yè)部邊緣計算CTO、高級首席AI工程師張宇博士在MWC AI終端峰會上指出,邊緣將崛起為AI
    的頭像 發(fā)表于 06-20 17:32 ?1039次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    電子發(fā)燒友原創(chuàng)? 章鷹 5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速產(chǎn)品系列。包括全新英特爾
    的頭像 發(fā)表于 05-21 00:57 ?7733次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速產(chǎn)品系列。包括全新英特爾銳炫? Pro B系
    的頭像 發(fā)表于 05-20 12:27 ?5639次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    Computex 2025上,英特爾發(fā)布了為專業(yè)人士和開發(fā)者設計的全新圖形處理器(GPU)和AI加速產(chǎn)品系列。包括: 全新英特爾銳炫 ?
    發(fā)表于 05-20 11:03 ?1912次閱讀