chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

術(shù)業(yè)有專攻——AI系統(tǒng)主控CPU英特爾至強(qiáng)6新品處理器淺析

科技見聞網(wǎng) ? 來源:科技見聞網(wǎng) ? 作者:科技見聞網(wǎng) ? 2025-06-19 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、至強(qiáng)6與NVIDIA GPU協(xié)同的硬件基礎(chǔ)

wKgZO2hTzFKASm6xAAJa9Y5Fzc8048.png

AI 異構(gòu)計(jì)算架構(gòu)中,英特爾至強(qiáng)6處理器作為主控CPU可以與NVIDIA最新GPU 很好地協(xié)同。根據(jù)英偉達(dá)官網(wǎng)信息,目前其DGX B300系統(tǒng)選擇至強(qiáng)6776P作為唯一主控CPU,采用雙路配置,通過UPI總線實(shí)現(xiàn)CPU間互連。這8個(gè)GPU通過NVLink高速互連,是性能比較高端的DGX,為訓(xùn)練等應(yīng)用而設(shè)計(jì)。

作為主控CPU,它和GPU協(xié)同工作,而這個(gè)系統(tǒng)的性能受到諸多因素的影響,這里列出的是最主要的因素,包括I/O、核心性能、內(nèi)存(包括帶寬和容量)、CPU上的預(yù)處理或卸載(offload)能力、整體CPU系統(tǒng)的RAS,以及各種硬件的外形設(shè)計(jì)等。這些都會(huì)影響整個(gè)AI系統(tǒng)的端到端性能,因此AI系統(tǒng)通常比較復(fù)雜。

wKgZPGhTzFKAdWTCAAHjLwUKPi4936.png

這一設(shè)計(jì)的性能提升要點(diǎn)在于:

1.業(yè)界領(lǐng)先的I/O通道和內(nèi)存能力

AP平臺(tái)的雙路至強(qiáng)6最多可以提供192條PCIe 5.0通道,也就是可以每路提供96條通道,相比上一代提升20%,內(nèi)存通道也可以高達(dá)12個(gè)。直接匹配多GPU的高速接入需求,避免因通道不足導(dǎo)致的帶寬瓶頸。

在SP平臺(tái)上,英特爾還提供了一個(gè)差異化的產(chǎn)品,就是在單個(gè)CPU插槽上提供了更豐富的I/O資源(Rich I/O one socket),總共有136根的PCIe通道,持單插槽連接多塊加速卡與存儲(chǔ)設(shè)備,適用于邊緣端“預(yù)處理+推理”一體化場(chǎng)景。同時(shí),其高帶寬內(nèi)存可容納更大模型參數(shù),提升訓(xùn)練效率。在推理場(chǎng)景中,靈活的核心配置確保資源高效利用,滿足多樣化需求。

2.核心性能優(yōu)化

至強(qiáng)6區(qū)別于上一代產(chǎn)品的關(guān)鍵技術(shù)突破是Priority Core Turbo(PCT),其技術(shù)本質(zhì)是通過 Speed Select(SST)將單路CPU核心劃分為兩組:最多8個(gè)高頻核心(PCT 核心)與剩余低頻核心。在DGX B300場(chǎng)景中,這一技術(shù)直接服務(wù)于 “CPU 驅(qū)動(dòng) GPU” 的典型需求,實(shí)現(xiàn)高頻核心的精準(zhǔn)調(diào)度:當(dāng) GPU 需要快速獲取預(yù)處理數(shù)據(jù)(如從內(nèi)存讀取原始數(shù)據(jù)并完成清洗、特征工程)時(shí),8個(gè)PCT核心可睿頻至4.6GHz(傳統(tǒng)64核SKU最大睿頻為3.9GHz),相比全核睿頻(3.6GHz)提升28%。這一特性縮短了數(shù)據(jù)從CPU到GPU的傳輸延遲。

3.資源分配的靈活性

PCT核心數(shù)量可通過BIOS或 SST-TF工具動(dòng)態(tài)配置,客戶可根據(jù)實(shí)際負(fù)載調(diào)整——客戶在使用時(shí)可以根據(jù)需要選擇8個(gè)、6個(gè)、4個(gè)或2個(gè)PCT核心。例如推理場(chǎng)景中若僅需4塊GPU工作,可配置4個(gè)PCT 核心對(duì)應(yīng)驅(qū)動(dòng),避免資源浪費(fèi)。與上一代 Max Turbo 技術(shù)的差異在于:PCT允許全核在線(無需半數(shù)核心休眠),且維持相同 TDP(350W)與散熱設(shè)計(jì),確保硬件兼容性,降低客戶部署成本。

4.更強(qiáng)的內(nèi)存架構(gòu)兼容性

更高的內(nèi)存帶寬對(duì)于AI工作負(fù)載至關(guān)重要,因?yàn)锳I的工作流程是一個(gè)完整的數(shù)據(jù)處理管道,而非單一環(huán)節(jié)。在這一過程中,CPU首先負(fù)責(zé)預(yù)處理,從內(nèi)存中讀取數(shù)據(jù)并進(jìn)行初步處理,隨后將數(shù)據(jù)傳輸至GPU。比如,至強(qiáng)6支持8通道到12通道的DDR5-6400內(nèi)存,還支持MRDIMMs,能提供更高的30%帶寬。

在LLM的生成式推理(如文本續(xù)寫)中,自注意力機(jī)制需為每個(gè)已處理的Token生成并存儲(chǔ)鍵(Key)和值(Value)矩陣,即KV Cache。KV Cache避免了在解碼階段重復(fù)計(jì)算歷史Token的注意力狀態(tài),但會(huì)隨序列長(zhǎng)度線性增長(zhǎng),占用大量GPU顯存,需要卸載到下一級(jí)存儲(chǔ)中。對(duì)于CXL內(nèi)存來說,有一個(gè)典型用例是KV Cache的卸載,通過用CXL內(nèi)存去替代SSD,這樣KV Cache的訪問速度顯著增快,從而提升了性能。

5.RAS和數(shù)據(jù)預(yù)處理

在企業(yè)級(jí) AI 訓(xùn)練場(chǎng)景中,系統(tǒng)可靠性直接影響算力利用率與TCO。至強(qiáng)6的RAS 體系覆蓋全硬件鏈路,可以通過RAS特性來可以提高I/O的穩(wěn)定性、內(nèi)存系統(tǒng)穩(wěn)定性、UPI鏈路穩(wěn)定性、CPU及平臺(tái)穩(wěn)定性。CPU卸載則是針對(duì)MoE(混合專家)模型的另一種優(yōu)化方式。目前市場(chǎng)上已有諸多關(guān)于通過AMX矩陣技術(shù)將部分MoE模型中的專家層卸載至至強(qiáng)處理器的案例。

wKgZO2hTzFOALNAwAAFdw-RiKn0376.png

二、為何是至強(qiáng)6776P?

NVIDIA DGX B300選擇的雙路至強(qiáng) 6776P 的核心價(jià)值在于業(yè)界領(lǐng)先的I/O能力、領(lǐng)先的內(nèi)存帶寬、大內(nèi)存容量、領(lǐng)先的RAS能力已經(jīng)為特定AI負(fù)載優(yōu)化的PCT產(chǎn)品。

其4.6GHz的睿頻能力顯著加速數(shù)據(jù)處理,PCT核心以4.6GHz頻率加速數(shù)據(jù)預(yù)處理(如文本分詞、圖像解碼),通過高速 PCIe 通道將數(shù)據(jù)傳輸至GPU,形成 “CPU 預(yù)處理→GPU 計(jì)算”的流水線作業(yè)。這款處理器擁有單路88條PCIe通道,雙路則達(dá)到176條。

英偉達(dá)選擇了2 DPC架構(gòu)(每顆CPU提供8通道內(nèi)存,每通道2個(gè)DIMM)進(jìn)行配置,雙路系統(tǒng)可搭載32根DIMM,內(nèi)存最大容量達(dá)8TB。

綜述:開放生態(tài)的實(shí)際意義

至強(qiáng)6的核心優(yōu)勢(shì)在于開放性與兼容性??蛻粲布x擇自由,可以根據(jù)成本動(dòng)態(tài)切換,避免被單一供應(yīng)商鎖定。在軟件生態(tài)兼容層面,至強(qiáng)6也完全支持主流 AI 框架(如 TensorFlow、PyTorch)與云原生技術(shù),無需重新開發(fā)適配層,降低技術(shù)遷移成本。

從英偉達(dá)的選擇邏輯看,DGX B300 采用至強(qiáng)6應(yīng)該并非單一性能導(dǎo)向,而是綜合考量了生態(tài)開放性、成本可控性與技術(shù)成熟度 —— 至強(qiáng) 6 作為量產(chǎn)級(jí)產(chǎn)品,其穩(wěn)定性與供應(yīng)鏈可靠性已通過大規(guī)模數(shù)據(jù)中心驗(yàn)證。

至強(qiáng)6在搭配NVIDIA GPU場(chǎng)景中的價(jià)值,本質(zhì)上源于其對(duì)“CPU 角色”的清晰定位:核心數(shù)量或睿頻頻率,都是圍繞 GPU 協(xié)同需求而定,根據(jù)用戶的不同需求,也可以選擇不同的CPU型號(hào)。在關(guān)鍵路徑(如高頻數(shù)據(jù)傳輸、大內(nèi)存容量、系統(tǒng)穩(wěn)定性)上,至強(qiáng)6可以實(shí)現(xiàn)精準(zhǔn)優(yōu)化。對(duì)于企業(yè)客戶而言,這意味著在 AI 基礎(chǔ)設(shè)施建設(shè)中,可通過標(biāo)準(zhǔn)化硬件獲取可預(yù)期的性能提升,同時(shí)避免為冗余功能支付額外成本。這種 “需求導(dǎo)向型” 技術(shù)路線,或許正是其成為英偉達(dá)首選主控 CPU 的核心原因。
(來源:微型計(jì)算機(jī))

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10243

    瀏覽量

    178010
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11186

    瀏覽量

    221148
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    36955

    瀏覽量

    289733
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    有什么特殊之處呢? AI加速系統(tǒng)為何看重CPU主控能力? 作為造價(jià)極高的AI加速系統(tǒng),DGX B
    的頭像 發(fā)表于 06-27 11:44 ?417次閱讀
    <b class='flag-5'>主控</b><b class='flag-5'>CPU</b>全能選手,<b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b><b class='flag-5'>6</b>助力<b class='flag-5'>AI</b><b class='flag-5'>系統(tǒng)</b>高效運(yùn)轉(zhuǎn)

    1.9倍性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測(cè)試中表現(xiàn)卓越

    關(guān)鍵項(xiàng)目中,性能表現(xiàn)卓越。測(cè)試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器AI性能實(shí)現(xiàn)了高達(dá)1.9倍的顯著提升,這也充分顯示了至強(qiáng)6處理器作為現(xiàn)代
    的頭像 發(fā)表于 04-07 10:58 ?404次閱讀

    微星攜英特爾為玩家打造非凡游戲體驗(yàn),兩款泰坦家族新品均搭載全新英特爾酷睿Ultra HX處理器

    3月29日,在英特爾酷睿Ultra 200HX新品分享會(huì)上,搭載該處理器的高性能筆記本齊聚一堂,英特爾攜手生態(tài)合作伙伴致力于以創(chuàng)新技術(shù)滿足用戶的多樣需求,并加速
    的頭像 發(fā)表于 04-02 09:37 ?701次閱讀

    英特爾至強(qiáng)6處理器助力數(shù)據(jù)中心整合升級(jí)

    繼去年9月重磅推出英特爾 至強(qiáng) 6900性能核處理器后,英特爾進(jìn)一步擴(kuò)充至強(qiáng)6產(chǎn)品家族,于近期發(fā)
    的頭像 發(fā)表于 03-13 17:36 ?1086次閱讀

    英特爾至強(qiáng)6:如何煉就數(shù)據(jù)中心“全能型選手”

    面對(duì)數(shù)據(jù)中心領(lǐng)域日益激烈的競(jìng)爭(zhēng),英特爾緊抓核心產(chǎn)品,繼去年推出128核的至強(qiáng)6900P之后,近期又添“新兵”——至強(qiáng)6700P和至強(qiáng)6500P,進(jìn)一步豐富了
    的頭像 發(fā)表于 03-13 14:57 ?460次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b><b class='flag-5'>6</b>:如何煉就數(shù)據(jù)中心“全能型選手”

    英特爾至強(qiáng)6再推新品!打造最強(qiáng)AI“機(jī)頭引擎”

    的產(chǎn)品矩陣,很好地滿足市場(chǎng)的多樣化需求;另一方面,憑借卓越的 AI 性能提升,英特爾為數(shù)據(jù)中心提供了性能強(qiáng)勁的機(jī)頭節(jié)點(diǎn) CPU,助力企業(yè)在數(shù)字時(shí)代的浪潮中穩(wěn)步前行。 事實(shí)上,去年9月,英特爾
    的頭像 發(fā)表于 03-13 14:57 ?479次閱讀

    英特爾展示基于至強(qiáng)6處理器的基礎(chǔ)網(wǎng)絡(luò)設(shè)施

    ; 與5G核心網(wǎng)解決方案合作伙伴的深度合作,加快了英特爾至強(qiáng)6能效核處理器在整個(gè)生態(tài)系統(tǒng)中的應(yīng)用; 基于5G核心網(wǎng)工作負(fù)載的獨(dú)立驗(yàn)證確認(rèn)了
    的頭像 發(fā)表于 03-08 09:24 ?682次閱讀

    MWC 2025:英特爾展示基于至強(qiáng)6處理器的基礎(chǔ)網(wǎng)絡(luò)設(shè)施

    3.2倍3; 與5G核心網(wǎng)解決方案合作伙伴的深度合作,加快了英特爾?至強(qiáng)?6能效核處理器在整個(gè)生態(tài)系統(tǒng)中的應(yīng)用; 基于5G核心網(wǎng)工作負(fù)載的獨(dú)
    發(fā)表于 03-03 15:52 ?622次閱讀
    MWC 2025:<b class='flag-5'>英特爾</b>展示基于<b class='flag-5'>至強(qiáng)</b><b class='flag-5'>6</b><b class='flag-5'>處理器</b>的基礎(chǔ)網(wǎng)絡(luò)設(shè)施

    英特爾推出全新至強(qiáng)6性能核處理器

    至強(qiáng)6性能核處理器,為廣泛的數(shù)據(jù)中心和網(wǎng)絡(luò)基礎(chǔ)設(shè)施工作負(fù)載提供卓越性能,并以出色的能效,為數(shù)據(jù)中心的整合升級(jí)創(chuàng)造新機(jī)會(huì)。
    的頭像 發(fā)表于 03-03 10:57 ?795次閱讀

    英特爾Michelle Johnston Holthaus:深耕x86,持續(xù)為AI數(shù)據(jù)中心注入芯動(dòng)力

    Johnston Holthaus在近期的英特爾至強(qiáng)6家族新品發(fā)布上表示。 在數(shù)據(jù)中心領(lǐng)域競(jìng)爭(zhēng)白熱化的當(dāng)下,英特爾在MWC前夕一口氣發(fā)布多
    的頭像 發(fā)表于 02-28 15:29 ?487次閱讀
    <b class='flag-5'>英特爾</b>Michelle Johnston Holthaus:深耕x86,持續(xù)為<b class='flag-5'>AI</b>數(shù)據(jù)中心注入芯動(dòng)力

    全新英特爾至強(qiáng)6處理器來襲,現(xiàn)代數(shù)據(jù)中心的性能與能效平衡“大師”

    英特爾進(jìn)一步豐富至強(qiáng)6處理器產(chǎn)品組合,為行業(yè)提供多款滿足廣泛工作負(fù)載的CPU選擇。 新聞亮點(diǎn) ·?英特爾
    的頭像 發(fā)表于 02-25 17:39 ?549次閱讀

    HPE攜手英特爾至強(qiáng)6,打造新一代服務(wù)性能巔峰

    近日,慧與科技(HPE)推出了八款全新HPE ProLiant Compute Gen12服務(wù),標(biāo)志著新一代企業(yè)級(jí)服務(wù)領(lǐng)域的新標(biāo)桿正式誕生。這一系列服務(wù)全面搭載了英特爾
    的頭像 發(fā)表于 02-18 10:38 ?589次閱讀

    英特爾至強(qiáng)6助力HPE,打造性能與能效新“巔峰”

    系搭載英特爾至強(qiáng)6處理器,能夠輕松應(yīng)對(duì)日益增長(zhǎng)的數(shù)據(jù)密集型工作負(fù)載挑戰(zhàn),特別滿足數(shù)據(jù)中心和邊緣環(huán)境設(shè)計(jì)的需求。此外,該系列服務(wù)還引入了創(chuàng)新
    發(fā)表于 02-14 10:40 ?250次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>至強(qiáng)</b><b class='flag-5'>6</b>助力HPE,打造性能與能效新“巔峰”

    英特爾帶您解鎖云上智算新引擎

    在近日舉辦的2024火山引擎FORCE原動(dòng)力大會(huì)上,英特爾與火山引擎聯(lián)合發(fā)布基于英特爾 至強(qiáng) 6 性能核處理器的第四代服務(wù)
    的頭像 發(fā)表于 12-23 14:05 ?1126次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理器英特爾Gaudi 2D
    的頭像 發(fā)表于 12-03 11:20 ?767次閱讀