chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HPC處理器的多核架構(gòu)挑戰(zhàn)

王燕 ? 來源:十個(gè)名字V ? 作者:十個(gè)名字V ? 2022-07-14 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著半導(dǎo)體設(shè)計(jì)團(tuán)隊(duì)競(jìng)相利用“超越摩爾”,新的架構(gòu)選擇和挑戰(zhàn)層出不窮。以超大規(guī)模硬件為例,其中一系列工作負(fù)載——數(shù)據(jù)庫分析、人工智能、微服務(wù)、視頻編碼和高復(fù)雜性計(jì)算算法——需要一系列處理器解決方案。性能、功耗和成本仍然至關(guān)重要,但現(xiàn)在架構(gòu)師自己交付。沒有一種“最好”的架構(gòu);處理器必須設(shè)計(jì)為最好地服務(wù)于特定類別的工作負(fù)載和價(jià)格/性能配置文件。

多核架構(gòu)挑戰(zhàn)

AWS Graviton2 有 64 個(gè) Arm Neoverse N1 內(nèi)核,它們平鋪在單個(gè)芯片上的連貫網(wǎng)狀網(wǎng)絡(luò)中。其他設(shè)計(jì)已經(jīng)擴(kuò)展到多芯片,芯片之間具有緩存一致的連接。多芯片實(shí)現(xiàn)為進(jìn)一步增長和降低不太先進(jìn)工藝成本的潛力開辟了空間。雖然這些新架構(gòu)選項(xiàng)擴(kuò)展了可能性,但它們也帶來了新的設(shè)計(jì)挑戰(zhàn)。在眾多選擇中,哪些架構(gòu)真正能夠以合適的價(jià)格為合適的工作負(fù)載提供更高的吞吐量?

這里的一個(gè)問題是,應(yīng)如何針對(duì)目標(biāo)類應(yīng)用程序的物理內(nèi)存對(duì)相干網(wǎng)狀網(wǎng)絡(luò)中的分布式系統(tǒng)緩存進(jìn)行分區(qū)。優(yōu)化這些選擇,甚至優(yōu)化哪些 CPU 內(nèi)核最能滿足需求,都需要以周期級(jí)精度運(yùn)行實(shí)際工作負(fù)載。高級(jí)模型根本不足以達(dá)到此目的。

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

圖:多芯片實(shí)現(xiàn)中不同的 I/O 延遲。(來源:Cadence

連貫網(wǎng)格中的處理器陣列之間的通信延遲在單個(gè)裸片內(nèi)將相對(duì)一致,但在多裸片實(shí)現(xiàn)中裸片之間的延遲可能會(huì)有很大差異(見圖)。因此,設(shè)計(jì)發(fā)展出多種架構(gòu),可在未來使用——全連接網(wǎng)格、集線器和輻條內(nèi)存系統(tǒng)或其他 2D 和 3D 結(jié)構(gòu),其中一個(gè)小芯片提供大系統(tǒng)緩存和主內(nèi)存訪問。此外,堆棧中的其他小芯片相互通信,并通過集線器與主存儲(chǔ)器通信。

有效探索所有這些選項(xiàng)在很大程度上取決于針對(duì)實(shí)際工作負(fù)載準(zhǔn)確建模性能。建模和分析只能在 RTL 域中使用仿真和原型進(jìn)行探索。

SystemReady 合規(guī)性

服務(wù)器架構(gòu)師面臨的另一種問題是操作系統(tǒng)兼容性。您可以直接在大多數(shù)筆記本電腦上啟動(dòng)任何 Linux 發(fā)行版、虛擬機(jī)管理程序或 Windows。要在基于 Arm 的服務(wù)器上啟動(dòng),此責(zé)任由服務(wù)器制造商和 Arm 分擔(dān)。

Arm 開發(fā)了一個(gè)名為 SystemReady 的合規(guī)套件,以標(biāo)準(zhǔn)化一組最低要求,以解決這個(gè)問題和其他合規(guī)問題。PCIe 合規(guī)性是一個(gè)特別重要的組件,因?yàn)樗苯訛樵S多服務(wù)器接口協(xié)議提供或作為主要 I/O 的基礎(chǔ),以實(shí)現(xiàn)快速存儲(chǔ)、快速網(wǎng)絡(luò)和芯片外連貫接口。這里特別重要的是通過 PCIe 進(jìn)行遠(yuǎn)程服務(wù)器引導(dǎo)。Arm 將此合規(guī)套件作為在 UEFI (BIOS) 層上運(yùn)行的軟件提供。Cadence 與 Arm 合作了幾年,旨在將測(cè)試縮減為具有 PCIe 流量生成庫的最小裸機(jī)測(cè)試套件,該庫的仿真速度比 UEFI 測(cè)試套件更快,可以快速調(diào)整硬件調(diào)試。

服務(wù)器開發(fā)人員面臨的另一個(gè)挑戰(zhàn)是 PCIe 使用強(qiáng)排序的內(nèi)存模型。Arm 支持標(biāo)準(zhǔn)允許的松散排序的內(nèi)存模型。但只有強(qiáng)排序才能保證沒有死鎖。在松散訂購下,硬件/固件開發(fā)人員必須提供該保證。不幸的是,這無法通過合規(guī)性檢查。集成商必須再次在仿真器或原型系統(tǒng)上通過廣泛的用例測(cè)試證明設(shè)計(jì)是死鎖安全的。

使用 Cadence System 驗(yàn)證 IP 的方法使工程師能夠在半天內(nèi)啟動(dòng)并運(yùn)行系統(tǒng)級(jí)測(cè)試套件,該套件可以根據(jù) SystemReady 要求驗(yàn)證 PCIe 集成。此方法還可用于演示從連接到 PCIe 的閃存設(shè)備模型引導(dǎo) SUSE Linux 和 Windows,這引起了高級(jí)服務(wù)器社區(qū)的極大興趣。

不僅適用于服務(wù)器

Arm Neoverse 平臺(tái)不僅是為高端服務(wù)器設(shè)計(jì)的。該家族已經(jīng)開始進(jìn)入其他云應(yīng)用程序和通信基礎(chǔ)設(shè)施,一直到邊緣。在其中一些應(yīng)用程序中,多核架構(gòu)已經(jīng)很重要。在大多數(shù)此類應(yīng)用程序(例如汽車)中,對(duì)一系列開放和商業(yè)操作系統(tǒng)的開箱即用支持是必不可少的。

我相信用于自動(dòng)生成系統(tǒng)級(jí)內(nèi)容和驗(yàn)證系統(tǒng)級(jí)目標(biāo)合規(guī)性的工具將在許多市場(chǎng)中具有廣泛的適用性。EDA 行業(yè)需要超越傳統(tǒng)的單接口單協(xié)議驗(yàn)證 IP (VIP) 范圍,走向多接口多協(xié)議系統(tǒng)級(jí) VIP 的新時(shí)代。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20210

    瀏覽量

    249831
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9536

    瀏覽量

    390325
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    14

    文章

    10179

    瀏覽量

    91241
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    343

    瀏覽量

    24890
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【老法師】多核異構(gòu)處理器中M核程序的啟動(dòng)、編寫和仿真

    有很多研究單片機(jī)的小伙伴在面對(duì)多核異構(gòu)處理器時(shí),可能會(huì)對(duì)多核的啟動(dòng)流程感到困惑——因?yàn)椴皇煜CC編程和GDB調(diào)試,所以也無法確定多核異構(gòu)處理器
    的頭像 發(fā)表于 08-13 09:05 ?3862次閱讀
    【老法師】<b class='flag-5'>多核</b>異構(gòu)<b class='flag-5'>處理器</b>中M核程序的啟動(dòng)、編寫和仿真

    T113-i芯片技術(shù)解析:高性能嵌入式處理器的創(chuàng)新設(shè)計(jì)

    ?芯片概述 明遠(yuǎn)智睿的T113-i芯片是一款由全志科技推出的高性能、低功耗嵌入式處理器,主要面向智能家居、工業(yè)控制、消費(fèi)電子等領(lǐng)域。該芯片基于ARM架構(gòu),集成了多核CPU、GPU和豐富的接口資源,在
    的頭像 發(fā)表于 07-17 14:15 ?1087次閱讀

    龍芯處理器支持WINDOWS嗎?

    龍芯處理器目前不支持原生運(yùn)行Windows操作系統(tǒng),主要原因如下: 架構(gòu)差異 龍芯架構(gòu):龍芯早期基于MIPS架構(gòu),后續(xù)轉(zhuǎn)向自主研發(fā)的LoongArch指令集(與x86/ARM不兼容
    發(fā)表于 06-05 14:24

    HPM5E31IGN單核 32 位 RISC-V 處理器

    問題。其單核設(shè)計(jì)在保證性能的同時(shí)實(shí)現(xiàn)了優(yōu)異的能效比,主頻可達(dá)248MHz,遠(yuǎn)超同類ARM架構(gòu)處理器。這種高性能特性使其能夠輕松應(yīng)對(duì)實(shí)時(shí)數(shù)據(jù)處理、復(fù)雜算法運(yùn)算等挑戰(zhàn)性任務(wù)。核心特性
    發(fā)表于 05-29 09:23

    技術(shù)分享 | 如何在2k0300(LoongArch架構(gòu)處理器上跑通qt開發(fā)流程

    技術(shù)分享 | 如何在2k0300開發(fā)板(LoongArch架構(gòu)處理器上跑通qt開發(fā)流程
    的頭像 發(fā)表于 05-20 11:05 ?782次閱讀
    技術(shù)分享 | 如何在2k0300(LoongArch<b class='flag-5'>架構(gòu)</b>)<b class='flag-5'>處理器</b>上跑通qt開發(fā)流程

    熱成像儀為何都在瘋狂卷多核處理器?“多核大戰(zhàn)”背后的真相你知道嗎?

    ”遠(yuǎn)遠(yuǎn)不夠, “看得清”“不卡頓”“多任務(wù)并行”成了剛需。 于是,一場(chǎng)關(guān)于“多核處理器”的行業(yè)競(jìng)賽悄然拉開帷幕。 多核,不只是手機(jī)的事,熱成像儀也在“追核” 過去我們常常聽說手機(jī)從雙核進(jìn)化到八核甚至二十核,現(xiàn)在同樣的邏輯正發(fā)生在
    的頭像 發(fā)表于 04-27 15:41 ?636次閱讀

    50%新型HPC擁抱多芯片設(shè)計(jì):性能飛躍的新篇章

    。為了滿足這種需求,HPC系統(tǒng)不斷在架構(gòu)、處理器、存儲(chǔ)和網(wǎng)絡(luò)等方面進(jìn)行創(chuàng)新和優(yōu)化。其中,多芯片設(shè)計(jì)作為一種新興的技術(shù)趨勢(shì),正在逐漸被越來越多的HPC系統(tǒng)所采用。近
    的頭像 發(fā)表于 03-03 11:34 ?915次閱讀
    50%新型<b class='flag-5'>HPC</b>擁抱多芯片設(shè)計(jì):性能飛躍的新篇章

    端側(cè) AI 音頻處理器:集成音頻處理與 AI 計(jì)算能力的創(chuàng)新芯片

    對(duì)人工智能應(yīng)用日益增長的需求。 ? 集成音頻處理與 AI 計(jì)算能力 端側(cè) AI 音頻處理器的組成結(jié)構(gòu)通常較為復(fù)雜,常采用多核異構(gòu)架構(gòu),將不同類型的
    的頭像 發(fā)表于 02-16 00:13 ?3388次閱讀

    康佳特推出高性能COM-HPC模塊conga-HPC/cBLS

    應(yīng)用而設(shè)計(jì),旨在滿足現(xiàn)代工業(yè)對(duì)高性能、高可靠性和靈活性的需求。 conga-HPC/cBLS模塊屬于COM-HPC Client Size C(120x160 mm)規(guī)格,搭載了英特爾酷睿S系列處理器(代號(hào)
    的頭像 發(fā)表于 02-08 16:49 ?973次閱讀

    低功耗處理器的優(yōu)勢(shì)分析

    就考慮到能耗問題,通過優(yōu)化架構(gòu)、工藝和軟件來降低功耗的處理器。它們通常采用先進(jìn)的制造工藝,如FinFET或GAAFET技術(shù),以及高效的電源管理技術(shù),以實(shí)現(xiàn)在保持性能的同時(shí)減少能耗。 低功耗處理器的優(yōu)勢(shì) 1. 節(jié)能和環(huán)保 減少能源
    的頭像 發(fā)表于 02-07 09:14 ?2021次閱讀

    康佳特發(fā)布高性能COM-HPC模塊

    嵌入式解決方案的日益增長需求。 conga-HPC/cBLS模塊是一款COM-HPC Client Size C(120x160 mm)規(guī)格的計(jì)算機(jī)模塊,它基于英特爾酷睿S系列處理器(代號(hào)
    的頭像 發(fā)表于 02-05 18:21 ?1357次閱讀

    HPC云計(jì)算的技術(shù)架構(gòu)

    HPC云計(jì)算結(jié)合了HPC的強(qiáng)大計(jì)算能力和云計(jì)算的彈性、可擴(kuò)展性,為用戶提供了按需獲取高性能計(jì)算資源的便利。下面,AI部落小編帶您了解HPC云計(jì)算的技術(shù)架構(gòu)。
    的頭像 發(fā)表于 02-05 14:51 ?777次閱讀

    量子處理器是什么_量子處理器原理

    量子處理器(QPU)是量子計(jì)算機(jī)的核心部件,它利用量子力學(xué)原理進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算、存儲(chǔ)及處理量子信息。以下是對(duì)量子處理器的詳細(xì)介紹:
    的頭像 發(fā)表于 01-27 11:53 ?2028次閱讀

    康佳特推出全新COM-HPC模塊

    德國領(lǐng)先的嵌入式和邊緣計(jì)算技術(shù)供應(yīng)商康佳特,近日宣布擴(kuò)展其高性能COM-HPC計(jì)算機(jī)模塊產(chǎn)品線,推出了全新的conga-HPC/cBLS模塊。該模塊專為需要強(qiáng)大計(jì)算能力的邊緣與基礎(chǔ)設(shè)施應(yīng)用而設(shè)計(jì),采用了英特爾酷睿S系列處理器(代
    的頭像 發(fā)表于 01-23 15:33 ?1344次閱讀

    Andes晶心科技推出AndesCore AX66亂序超純量多核處理器IP

    Andes晶心科技(Andes Technology)作為高效能、低功耗、32/64位RISC-V處理器核的領(lǐng)先供貨商及RISC-V國際組織的創(chuàng)始頂級(jí)會(huì)員,今日宣布推出支持RVA23規(guī)范的AndesCore AX66亂序超純量多核處理器
    的頭像 發(fā)表于 01-23 11:05 ?1874次閱讀