chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

異構計算的前世今生

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-12-17 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異構計算已經(jīng)成了半導體業(yè)界不得不思考的一個話題,傳統(tǒng)通用計算的性能捉襟見肘,過去承諾的每隔一段時間芯片性能翻倍的豪言壯語已經(jīng)沒有人再提了。如今我們用到的手機中,各種除CPU以外的計算單元層出不窮,無論是神經(jīng)網(wǎng)絡處理器還是圖像處理器。

異構計算的存在可以說創(chuàng)造了另一個維度,這個維度上我們又有了堆性能的空間,小至手機SoC、汽車芯片,大到服務器芯片和超算處理器,異構帶來了更大的算力。但與此同時,異構計算也帶來了一些潛在的問題。

異構計算的崛起

異構計算其實早在計算機時代的早期就開始零星出現(xiàn)了,比如英特爾在80年代推出的浮點協(xié)處理器(FPU)i487,Inmos./ST在1996年推出的多媒體加速器Chameleon等等。轉眼進入了新世紀,異構出現(xiàn)的頻率也越來越高,2010年蘋果推出了首個自研的處理器A4,將CPU、GPU和其它加速器集成至一起。在超算領域,加速器和協(xié)處理器也數(shù)量也在逐步增加。

全球超算系統(tǒng)加速器/協(xié)處理器的應用趨勢 / TOP500

2020年以后,各國的超級計算機計劃都定位在了Exascale的百億億級別,要想實現(xiàn)目標,要么靠堆核心規(guī)模來堆性能,要么就是選擇異構計算。如今前十的超算系統(tǒng)中,有一半以上都采用了CPU+GPU的異構設計。

明眼人都能看出,這種CPU+GPU的異構設計也開始變得愈發(fā)緊密,比如英偉達今年宣布的Arm CPU Grace,該處理器靠著英偉達專利互聯(lián)技術NVLink的加持,成功將CPU與GPU之間的互聯(lián)速度做到了夸張的900GB/s,是傳統(tǒng)PCIe的10倍以上,CPU更是靠LPDDR5X實現(xiàn)了500GB/s的內存帶寬。

非傳統(tǒng)的架構更是層出不窮,Graphcore的IPU、谷歌的TPU、矢量引擎和FPGA等等,相信XPU的命名形式馬上就要用完26個字母了。促使大家選擇異構的動力究竟是什么?答案很簡單,異構給到了一個更高效的方案,能夠實現(xiàn)的算力更高。既然你CPU在計算上落后了,我GPU自然要上位,更何況我還有這么多成熟的I/O和互聯(lián)技術為我撐腰。

異構計算真就完美無缺?

異構計算就真的如此完美嗎?并非如此。異構計算的存在其實也引出了不少隱患,比如極度差異化的編程模型,從過去的單向編程轉為了多向編程。因為異構系統(tǒng)中存在多個計算設備,又有著不同的系統(tǒng)架構、指令集和編程模型,因此異構系統(tǒng)的編程與傳統(tǒng)的CPU編程相比有很大的差距。通常來說,異構混合計算系統(tǒng)需要多套不同的代碼,這增大了應用開發(fā)的難度,紙面參數(shù)是好看了,卻苦了軟件開發(fā)者。

IPU / Graphcore

其次,GPU、FPGA和AI處理器廠商都推出了截然不同的加速器方案,這些方案不僅僅采用了自己專用的處理器架構,還有自己的執(zhí)行指令和編譯器。在這樣不統(tǒng)一的架構下,將并行程序移植到異構處理器上需要的可不只是重新編譯,還有代碼重寫。也正因如此,HPC的代碼生態(tài)雖然不弱,但近半數(shù)以上可能永遠都不會被移植到其他加速器上,甚至這一部分工作量還分攤到了加速器廠商的軟件開發(fā)工作量上。

所以,必須得使用優(yōu)秀的軟件棧,這樣才能讓開發(fā)者充分利用異構處理器的計算資源,而不用在編程時考慮復雜的硬件細節(jié)?,F(xiàn)在已經(jīng)有了不少跨平臺的編程標準,比如C++/Fortran、OpenMP、SYCL和Kokkos等。

最后是復雜的數(shù)據(jù)存取過程,異構帶來的不僅是不同層級的計算架構,還有不同層級的存儲架構,比如主存儲、主緩存、設備主存、設備緩存和寄存器等等。數(shù)據(jù)要在多種存儲類型之間移動,程序執(zhí)行要在同時對多種存儲進行存取,這些存儲方式的帶寬和延遲也不盡相同。

異構計算的未來

在近期舉辦的CIUK 2021大會上,HPC研究組的Simon McIntosh-Smith教授發(fā)表了他自己對異構計算未來的看法。他認為異構計算的趨勢還將繼續(xù)發(fā)展下去,差異化不會消失,但也不會出現(xiàn)極度差異化的情況。

其次CPU與GPU的關系將更加緊密,比如緩存一致和封裝集成等,其他加速器在特定場景下聲稱的性能數(shù)據(jù)都很優(yōu)秀,但要說通用計算性能,GPU還是要略勝一籌。而且依目前的趨勢來看,CPU也在慢慢汲取GPU上的優(yōu)點,比如HBM、寬矢量處理器的核心、核心內部的加速器等等。編程的困境固然已經(jīng)有了改善的跡象,但還有一段長路要走。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 異構
    +關注

    關注

    0

    文章

    47

    瀏覽量

    13544
  • 異構計算
    +關注

    關注

    2

    文章

    112

    瀏覽量

    17182
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    低溫無壓燒結銀的前世今生:從發(fā)明到未來趨勢

    低溫無壓燒結銀的前世今生:從發(fā)明到未來趨勢 低溫無壓燒結銀(Low-Temperature Pressureless Sintered Silver, LT-PSS)作為第三代半導體封裝與高端電子
    的頭像 發(fā)表于 01-26 13:18 ?300次閱讀

    芯片裝甲的前世今生

    一前言眾所周知,晶圓的特性如同玻璃一樣容易破碎,但為什么做成成品的IC又能通過高震動與跌落可靠性測試,并且能在高溫環(huán)境下非常穩(wěn)定運行?這其實是一個關鍵的半導體技術——封裝的功勞。它像一道“防護城墻”,既要屏蔽灰塵、水汽、沖擊,也要兼顧散熱、電性能和成本。在如今人人都知道先進半導體工藝已經(jīng)先進到2nm的今天,對于不起眼的封裝技術,卻鮮有人熟知。接下來,讓我們從
    的頭像 發(fā)表于 11-25 11:34 ?319次閱讀
    芯片裝甲的<b class='flag-5'>前世</b><b class='flag-5'>今生</b>

    【TEC100TAI-KIT】青翼凌云科技基于JFMQL100TAI的全國產化智能異構計算平臺

    TEC100TAI-KIT是一款基于國產100TAI的全國產智能異構計算平臺開發(fā)套件,該套件包含1個100TAI核心板和1個PCIE規(guī)格的擴展底板。 該套件的核心板集成了100TAI的最小
    的頭像 發(fā)表于 09-19 17:16 ?893次閱讀
    【TEC100TAI-KIT】青翼凌云科技基于JFMQL100TAI的全國產化智能<b class='flag-5'>異構計算</b>平臺

    PCIe協(xié)議分析儀能測試哪些設備?

    PCIe協(xié)議分析儀能測試多種依賴PCIe總線進行高速數(shù)據(jù)傳輸?shù)脑O備,其測試范圍覆蓋計算、存儲、網(wǎng)絡及異構計算等多個領域,具體設備類型及測試場景如下:一、核心計算設備 GPU(圖形處理器) 測試
    發(fā)表于 07-25 14:09

    【PZ-ZU15EG-KFB】——ZYNQ UltraScale + 異構架構下的智能邊緣計算標桿

    璞致電子推出PZ-ZU15EG-KFB異構計算開發(fā)板,搭載Xilinx ZYNQ UltraScale+ XCZU15EG芯片,整合四核ARM Cortex-A53、雙核Cortex-R5F
    的頭像 發(fā)表于 07-22 09:47 ?1092次閱讀
    【PZ-ZU15EG-KFB】——ZYNQ UltraScale + <b class='flag-5'>異構</b>架構下的智能邊緣<b class='flag-5'>計算</b>標桿

    智能安防邊緣計算的技術解析

    維度,剖析核心板如何推動安防從"被動記錄"到"主動決策"的升級,并給出選型建議。 ? --- 一、核心板的硬件架構創(chuàng)新** ? 1. 異構計算架構:算力與能效的平衡? 以SSD2351為例,其采用**"CPU+NPU+IVE"三級計算架構**: ? - **CPU**(雙
    的頭像 發(fā)表于 06-26 11:56 ?577次閱讀

    異構計算構建更智能、更高效的AI未來

    人工智能 (AI) 不再只是一個科研課題,它已然成為我們日常生活的一部分。從個性化醫(yī)療、智能可穿戴設備,到沉浸式數(shù)字娛樂以及自主機器人,AI 正在重塑我們生活、工作和創(chuàng)新的方式。然而,隨著 AI 應用日益復雜,底層的基礎設施也必須隨之不斷演進。
    的頭像 發(fā)表于 06-26 09:44 ?1059次閱讀

    異構計算解決方案(兼容不同硬件架構)

    異構計算解決方案通過整合不同類型處理器(如CPU、GPU、NPU、FPGA等),實現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計算需求。其核心技術與實踐方案如下: 一、硬件架構設計 異構處理器組合? 主從
    的頭像 發(fā)表于 06-23 07:40 ?857次閱讀

    第三屆大會回顧第3期 | FFRT并發(fā)框架在OpenHarmony中的設計與實踐

    演講嘉賓 | 黃佑鐘 回顧整理 | 廖 ? 濤 排版校對 | 宋夕明 嘉賓介紹 開發(fā)框架分論壇? 黃佑鐘 ,海思Kirin解決方案并行與異構計算專家。 正文內容 多任務并發(fā)能更有效地利用CPU資源
    的頭像 發(fā)表于 06-21 16:53 ?1275次閱讀
    第三屆大會回顧第3期 | FFRT并發(fā)框架在OpenHarmony中的設計與實踐

    如何釋放異構計算的潛能?Imagination與Baya Systems的系統(tǒng)架構實踐啟示

    報告作者:PallaviSharma,Imaginaiton產品管理總監(jiān)Dr.EricNorige,BayaSystems首席軟件架構師關注Imagination公眾號,消息框發(fā)送【異構計算】,即可
    的頭像 發(fā)表于 06-13 08:33 ?1143次閱讀
    如何釋放<b class='flag-5'>異構計算</b>的潛能?Imagination與Baya Systems的系統(tǒng)架構實踐啟示

    能效提升3倍!異構計算架構讓AI跑得更快更省電

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)異構計算架構通過集成多種不同類型的處理單元(如CPU、GPU、NPU、FPGA、DSP等),針對不同計算任務的特點進行分工協(xié)作,從而在性能、能效和靈活性之間實現(xiàn)最優(yōu)平衡
    的頭像 發(fā)表于 05-25 01:55 ?4013次閱讀

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    近日, Imagination Technologies 與國內領先的異構計算軟件與智算混合云服務提供商 澎峰科技 ( PerfXLab )正式簽署合作備忘錄( MoU ),圍繞 GPU 與 AI
    發(fā)表于 05-21 09:40 ?1220次閱讀

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    近日,ImaginationTechnologies與國內領先的異構計算軟件與智算混合云服務提供商澎峰科技(PerfXLab)正式簽署合作備忘錄(MoU),圍繞GPU與AI的深度融合展開合作。雙方將
    的頭像 發(fā)表于 05-20 08:33 ?936次閱讀
    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓<b class='flag-5'>計算</b>生態(tài)

    全志科技多核異構SoC助力行業(yè)智能化創(chuàng)新

    近日, “第十二屆開源操作系統(tǒng)年度技術會議”在北京舉行,全志科技受邀參會。會上,全志進行了題為《多核異構SoC在行業(yè)應用中軟件方案的思考與實踐》的分享。分享從市場和技術洞察、方案設計創(chuàng)新、場景化應用落地三個維度展開系統(tǒng)性分享,全面展現(xiàn)了全志科技在異構計算領域的技術積累與行
    的頭像 發(fā)表于 04-18 09:11 ?1307次閱讀
    全志科技多核<b class='flag-5'>異構</b>SoC助力行業(yè)智能化創(chuàng)新

    RAKsmart智能算力架構:異構計算+低時延網(wǎng)絡驅動企業(yè)AI訓練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構,以異構計算資源池化與超低時延網(wǎng)絡為核心,重構AI訓練基礎設施,助力企業(yè)實現(xiàn)訓練速度提升、硬件成本下降與算法迭代加速的三重突破。
    的頭像 發(fā)表于 04-17 09:29 ?769次閱讀