chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種新的混合SoC處理器—GPNPU!

SSDFans ? 來(lái)源:SSDFans ? 作者:SSDFans ? 2022-12-09 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Performance, Power, Area(PPA)是半導(dǎo)體行業(yè)中常用的衡量標(biāo)準(zhǔn)。這三個(gè)指標(biāo)對(duì)開(kāi)發(fā)的所有電子產(chǎn)品都產(chǎn)生了巨大的影響。影響的程度當(dāng)然取決于具體的電子產(chǎn)品以及目標(biāo)終端市場(chǎng)和應(yīng)用。因此,PPA權(quán)衡決策由產(chǎn)品公司在為各自的終端產(chǎn)品選擇各種芯片(以及ASIC的IP)時(shí)做出。

另一個(gè)重要的考慮因素是在不需要重新設(shè)計(jì)的情況下確保產(chǎn)品的壽命。換句話說(shuō),就是讓自己的產(chǎn)品適應(yīng)不斷變化的市場(chǎng)和產(chǎn)品需求。雖然產(chǎn)品公司在重新設(shè)計(jì)之前會(huì)采用輔助方法來(lái)延長(zhǎng)產(chǎn)品的使用壽命,但直接提供future proofing的解決方案是首選的方法。例如,在需求快速變化的市場(chǎng)積極增長(zhǎng)時(shí)期,FPGA在面向未來(lái)的通信基礎(chǔ)設(shè)施產(chǎn)品中發(fā)揮了關(guān)鍵作用。當(dāng)然,替代路徑可能比FPGA路徑提供更好的PPA收益。但是FPGA路徑通過(guò)避免重新設(shè)計(jì)幫助產(chǎn)品公司節(jié)省了大量的時(shí)間和金錢(qián),并確保他們能夠保持或增長(zhǎng)他們的市場(chǎng)份額。

還有一個(gè)考慮因素是,開(kāi)發(fā)產(chǎn)品的路徑可以提供方便和速度。這直接轉(zhuǎn)化為上市時(shí)間,進(jìn)而轉(zhuǎn)化為市場(chǎng)份額和盈利能力。最后,客戶可以輕松地在產(chǎn)品上開(kāi)發(fā)應(yīng)用軟件。

市場(chǎng)情況

人工智能AI)驅(qū)動(dòng)的、支持機(jī)器學(xué)習(xí)(ML)的產(chǎn)品和應(yīng)用正在快速增長(zhǎng),并帶來(lái)巨大的市場(chǎng)增長(zhǎng)機(jī)會(huì)。新的ML模型正在快速引入,現(xiàn)有的模型也在增強(qiáng)。市場(chǎng)機(jī)會(huì)范圍從數(shù)據(jù)中心到邊緣人工智能產(chǎn)品和應(yīng)用。許多針對(duì)這些市場(chǎng)的產(chǎn)品無(wú)法在PPA和產(chǎn)品/應(yīng)用程序開(kāi)發(fā)的易用性之間進(jìn)行權(quán)衡。

如果有一種方法可以提供PPA優(yōu)化、future proofing、便于產(chǎn)品和應(yīng)用程序開(kāi)發(fā),所有這些都集中到一個(gè)產(chǎn)品中會(huì)怎么樣呢?它是一個(gè)統(tǒng)一的體系結(jié)構(gòu),簡(jiǎn)化SoC硬件設(shè)計(jì)和編程的混合處理器IP。可以解決ML推理、預(yù)處理和后處理的一體化問(wèn)題。

新型混合SoC處理器

最近,Quadric宣布了第一個(gè)通用神經(jīng)處理器(GPNPU)系列,這是一種半導(dǎo)體知識(shí)產(chǎn)權(quán)(IP)產(chǎn)品,融合了神經(jīng)處理加速器和數(shù)字信號(hào)處理器(DSP)。IP使用一個(gè)統(tǒng)一的體系結(jié)構(gòu),解決ML性能特征和DSP功能,具有完全的C++可編程性。本文將從一個(gè)典型的支持ML的SoC架構(gòu)的組件、其局限性、Quadric產(chǎn)品、優(yōu)點(diǎn)和可用性等方面展開(kāi)介紹。

典型的支持ML的SoC架構(gòu)的組件

支持ML架構(gòu)的關(guān)鍵組件包括神經(jīng)處理單元(NPU)、數(shù)字信號(hào)處理(DSP)單元和實(shí)時(shí)中央處理單元(CPU)。NPU用于運(yùn)行當(dāng)今最流行的ML網(wǎng)絡(luò)的圖形層,并且在已知的推理工作負(fù)載上表現(xiàn)非常好。DSP用于有效地執(zhí)行語(yǔ)音和圖像處理,并涉及復(fù)雜的數(shù)學(xué)運(yùn)算。實(shí)時(shí)CPU用于協(xié)調(diào)NPU、DSP和存儲(chǔ)ML模型權(quán)重的內(nèi)存之間的ML工作負(fù)載。通常,只有CPU可直接供軟件開(kāi)發(fā)人員用于代碼開(kāi)發(fā)。NPU和DSP只能通過(guò)預(yù)定義的應(yīng)用程序編程接口(API)訪問(wèn)。

典型架構(gòu)的局限性

如上所述,典型的加速器NPU不是完全可編程的處理器。雖然它們非常高效地運(yùn)行已知的圖形層,但它們不能隨著ML模型的發(fā)展而運(yùn)行新的層。如果需要通過(guò)API不可用的ML操作符,則需要將其添加到CPU上,因?yàn)橹浪男阅軙?huì)很差。該架構(gòu)不適合新ML模型和ML操作符的future proofing。充其量,可以通過(guò)在實(shí)時(shí)CPU上實(shí)現(xiàn)新的ML操作符來(lái)呈現(xiàn)性能較低的解決方案。

另一個(gè)限制是,程序員必須在NPU、DSP和實(shí)時(shí)CPU上劃分代碼,然后調(diào)整交互以滿足期望的性能目標(biāo)。典型的架構(gòu)還可能導(dǎo)致在NPU核和CPU核之間拆分矩陣操作。由于需要在內(nèi)核之間交換大數(shù)據(jù)塊,因此此操作會(huì)導(dǎo)致推斷延遲和功耗問(wèn)題。

來(lái)自不同IP供應(yīng)商的多個(gè)IP核迫使開(kāi)發(fā)者依賴(lài)于多個(gè)設(shè)計(jì)和生產(chǎn)力工具鏈。必須使用多個(gè)工具鏈通常會(huì)延長(zhǎng)開(kāi)發(fā)時(shí)間,并使調(diào)試具有挑戰(zhàn)性。

Quadric方法的好處

Quadric的Chimera GPNPU家族為ML推理和相關(guān)的傳統(tǒng)C++圖像、視頻、雷達(dá)和其他信號(hào)處理創(chuàng)建了統(tǒng)一的單核體系結(jié)構(gòu)。這允許將神經(jīng)網(wǎng)絡(luò)和C++代碼合并到單個(gè)軟件代碼流中。內(nèi)存帶寬通過(guò)單一的統(tǒng)一編譯堆棧進(jìn)行優(yōu)化,并使功耗顯著減小。編程單核系統(tǒng)也比處理異構(gòu)多核系統(tǒng)容易得多。標(biāo)量、向量和矩陣計(jì)算只需要一個(gè)工具鏈。

統(tǒng)一的Chimera GPNPU架構(gòu)的其他好處包括,由于不必在NPU、DSP和CPU之間移動(dòng)激活數(shù)據(jù),從而節(jié)省了面積和功耗。統(tǒng)一的核心架構(gòu)大大簡(jiǎn)化了硬件集成,使性能優(yōu)化任務(wù)更加容易。

分析內(nèi)存使用情況以確定最佳片外帶寬的系統(tǒng)設(shè)計(jì)任務(wù)也得到了簡(jiǎn)化。這也直接導(dǎo)致了功率最小化。

73841dc0-7764-11ed-8abf-dac502259ad0.png

應(yīng)用程序開(kāi)發(fā)

Chimera軟件開(kāi)發(fā)工具包(SDK)允許通過(guò)兩步編譯過(guò)程將來(lái)自通用ML訓(xùn)練工具集的圖代碼與客戶的C++代碼合并。這導(dǎo)致可以在統(tǒng)一的Chimera單處理器核心上運(yùn)行的單一代碼流。目前廣泛使用的ML訓(xùn)練工具集有TensorFlow、PyTorch、ONNX和Caffe。實(shí)現(xiàn)的SoC的用戶將擁有對(duì)Chimera所有核心資源的完全訪問(wèn)權(quán),以實(shí)現(xiàn)應(yīng)用程序編程的最大靈活性。整個(gè)系統(tǒng)也可以從單個(gè)調(diào)試控制臺(tái)進(jìn)行調(diào)試。

73dffa96-7764-11ed-8abf-dac502259ad0.png

在不損失性能的情況下實(shí)現(xiàn)future proofing

Chimera GPNPU架構(gòu)擅長(zhǎng)處理卷積層,這是卷積神經(jīng)網(wǎng)絡(luò)(CNNs)的核心。Chimera GPNPU可以運(yùn)行任何ML操作符。通過(guò)使用Chimera計(jì)算庫(kù)(CCL) API編寫(xiě)C++內(nèi)核并使用Chimera SDK編譯該內(nèi)核,可以添加自定義ML操作符。自定義運(yùn)算符的性能與本地運(yùn)算符相同,因?yàn)樗鼈兝昧薈himera GPNPU的相關(guān)核心資源。

SoC開(kāi)發(fā)人員可以在SoC被剝離后很長(zhǎng)時(shí)間內(nèi)實(shí)現(xiàn)新的神經(jīng)網(wǎng)絡(luò)運(yùn)算符和庫(kù)。這本身就大大增加了芯片的使用壽命。

軟件開(kāi)發(fā)人員可以在產(chǎn)品的整個(gè)生命周期中繼續(xù)優(yōu)化他們的模型和算法的性能。他們可以添加新的特性和功能,為他們的產(chǎn)品在市場(chǎng)上獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。

Quadric的當(dāng)前產(chǎn)品

Chimera架構(gòu)已經(jīng)在芯片領(lǐng)域得到了快速驗(yàn)證。QB系列GPNPU的整個(gè)家族可以在主流的16nm和7nm工藝中使用傳統(tǒng)的標(biāo)準(zhǔn)電池流和常用的單端口SRAM實(shí)現(xiàn)1GHz的工作。Chimera核心可以針對(duì)任何芯片鑄造廠和任何工藝技術(shù)。

Chimera GPNPU系列的QB系列包括三個(gè)核心:

Chimera QB1 -每秒1萬(wàn)億次機(jī)器學(xué)習(xí)運(yùn)算(TOPS),每秒64千兆次DSP運(yùn)算(GOPs);

Chimera QB4 - 4 TOPS機(jī)器學(xué)習(xí),256 GOP DSP;

Chimera QB16–16 TOPS機(jī)器學(xué)習(xí),1 TOPS DSP;

如果需要,可以將兩個(gè)或多個(gè)Chimera核心配對(duì)在一起,以滿足更高級(jí)別的性能要求。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20084

    瀏覽量

    243867
  • soc
    soc
    +關(guān)注

    關(guān)注

    38

    文章

    4482

    瀏覽量

    226815
  • 人工智能
    +關(guān)注

    關(guān)注

    1812

    文章

    49536

    瀏覽量

    259321

原文標(biāo)題:一種新的混合SoC處理器—GPNPU!

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Cortex-M0+處理器的HardFault錯(cuò)誤介紹

    在ARM處理器中,如果個(gè)程序產(chǎn)生了錯(cuò)誤并且被處理器檢測(cè)到,就會(huì)產(chǎn)生錯(cuò)誤異常。Cortex-M0+處理器只有一種異常用以
    的頭像 發(fā)表于 10-14 10:50 ?1726次閱讀
    Cortex-M0+<b class='flag-5'>處理器</b>的HardFault錯(cuò)誤介紹

    AUDIO SoC的解決方案

    SoC(片上系統(tǒng))是一種系統(tǒng)級(jí)集成電路。新唐科技的單芯片音頻系統(tǒng)音頻 SoC采用皮質(zhì)-M0/M4內(nèi)核,并采用Arm 皮質(zhì)-M系列處理器的基本創(chuàng)新技術(shù),包括∑△ADC、CODEC、OP、
    發(fā)表于 09-05 08:26

    nRF54系列新代無(wú)線 SoC

    Cortex-M33 處理器,處理能力翻倍,處理效率提高兩倍。 nRF54L 系列中的三款無(wú)線 SoC 提供多種內(nèi)存大小選擇,最大 1.5 MB NVM,最大 256 KB RAM,
    發(fā)表于 05-26 14:48

    光子 AI 處理器的核心原理及突破性進(jìn)展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執(zhí)行信息處理與人工智能(AI)計(jì)算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基于晶體管的電子 AI 處理器(如 GPU、T
    的頭像 發(fā)表于 04-19 00:40 ?3429次閱讀

    處理器超頻技巧與注意事項(xiàng)

    隨著科技的發(fā)展,處理器的性能越來(lái)越強(qiáng)大,但有時(shí)我們?nèi)韵M@得更高的性能。超頻是一種提高處理器性能的方法,但需要謹(jǐn)慎操作以避免潛在風(fēng)險(xiǎn)。 超頻前的準(zhǔn)備 了解處理器規(guī)格 :在超頻前,了解
    的頭像 發(fā)表于 02-07 09:16 ?1655次閱讀

    處理器和芯片的區(qū)別是什么 處理器是指cpu嗎

    一種特定類(lèi)型的芯片,專(zhuān)門(mén)設(shè)計(jì)用于執(zhí)行系列指令來(lái)處理數(shù)據(jù)或控制其他設(shè)備。它是計(jì)算機(jī)或其他電子設(shè)備中的關(guān)鍵部件,負(fù)責(zé)執(zhí)行程序指令,控制計(jì)算機(jī)系統(tǒng)的運(yùn)行。處理器通常由運(yùn)算邏輯部件、寄存
    的頭像 發(fā)表于 02-01 14:59 ?6909次閱讀

    量子處理器的作用_量子處理器的優(yōu)缺點(diǎn)

    量子處理器(QPU),又稱(chēng)量子級(jí)計(jì)算機(jī)處理器,是量子計(jì)算機(jī)中的核心部件,其作用主要體現(xiàn)在以下幾個(gè)方面:   、高速計(jì)算與處理能力   量子
    的頭像 發(fā)表于 01-27 13:44 ?1309次閱讀

    量子處理器是什么_量子處理器原理

    量子處理器(QPU)是量子計(jì)算機(jī)的核心部件,它利用量子力學(xué)原理進(jìn)行高速數(shù)學(xué)和邏輯運(yùn)算、存儲(chǔ)及處理量子信息。以下是對(duì)量子處理器的詳細(xì)介紹:
    的頭像 發(fā)表于 01-27 11:53 ?1508次閱讀

    EE-236:將混合信號(hào)前端器件與Blackfin處理器結(jié)合使用的實(shí)時(shí)解決方案

    電子發(fā)燒友網(wǎng)站提供《EE-236:將混合信號(hào)前端器件與Blackfin處理器結(jié)合使用的實(shí)時(shí)解決方案.pdf》資料免費(fèi)下載
    發(fā)表于 01-07 13:51 ?0次下載
    EE-236:將<b class='flag-5'>混合</b>信號(hào)前端器件與Blackfin<b class='flag-5'>處理器</b>結(jié)合使用的實(shí)時(shí)解決方案

    走進(jìn)北大 | 算能RISC-V通用處理器設(shè)計(jì)成功開(kāi)課

    近日,北京大學(xué)集成電路學(xué)院賈天宇老師開(kāi)設(shè)的《現(xiàn)代SoC處理器架構(gòu)設(shè)計(jì)》如期進(jìn)行,算能首席科學(xué)家楊柳西博士、處理器架構(gòu)師張明俊受邀,為北大博士講授了RXU高性能通用處理器設(shè)計(jì)的課程。《現(xiàn)
    的頭像 發(fā)表于 12-06 01:06 ?1362次閱讀
    走進(jìn)北大 | 算能RISC-V通用<b class='flag-5'>處理器</b>設(shè)計(jì)成功開(kāi)課

    一種混合顏料光譜分區(qū)間識(shí)別方法

    古代彩繪顏料的分析是科技考古與文物保護(hù)研究的重要內(nèi)容,高光譜是近年來(lái)發(fā)展迅速的新興技術(shù),在物質(zhì)識(shí)別上具有廣泛應(yīng)用,提出一種基于高光譜分區(qū)間的混合顏料識(shí)別方法。 一種混合顏料光譜分區(qū)間識(shí)
    的頭像 發(fā)表于 12-02 16:22 ?668次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>混合</b>顏料光譜分區(qū)間識(shí)別方法

    文看懂SoC的架構(gòu)

    、SoC 架構(gòu)圖:核心功能和設(shè)計(jì)目標(biāo) SoC 是基于通用處理器這樣的思路進(jìn)行設(shè)計(jì)的,與 PC 設(shè)計(jì)思路樣。即通用
    的頭像 發(fā)表于 11-29 09:57 ?4424次閱讀
    <b class='flag-5'>一</b>文看懂<b class='flag-5'>SoC</b>的架構(gòu)

    盛顯科技:拼接處理器是什么設(shè)備類(lèi)型

    是什么設(shè)備類(lèi)型嗎?下面盛顯科技小編為您介紹: ? 拼接處理器一種專(zhuān)門(mén)用于視頻信號(hào)處理和顯示控制的硬件設(shè)備,它主要用于將多路視頻信號(hào)進(jìn)行分割、縮放、拼接和顯示控制。通過(guò)拼接處理器,可以
    的頭像 發(fā)表于 11-28 11:32 ?823次閱讀

    SOC芯片在汽車(chē)電子中的應(yīng)用

    隨著技術(shù)的飛速發(fā)展,汽車(chē)不再僅僅是簡(jiǎn)單的交通工具,而是變成了個(gè)高度集成的移動(dòng)計(jì)算平臺(tái)。SOC芯片作為這變革的核心,正在重塑汽車(chē)電子的面貌。 、
    的頭像 發(fā)表于 10-31 15:46 ?2843次閱讀

    SOC芯片在智能手機(jī)中的應(yīng)用

    至關(guān)重要的作用。 1. SOC芯片的定義和組成 SOC芯片是一種集成了處理器、存儲(chǔ)、輸入/輸出接口等多種功能的集成電路。在智能手機(jī)中,
    的頭像 發(fā)表于 10-31 14:42 ?4027次閱讀