chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

阿里苦心研發(fā)Ali-NPU,AI芯片哪種跟具優(yōu)勢

mK5P_AItists ? 來源:未知 ? 作者:胡薇 ? 2018-04-23 17:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月19日,有消息稱,阿里巴巴達摩院正在研發(fā)一款神經(jīng)網(wǎng)絡芯片——Ali-NPU,主要運用于圖像視頻分析、機器學習AI推理計算。按照設計,這款芯片性能將是目前市面上主流CPU、GPU架構AI芯片的10倍,而制造成本和功耗僅為一半,其性價比超過40倍。

事實上,隨著人工智能產(chǎn)業(yè)的發(fā)展,CPU、GPU、TPU、DPU、NPU、BPU……各種PU也開始爆發(fā)式出現(xiàn)。那么,究竟這些PU在性能和使用上有何異同,又有哪些優(yōu)劣呢?

CPU:計算力占據(jù)部分很小 擅長邏輯控制

CPU是最為普遍,最為常見的中央處理器。主要包括運算器(ALU)和控制單元(CU),除此之外還包括若干寄存器、高速緩存器和它們之間通訊的數(shù)據(jù)、控制及狀態(tài)的總線。依循馮諾依曼架構,CPU需要大量空間放置存儲單元和控制邏輯,計算能力只占據(jù)很小的部分,更擅長邏輯控制。

CPU結(jié)構簡化圖

GPU:計算單元數(shù)量眾多 但無法單獨使用

GPU的誕生可以解決CPU在計算能力上的天然缺陷。采用數(shù)量眾多的計算單元和超長的流水線,善于處理圖像領域的運算加速。但GPU的缺陷也很明顯,即無法單獨工作,必須由CPU進行控制調(diào)用才能工作。

CPU、GPU微架構對比圖

TPU:高性能低功耗 然則開發(fā)周期長、轉(zhuǎn)換成本高

谷歌專門為 TensorFlow 深度學習框架定制的TPU,是一款專用于機器學習的芯片。TPU可以提供高吞吐量的低精度計算,用于模型的前向運算而不是模型訓練,且能效更高。但它的缺陷主要是開發(fā)周期長、可配置性能有限,缺乏靈活性且轉(zhuǎn)換成本高。

DPU:可實現(xiàn)快速開發(fā)與產(chǎn)品迭代

國際上,Wave Computing最早提出DPU。在國內(nèi),DPU最早是由深鑒科技提出,是基于Xilinx可重構特性的FPGA芯片,設計專用深度學習處理單元,且可以抽象出定制化的指令集和編譯器,從而實現(xiàn)快速的開發(fā)與產(chǎn)品迭代。

深鑒“雨燕”DPU平臺

NPU:運行效率提升 不支持大樣本訓練

NPU是神經(jīng)網(wǎng)絡處理器,在電路層模擬人類神經(jīng)元和突觸,并且用深度學習指令集直接處理大規(guī)模的神經(jīng)元和突觸,一條指令完成一組神經(jīng)元的處理。相比于CPU和GPU的馮諾伊曼結(jié)構,NPU通過突觸權重實現(xiàn)存儲和計算一體化,從而提高運行效率。但NPU也有自身的缺陷,比如不支持對大量樣本的訓練。

BPU:比在CPU上用軟件實現(xiàn)更為高效 不可再編程

BPU是由地平線主導的嵌入式處理器架構。第一代是高斯架構,第二代是伯努利架構,第三代是貝葉斯架構。BPU主要是用來支撐深度神經(jīng)網(wǎng)絡,比在CPU上用軟件實現(xiàn)更為高效。然而,BPU一旦生產(chǎn),不可再編程,且必須在CPU控制下使用。

從CPU、GPU的市場來看,已經(jīng)基本被英特爾、英偉達AMD三分天下。而在ASIC框架下的TPU,只有谷歌的體量和實力才有開發(fā)專用加速的動力。

推出DPU的深鑒科技有清華和斯坦福雙重學術背景,公司目前的兩條發(fā)展路線是:以芯片技術為主的純技術路線,以及基于技術的產(chǎn)品路線。其處理器做深度學習應用端,不做訓練端。目前,其深度壓縮技術可以將神經(jīng)網(wǎng)絡壓縮數(shù)十倍而不影響精度,還可以使用芯片存儲深度學習算法模型,減少內(nèi)存讀取次數(shù),降低運行功耗。

去年底,地平線在創(chuàng)辦兩年后終于發(fā)布首款芯片——“征程”與“旭日”。目前,這兩款處理器都屬于嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝像頭。2018年CES上,英特爾和地平線還發(fā)布了基于伯努利架構的新一代征程處理器,其發(fā)展路徑圖為:2018年,感知;2019年,建模;2020年,決策。

而因為與英特爾的合作,地平線不禁讓市場聯(lián)想到英特爾早前重金收購的Mobileye。在嵌入式人工智能領域,Mobileye是業(yè)界領頭羊。地平線在英特爾的定位版圖是否是中國版Mobileye?但其創(chuàng)始人余凱的抱負是,地平線是要做中國的英特爾。

相較而言,阿里在三家中最為熱衷芯片布局,上述包括寒武紀、深鑒科技均有阿里參投。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1647

    瀏覽量

    49217
  • NPU
    NPU
    +關注

    關注

    2

    文章

    376

    瀏覽量

    21120

原文標題:“芯痛”之下阿里苦心研發(fā)NPU AI芯片究竟哪款PU更厲害?

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    了嵌入式開發(fā)所需的底層引腳。這種 “跨界” 屬性使其在智慧交通、工業(yè)自動化、身智能等需要兼顧算法復雜度和硬件耦合度的場景中,具備了獨特的競爭優(yōu)勢。 六、結(jié)語:邊緣AI的新形態(tài) OrangePi
    發(fā)表于 03-10 14:19

    使用NORDIC AI的好處

    ; 自定義 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的專用 AI 加速器,對 TensorFlow Lite 模型可實現(xiàn)最高約 15× 推理加速、顯著
    發(fā)表于 01-31 23:16

    身智能交流會

    : GPU、NPU、專用 AI 計算芯片、邊緣計算盒子、工控機、AI 計算模組等 場景應用與行業(yè)解決方案: 汽車 / 電子制造、醫(yī)療康養(yǎng)、物流倉儲、教育培訓、智能家居等領域的集成解決方
    發(fā)表于 01-22 09:55

    【新品發(fā)布】艾為重磅發(fā)布端側(cè)AI高性能NPU語音芯片,打造智能語音體驗新標桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經(jīng)網(wǎng)絡智能語音處理芯片:AWA89601,集成音頻專用NPU(神經(jīng)網(wǎng)絡處理器),通過聲音模型訓練與NPU硬件結(jié)合,該
    的頭像 發(fā)表于 01-07 18:33 ?403次閱讀
    【新品發(fā)布】艾為重磅發(fā)布端側(cè)<b class='flag-5'>AI</b>高性能<b class='flag-5'>NPU</b>語音<b class='flag-5'>芯片</b>,打造智能語音體驗新標桿

    瑞芯微SOC智能視覺AI處理器

    。B2版本通常在功耗、穩(wěn)定性和部分外圍接口支持上有所優(yōu)化。NPU: 集成0.8 TOPS的NPU,支持INT8/INT16混合運算,能滿足大多數(shù)邊緣側(cè)的輕量級AI推理需求(如分類、檢測、識別)。多媒體
    發(fā)表于 12-19 13:44

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    、汽車)。 未來,隨著AI應用的深化,硬件分工將更精細——可能出現(xiàn)專為機器人設計的專用AI芯片,或融合NPU與GPU優(yōu)勢的“邊緣訓練
    的頭像 發(fā)表于 12-17 17:13 ?1813次閱讀
    <b class='flag-5'>AI</b>硬件全景解析:CPU、GPU、<b class='flag-5'>NPU</b>、TPU的差異化之路,一文看懂!?

    安謀科技:端側(cè)NPU技術創(chuàng)新,拉動AI算力落地引擎

    X3 NPU IP以及生態(tài)建設、NPU發(fā)展趨勢等話題。 ? 圖:安謀科技產(chǎn)品總監(jiān)鮑敏祺 ? 周易X3 NPU IP正當時 ? 安謀科技周易X3 NPU IP面向端側(cè)
    的頭像 發(fā)表于 12-09 16:44 ?5926次閱讀
    安謀科技:端側(cè)<b class='flag-5'>NPU</b>技術創(chuàng)新,拉動<b class='flag-5'>AI</b>算力落地引擎

    如何利用NPU與模型壓縮技術優(yōu)化邊緣AI

    隨著人工智能模型從設計階段走向?qū)嶋H部署,工程師面臨著雙重挑戰(zhàn):在計算能力和內(nèi)存受限的嵌入式設備上實現(xiàn)實時性能。神經(jīng)處理單元(NPU)作為強大的硬件解決方案,擅長處理 AI 模型密集的計算需求。然而
    的頭像 發(fā)表于 11-07 15:26 ?1289次閱讀
    如何利用<b class='flag-5'>NPU</b>與模型壓縮技術優(yōu)化邊緣<b class='flag-5'>AI</b>

    阿里自研AI芯片央視曝光,國產(chǎn)算力崛起新里程碑

    ,因為其中披露了阿里旗下平頭哥最新研發(fā)的面向人工智能的PPU芯片。這一曝光,不僅讓大眾看到了阿里AI
    的頭像 發(fā)表于 09-18 17:07 ?2337次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢: 組成部分: 2)分布式AI訓練 7、發(fā)展重點:基于強化學習的后訓練與推理 8、超越大模型:神經(jīng)符號計算 三、AGI芯片的實現(xiàn) 1、技術需求 AI
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+身智能芯片

    身智能芯片:說白了就是能夠感知、思考推理以及決策的一體式可達人類智能水平的智能體-----就電影里的一樣。 一、身智能 第一人稱視角:
    發(fā)表于 09-18 11:45

    AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索與AGI愿景》一書如同一張詳盡的“藏寶圖”,為讀者指明了通往下一代人工智能的硬件之路。作者沒有停留在空洞的概念層面,而是直擊核心,從馮·諾依曼架構的“內(nèi)存墻”瓶頸切入,清晰闡述了
    發(fā)表于 09-17 09:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    、集成芯片、分子器件與分子憶阻器,以及打印類腦芯片等。 第五章至第八章分別探討用化學或生物方法實現(xiàn)AI、AI在科學發(fā)現(xiàn)中創(chuàng)新應用、實現(xiàn)神經(jīng)形態(tài)計算與類腦
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    運算能力,是其在深度學習訓練環(huán)節(jié)發(fā)揮優(yōu)勢的關鍵,相關工作成果對證明專業(yè)能力極為重要。 若投身于 FPGA 芯片研發(fā),鑒于 FPGA 可重構、靈活性高以及在特定運算中高效的特性,在準備職稱申報材料時,要將
    發(fā)表于 08-19 08:58

    超越CPU/GPU:NPU如何讓AI“輕裝上陣”?

    和計算速度上更具優(yōu)勢,尤其適合移動設備、邊緣計算和嵌入式AI場景。 ? NPU有幾大核心特點:其一是專用架構,針對神經(jīng)網(wǎng)絡計算優(yōu)化,支持并行處理大量矩陣運算(如INT8/FP16低精度計算),典型操作包括卷積、池化、注意力機制(
    的頭像 發(fā)表于 04-18 00:05 ?4042次閱讀