chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Nature:人工智能芯片!

旺材芯片 ? 來源:納米人 ? 2023-09-05 16:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

具有數(shù)十億參數(shù)的人工智能AI)模型可以在一系列任務(wù)中實現(xiàn)高精度,但它們加劇了傳統(tǒng)通用處理器(例如圖形處理單元或中央處理單元)的低能效。模擬內(nèi)存計算(模擬 AI)可以通過在“內(nèi)存塊”上并行執(zhí)行矩陣向量乘法來提供更好的能源效率。然而,模擬人工智能尚未在需要許多此類圖塊以及圖塊之間神經(jīng)網(wǎng)絡(luò)激活的有效通信的模型上證明軟件等效(SWeq)準(zhǔn)確性。

有鑒于此,美國IBM 研究中心S. Ambrogio(一作兼通訊)等人展示了一款14 nm的模擬 AI 芯片,該芯片結(jié)合了跨 34 個區(qū)塊的 3500 萬個相變存儲器件、大規(guī)模并行區(qū)塊間通信和模擬低功耗外圍電路,可實現(xiàn)12.4 萬億次 / 秒 / 瓦運算性能,能效是傳統(tǒng)數(shù)字計算機芯片的14倍。作者展示了小型關(guān)鍵字識別網(wǎng)絡(luò)的完全端到端 SWeq 精度,以及更大的 MLPerf 循環(huán)神經(jīng)網(wǎng)絡(luò)傳感器 (RNNT) 上接近 SWeq 的精度,其中超過4500萬個權(quán)重映射到跨越5個芯片的1.4億個相變存儲器件上。

芯片架構(gòu)

作者展示了芯片的顯微照片,突出顯示了34個模擬塊的 2D 網(wǎng)格,每個塊都有512×2048PCM 交叉陣列。當(dāng)持續(xù)時間向量從模擬快發(fā)送到OLP時,芯片有效地實現(xiàn)了基于斜坡的模數(shù)轉(zhuǎn)換器ADC)。所有權(quán)重配置、MAC操作和路由方案均由每個圖塊上可用的用戶可配置本地控制器(LC) 定義。本地SRAM存儲定義數(shù)百個控制信號的時間序列的所有指令,從而實現(xiàn)高度靈活的測試并簡化設(shè)計驗證,與預(yù)定義狀態(tài)機相比,面積損失較小。作者驗證了持續(xù)時間可以在整個芯片上可靠地傳輸,最大誤差等于5ns(較短持續(xù)時間為 3ns)。

d0bbf1c2-4bba-11ee-a25d-92fbcf53809c.png

圖 芯片架構(gòu)

d10ba60e-4bba-11ee-a25d-92fbcf53809c.png

圖 可重構(gòu)架構(gòu)和路由

KWS任務(wù)

為了演示芯片在端到端網(wǎng)絡(luò)中的性能,實現(xiàn)了多類KWS任務(wù)。作者采用了 FC網(wǎng)絡(luò),實現(xiàn)了 86.75% 的分類準(zhǔn)確度。為了在芯片上實現(xiàn)完全端到端的傳輸,作者進行了一系列修改,最終端到端實現(xiàn)總共使用四個圖塊。為了提高MAC精度并補償外圍電路的不對稱性,引入了MAC不對稱平衡(AB)方法,測得的KWS精度為86.14%,完全在 MLPerf SWeq“等精度”極限 85.88%之內(nèi)。

d15d399c-4bba-11ee-a25d-92fbcf53809c.png

圖 端到端 KWS 任務(wù)

芯片上的 RNNT 映射

作者實施了MLPerf數(shù)據(jù)中心網(wǎng)絡(luò)RNNT作為行業(yè)相關(guān)的工作負(fù)載演示。當(dāng) RNNT等大型DNN以降低的數(shù)字精度實現(xiàn)時,整個網(wǎng)絡(luò)的最佳精度選擇可能會有所不同。研究表明即使使用激進的量化,不易受影響的層或整個網(wǎng)絡(luò)塊仍將提供較低的 WER,而高度敏感的塊即使對于少量的權(quán)重量化也將表現(xiàn)出較高的 WER。對每個單獨的層重復(fù)此過程以識別最敏感的層,接著將 MLPerf 權(quán)重映射到分布在5個芯片上的142個圖塊上。在總共 45,321,309 個網(wǎng)絡(luò)權(quán)重和偏差參數(shù)中,45,261,568 個被映射到模擬存儲器(權(quán)重的 99.9%)。

d1a90020-4bba-11ee-a25d-92fbcf53809c.png

圖 用于語音轉(zhuǎn)錄的 MLPerf RNNT 網(wǎng)絡(luò)

準(zhǔn)確度結(jié)果

作者展示了2513個音頻查詢的完整 Librispeech 驗證數(shù)據(jù)集的權(quán)重映射和編程后的實驗WER??俉ER為9.475%,與SW 基線相比總體下降了 2.02%。在本實驗中,通過芯片推斷完整的Librispeech驗證數(shù)據(jù)集并保存輸出結(jié)果。然后將這些輸入到芯片 2 中,依此類推,輸入到所有 5 個芯片中。即使在PCM漂移超過1周后重復(fù)進行,且沒有任何重新校準(zhǔn)或重量重新編程,RNNT WER 也僅下降了 0.4%。

d1eebab6-4bba-11ee-a25d-92fbcf53809c.png

圖 在 MLPerf RNNT上使用Librispeech進行WER實驗

電源和系統(tǒng)性能

作者還測量了推理操作期間每個芯片的全部功耗。所有控制和通信電路均以 0.8V 驅(qū)動。芯片最佳功率性能 為12.40 TOPS/W。通過將積分時間減半,芯片的 TOPS/W 可以再提高 25%,但 WER 會額外降低1%。隨著重量的增加,使用本文報道的芯片的模擬人工智能系統(tǒng)可以在3.57W的功率下實現(xiàn)6.704TOPS/W,比MLPerf的最佳能效提高了14 倍,WER 為 9.258%。

d1f4fde0-4bba-11ee-a25d-92fbcf53809c.png

圖 MLPerf RNNT功率和系統(tǒng)性能

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53180

    瀏覽量

    453743
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49498

    瀏覽量

    258197
  • 存儲器件
    +關(guān)注

    關(guān)注

    1

    文章

    32

    瀏覽量

    9964

原文標(biāo)題:Nature:人工智能芯片!

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設(shè)備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對“人工智能+”這個名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時代的第三波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?405次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:23

    超小型Neuton機器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設(shè)備上進行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴展/重力感應(yīng)/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發(fā)表于 04-23 10:55

    蘋果或與博通攜手研發(fā)人工智能芯片

    據(jù)消息人士透露,蘋果公司正在與博通公司攜手研發(fā)一款人工智能芯片,并計劃于2026年啟動生產(chǎn)。蘋果的高級機器學(xué)習(xí)和人工智能總監(jiān)Benoit Dupin最近表示,該公司正在考慮使用亞馬遜最新的人工
    的頭像 發(fā)表于 12-12 14:01 ?785次閱讀

    人工智能應(yīng)用領(lǐng)域及未來展望

    來源: 在當(dāng)今科技飛速發(fā)展的時代,人工智能無疑是最受矚目的領(lǐng)域之一。它正以前所未有的速度改變著我們的生活、工作和社會。 ? 一、人工智能的崛起 ? 人工智能的發(fā)展可以追溯到幾十年前,但近年來,隨著
    的頭像 發(fā)表于 12-07 11:29 ?2015次閱讀

    人工智能發(fā)展需要新的芯片技術(shù)

    人工智能的繁榮發(fā)展需要新的芯片技術(shù)。 ? 1997年,IBM的“深藍(lán)”超級計算機打敗了國際象棋世界冠軍加里?卡斯帕羅夫。這是超級計算機技術(shù)的一次突破性展示,也首次讓人們看到了高性能計算有一天可能超越
    的頭像 發(fā)表于 12-07 09:49 ?1274次閱讀
    <b class='flag-5'>人工智能</b>發(fā)展需要新的<b class='flag-5'>芯片</b>技術(shù)

    集成電路與人工智能結(jié)合

    集成電路,為人工智能算法提供了強大的算力支持。 隨著人工智能技術(shù)的不斷發(fā)展,對存儲和計算能力的需求日益增長,而集成電路的快速發(fā)展正好滿足了這一需求。 專用化芯片 : 專用化的人工智能
    的頭像 發(fā)表于 11-19 10:05 ?2573次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進行定制化設(shè)計。它廣泛應(yīng)用于各種
    發(fā)表于 11-14 16:39

    SOC芯片人工智能中的應(yīng)用

    人工智能技術(shù)正在改變我們的生活和工作方式。從智能手機的語音助手到復(fù)雜的自動駕駛汽車,AI技術(shù)的應(yīng)用無處不在。SOC芯片作為實現(xiàn)這些技術(shù)的關(guān)鍵硬件,集成了處理器、存儲器、輸入/輸出接口等多種功能,為
    的頭像 發(fā)表于 10-31 15:44 ?3486次閱讀

    Untether發(fā)布人工智能(AI)芯片

    初創(chuàng)企業(yè)Untether發(fā)布了一款專為汽車、農(nóng)業(yè)裝備及極端環(huán)境AI應(yīng)用設(shè)計的人工智能(AI)芯片。   相較于英偉達(dá)和AMD的旗艦AI芯片,它們主要服務(wù)于需要數(shù)千乃至數(shù)萬個芯片協(xié)
    的頭像 發(fā)表于 10-29 13:59 ?1064次閱讀