chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習預(yù)測計算機芯片執(zhí)行來自各種應(yīng)用程序的代碼的運行速度

倩倩 ? 來源:量子認知 ? 2020-01-16 08:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,麻省理工學(xué)院的研究人員發(fā)明了一種機器學(xué)習工具,該工具可以預(yù)測計算機芯片執(zhí)行來自各種應(yīng)用程序的代碼的運行速度。

為了使代碼盡可能快地運行,開發(fā)人員和編譯器將編程語言轉(zhuǎn)換為機器可讀代碼的程序,通常使用通過模擬給定芯片體系結(jié)構(gòu)運行代碼的性能模型。

編譯器使用該信息來自動優(yōu)化代碼,而開發(fā)人員使用該信息來解決將運行該代碼的微處理器的性能瓶頸。但是,機器代碼的性能模型是由相對較少的專家小組手寫的,并且未經(jīng)適當驗證。結(jié)果,模擬的性能測量通常會偏離實際結(jié)果。

研究人員開發(fā)了一種新穎的機器學(xué)習管道,該管道可自動執(zhí)行此過程,從而使其變得更輕松、更快、更準確。這項研究成果在國際機器學(xué)習大會上發(fā)表。

研究人員通過一種特殊的神經(jīng)網(wǎng)絡(luò)模型,它以“基本塊”(計算指令的基本摘要)形式訓(xùn)練標記的數(shù)據(jù),以自動預(yù)測其持續(xù)時間使用給定的芯片執(zhí)行以前看不見的基本塊。結(jié)果表明,這種神經(jīng)網(wǎng)絡(luò)模型的性能要比傳統(tǒng)的手動調(diào)整模型精確得多。

這個基準測試套件涉及多個領(lǐng)域,包括機器學(xué)習、編譯器、密碼學(xué)和可用于驗證性能模型的圖形。研究人員將超過30萬已分析的塊合并到一個開源數(shù)據(jù)集中。在評估過程中,這種神經(jīng)網(wǎng)絡(luò)模型預(yù)測了英特爾芯片運行代碼的速度要比英特爾自身構(gòu)建的性能模型還要好。

最終,開發(fā)人員和編譯器可以使用該工具來生成代碼,這些代碼可以在越來越多的多樣化“黑匣子”芯片設(shè)計上更快、更高效地運行?,F(xiàn)代計算機處理器不透明,極其復(fù)雜且難以理解。編寫對這些處理器執(zhí)行得盡可能快的計算機代碼也極具挑戰(zhàn)性,該工具是朝著對這些芯片的性能進行完全建模以提高效率的重要一步。

最近,該團隊又提出了一種自動生成編譯器優(yōu)化的新技術(shù)。具體來說,它們會自動生成一種算法,該算法將某些代碼轉(zhuǎn)換為向量,可用于并行計算。 這種算法優(yōu)于LLVM編譯器中使用的手工矢量化算法。

LLVM是業(yè)界常用的編譯器,一個自由軟件項目,它是一種編譯器基礎(chǔ)設(shè)施,以C++寫成,包含一系列模塊化的編譯器組件和工具鏈,用來開發(fā)編譯器前端和后端。它是為了任意一種編程語言而寫成的程序,利用虛擬技術(shù)創(chuàng)造出編譯時期、鏈接時期、運行時期以及“閑置時期”的最優(yōu)化。它最早以C/C++為實現(xiàn)對象,而當前它已支持許多種程序語言。

研究人員說,手工設(shè)計性能模型可能是“一門妖術(shù)”。英特爾提供了超過3000頁的詳盡文檔,描述了其芯片的體系結(jié)構(gòu)。但是目前只有一小部分專家將構(gòu)建性能模型,以模擬這些架構(gòu)上代碼的執(zhí)行。

研究人員指出:“英特爾的文檔既沒有錯誤,也沒有完整,并且英特爾會省略某些事情,因為它是專有的?!?“但是,當使用數(shù)據(jù)時,不需要了解文檔。如果有隱藏的內(nèi)容,可以直接從數(shù)據(jù)中學(xué)習?!?/p>

為此,研究人員記錄了給定微處理器用于計算基本塊指令的平均周期數(shù),基本上是啟動,執(zhí)行和關(guān)閉的順序,而無需人工干預(yù)。使過程自動化可以快速分析成千上萬個塊。

在培訓(xùn)學(xué)習中,這種神經(jīng)網(wǎng)絡(luò)模型分析了數(shù)百萬個自動剖析的基本塊,以準確了解不同的芯片體系結(jié)構(gòu)將如何執(zhí)行計算。重要的是,該模型將原始文本作為輸入,不需要手動向輸入數(shù)據(jù)添加功能。在測試中,可以將以前看不見的基本塊和給定的芯片提供給模型,模型將生成一個數(shù)字,指示芯片將以多快的速度執(zhí)行該代碼。

研究人員發(fā)現(xiàn),該模型的準確性降低了錯誤率,這意味著預(yù)測速度與實際速度之間的差異比傳統(tǒng)的手工模型降低了50%。此外,他們表明該模型的錯誤率為10%,而Intel性能預(yù)測模型在多個不同領(lǐng)域的各種基本塊上的錯誤率為20%。

該工具現(xiàn)在使人們可以更輕松地快速了解任何新芯片架構(gòu)的性能速度。例如,特定領(lǐng)域的體系結(jié)構(gòu),例如Google專門用于神經(jīng)網(wǎng)絡(luò)的新型Tensor處理單元,目前正在構(gòu)建中,但并未得到廣泛理解。 如果要在某種新架構(gòu)上訓(xùn)練模型,只需從該架構(gòu)收集更多數(shù)據(jù),通過探查器運行它,使用該信息來訓(xùn)練模型,從而就有了一個預(yù)測性能的模型。

接下來,研究人員將通過這樣的神經(jīng)網(wǎng)絡(luò)模型研究使人工智能模型可解釋的方法。人工智能機器學(xué)習在很大程度上是一個黑匣子,因此尚不清楚為什么特定的模型會做出某種預(yù)測。這樣的模型指示一個處理器要執(zhí)行一個基本塊需要10個周期,從而有可能設(shè)法找出其原因。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103648
  • 微處理器
    +關(guān)注

    關(guān)注

    11

    文章

    2383

    瀏覽量

    84194
  • 計算機芯片
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    3696
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)
    的頭像 發(fā)表于 07-10 16:36 ?181次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機 Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計算機提升了約 30 倍。這臺新的超級計算機將在 NVIDIA Vera Rubin 架構(gòu)上
    的頭像 發(fā)表于 06-12 15:39 ?415次閱讀

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    ,是rvct3.1還是rvct4.0?如何把rvct編譯器集成到ide中? 2、RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?
    發(fā)表于 05-08 07:49

    CPU的各種指令和執(zhí)行流程

    在集成電路設(shè)計中,CPU的指令是指計算機中央處理單元(CPU)用來執(zhí)行計算任務(wù)的基本操作指令集。這些指令是CPU能夠理解并執(zhí)行的二進制代碼,
    的頭像 發(fā)表于 04-18 11:24 ?839次閱讀

    部署計算機運行 LabVIEW 應(yīng)用程序時出現(xiàn)以下錯誤: “缺少外部函數(shù) dll...”解決辦法

    如果你既有 DLL 文件,也有頭 (.h) 文件,那么可以使用共享庫批量生成VI,不用再一個一個使用“調(diào)用庫函數(shù)節(jié)點”來調(diào)用DLL,源代碼運行是沒有問題,一旦生成應(yīng)用程序報錯缺失外部函數(shù)或者外部函數(shù)
    發(fā)表于 04-01 19:10

    Quantinuum“Reimei”量子計算機在RIKEN正式運行

    )成功安裝并全面投入運行。 此次合作中,RIKEN為“Reimei”量子計算機提供了世界級的基礎(chǔ)設(shè)施,包括為其量身定制的設(shè)計、準備及交付工作。這一里程碑式的成就不僅標志著Quantinuum在量子計算領(lǐng)域的持續(xù)突破,也預(yù)示著未來
    的頭像 發(fā)表于 02-17 10:21 ?467次閱讀

    BU-67121W實驗室航空電子接口計算機North Hills

    可以在BU-67121W上輕松創(chuàng)建嵌入式軟件,實現(xiàn)MIL-STD-1553、ARINC 429和以太網(wǎng)接口之間的數(shù)據(jù)自動轉(zhuǎn)發(fā)。獨立模式:允許BU-67121W作為用戶可編程的計算機系統(tǒng)獨立運行。
    發(fā)表于 02-11 09:26

    飛利浦出售計算機芯片子公司Xiver

    近日,據(jù)Xiver公司首席執(zhí)行官透露,醫(yī)療技術(shù)領(lǐng)域的知名企業(yè)飛利浦已正式將其計算機芯片子公司Xiver出售。這一消息引起了業(yè)界的廣泛關(guān)注。 據(jù)了解,此次收購由荷蘭商人Cees Meeuwis領(lǐng)導(dǎo)
    的頭像 發(fā)表于 01-09 15:55 ?619次閱讀

    工業(yè)中使用哪種計算機?

    使其成為工廠、倉庫和其他要求苛刻的工業(yè)環(huán)境的理想選擇。通過提供高性能和可靠性,工業(yè)計算機可確保高效、連續(xù)的運行。工業(yè)計算機的類型在工業(yè)環(huán)境中,人們使用各種專用
    的頭像 發(fā)表于 11-29 14:07 ?715次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機</b>?

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設(shè)備之間以及計算機各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設(shè)備和軟件程序。它在
    的頭像 發(fā)表于 10-14 14:02 ?1322次閱讀

    計算機系統(tǒng)的硬件組成和主要部件

    計算機系統(tǒng)的硬件組成是計算機運行的基礎(chǔ),它包含了多個關(guān)鍵部件,這些部件相互協(xié)作,共同實現(xiàn)計算機各種功能。
    的頭像 發(fā)表于 09-10 11:41 ?6925次閱讀

    計算機程序的三種基本控制結(jié)構(gòu)是什么

    計算機程序的三種基本控制結(jié)構(gòu)是: 順序結(jié)構(gòu)(Sequence Structure) :順序結(jié)構(gòu)是最基本的控制結(jié)構(gòu),也是最簡單的結(jié)構(gòu)。它按照程序中語句的書寫順序,自上而下地依次執(zhí)行,即每
    的頭像 發(fā)表于 09-04 17:00 ?3175次閱讀

    計算機進行程序控制工作的基本原理是怎樣的

    計算機程序控制是計算機科學(xué)中的一個核心概念,它涉及到計算機如何根據(jù)預(yù)設(shè)的指令序列執(zhí)行任務(wù)。 1. 計算機
    的頭像 發(fā)表于 09-04 16:57 ?1540次閱讀

    微處理器如何控制計算機系統(tǒng)

    微處理器,作為計算機系統(tǒng)的核心部件,承擔著控制整個計算機系統(tǒng)運行的重要任務(wù)。它不僅是計算機的運算中心,還是控制中心,負責執(zhí)行程序指令、處理數(shù)
    的頭像 發(fā)表于 08-22 14:21 ?984次閱讀

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學(xué)習

    ARMxy ARM嵌入式計算機BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達一萬億次的浮點運算,這為復(fù)雜的圖像處理和深度學(xué)習任務(wù)提供了充足的計算資源。在產(chǎn)品缺陷檢測領(lǐng)域
    的頭像 發(fā)表于 08-20 11:53 ?857次閱讀
    ARMxy ARM嵌入式<b class='flag-5'>計算機</b>搭載 1 TOPS NPU支持深度<b class='flag-5'>學(xué)習</b>