chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm架構(gòu)是如何開發(fā)的

Arm社區(qū) ? 來源:Arm社區(qū) ? 2023-11-23 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 架構(gòu)與技術(shù)部產(chǎn)品管理總監(jiān) Martin Weidmann

隨著人工智能 (AI) 的興起和安全威脅的加劇,計算需求不斷提高。全球各種設(shè)備所依賴的基礎(chǔ)計算架構(gòu)也必須持續(xù)向前推進。為此,我們的工程團隊不斷地在應用廣泛的 Arm 架構(gòu)中加入新的功能和技術(shù),同時我們的軟件團隊也在努力讓軟件能夠順利地適配這些未來的功能和技術(shù)。

Arm 架構(gòu)是如何開發(fā)的

Arm 每年都會發(fā)布 Arm 指令集架構(gòu) (ISA) 的更新,這些更新是通過與 Arm 生態(tài)系統(tǒng)中的各類合作伙伴合作參與創(chuàng)建的。該流程涉及芯片合作伙伴、操作系統(tǒng)供應商、OEM 廠商,以及 Arm 內(nèi)部的工程團隊和多家標準組織。

經(jīng)過精心設(shè)計的 ISA 可確保軟件在未來數(shù)年內(nèi)持續(xù)兼容新舊硬件。Arm 與 Linaro 等眾多合作伙伴緊密協(xié)作,讓諸如 Linux 內(nèi)核和發(fā)行版等廣泛使用的軟件上游社區(qū)能支持 Arm ISA,以便建立龐大的開發(fā)者生態(tài)系統(tǒng)。

每年九月,我們都會發(fā)表一篇技術(shù)博客,分享該年度對 A-Profile 架構(gòu)所作的一些重要增添。同時,我們也會在 Arm 開發(fā)者網(wǎng)站上發(fā)布完整的指令集和系統(tǒng)寄存器文檔[1]。

完整的 Arm 架構(gòu)參考手冊[2] (Arm Architecture Reference Manual, Arm ARM) 也會每年更新一次。預計 2024 年初會發(fā)布包含 2023 年擴展內(nèi)容的更新版?!皩W習架構(gòu) (Learn the Architecture)”[3]頁面同樣會在 2023 年和 2024 年更新。

技術(shù)博客和文檔的發(fā)布只是部署新架構(gòu)的一小步。接下來我們還要同生態(tài)合作伙伴一起努力,確保一旦硬件準備就緒,開源軟件就能即刻支持新的架構(gòu)功能。

2023 年,Arm 推出新特性以加強對人工智能 (AI)、機器學習 (ML) 和安全性的支持。Arm 架構(gòu)的首要任務之一是讓安全的 AI 無處不在,而神經(jīng)網(wǎng)絡 (NN) 的訓練是 AI 不斷進步和發(fā)展的關(guān)鍵。因此,2023 年的架構(gòu)擴展增加了已在神經(jīng)網(wǎng)絡中廣泛使用的新八位浮點格式,名為 FP8。為了提高安全性,我們還增加了“經(jīng)檢查的指令運算 (Checked Pointer Arithmetic)”功能,該功能基于 Arm 內(nèi)存標記擴展 (MTE)[4] 的現(xiàn)有支持而打造,可以幫助開發(fā)者快速發(fā)現(xiàn)內(nèi)存安全違規(guī),節(jié)省應用開發(fā)的成本和時間。

以下為今年新增的功能:

FP8

2022 年,Arm、Intel 和 Nvidia 宣布針對 FP8 展開合作。FP8 是一種交換格式,可以讓軟件生態(tài)系統(tǒng)輕松共享神經(jīng)網(wǎng)絡模型,并讓 AI 計算能力不斷提高。作為 2023 年擴展的一部分,SME2、SVE2 和 Advanced SIMD (Neon) 增加了對 FP8 的支持。

FP8 支持兩種數(shù)據(jù)格式:E5M2 和 E4M3。這兩種格式在精度和范圍上有不同的取舍。

aa8b2f5a-7855-11ee-939d-92fbcf53809c.png

使用哪種格式由 FPMR 寄存器中的字段選擇。對于一條指令的不同輸入,可以選擇不同的格式,從而有效地處理各種格式的數(shù)據(jù)集。我們堅信,圍繞八位浮點格式的行業(yè)共創(chuàng)將帶來一系列好處,同時可使開發(fā)者專注于真正重要的創(chuàng)新和差異化。我們非常高興看到 FP8 將推動未來 AI 的發(fā)展。

熱遷移

熱遷移是指將虛擬機 (VM) 從一臺主機移動到另一臺主機上,而不影響其可用性和狀態(tài)。能夠高效地進行熱遷移對于大規(guī)模數(shù)據(jù)中心管理而言非常重要。

為了實現(xiàn)熱遷移,虛擬機管理程序要在 VM 仍在舊主機上運行時,就把它所占用的頁面復制到新主機上。這個過程通常要反復進行幾次,因為 VM 可能會修改已經(jīng)復制的頁面。解決這個問題有不同的方法,但都要面對三項挑戰(zhàn):

記錄:記錄 VM 修改過(污染過)的頁面。

調(diào)查:根據(jù)記錄判斷哪些頁面需要重新復制。

清理:每次迭代時重置記錄機制。

2023 年的擴展增加了幾項功能,可以幫助優(yōu)化上述的三項挑戰(zhàn)。

FEAT_HDBSS 讓我們可以記錄日志,記錄 Stage 2 已被污染的頁面或塊。該機制解決了“記錄”成本問題,因為內(nèi)存管理單元 (MMU) 可以在不中斷 VM 執(zhí)行的情況下高效創(chuàng)建日志。日志也解決了“調(diào)查”成本問題,因為生成的數(shù)據(jù)是虛擬機管理程序可以有效使用的格式。

aad8ab18-7855-11ee-939d-92fbcf53809c.png

為了解決“清理”成本問題,F(xiàn)EAT_HACDBS 增加了一個加速器來清理 Stage 2 轉(zhuǎn)換表中的污染狀態(tài)。引擎利用污染頁面日志來定位需要更新的 Stage 2 轉(zhuǎn)換表描述符。

這些功能結(jié)合起來可以大幅提高熱遷移的性能和效率。

經(jīng)檢查的指令運算

AArch64 支持多項功能,這些功能讓我們可以重新利用保存地址的寄存器高位。例如,Armv8.0-A 中引入的標記指針 (Tagged Pointer) 和 Armv8.5-A 中引入的 MTE。

軟件經(jīng)常需要操作指針,比如給一個基地址加上一個偏移量。這通常是用加法或減法等常規(guī)算術(shù)運算來完成的。如果地址計算出現(xiàn)溢出,就可能會破壞寄存器中非地址位的信息。例如,如果使用 MTE,地址操作則可能會改變指針中存儲的標記。損壞的標記可能會導致處理器無法檢測到內(nèi)存安全違規(guī),如下所示:

aadcd8be-7855-11ee-939d-92fbcf53809c.png

2023 年的擴展引入了專門用于指針操作的新指令。這些指令包含多種針對指針的檢查,包括檢查 bits[63:56] 是否被修改并防止溢出。使用 尋址模式的內(nèi)存加載和存儲指令也可以配置為保留 bits[63:56]。

以前面的 MTE 為例,新功能讓處理器能夠檢測指針的前八位是否已被修改。這意味著,如果 MTE 標記損壞,則會向軟件發(fā)出報告。

其他功能

其他新引入的增強功能包括:

當生成或檢查指針驗證 (PAC) 碼時,支持組合使用程序計數(shù)器 (Program Counter, PC) 和當前選擇的堆棧指針 (Stack Pointer, SP) 作為修飾符。

支持啟用了機密領(lǐng)域管理擴展 (RME)[5] 的設(shè)計,可以在 Granule Protection Tables 中支持 non-secure only,也可以禁用某些物理地址空間 (PAS)。

EL3 配置寫入陷阱。

斷點支持地址范圍和 mismatch 觸發(fā),而無需鏈接。

支持將 SError 從 EL3 高效委派給 EL2 或 EL1 處理。

在接下來的幾個月,Arm 將與合作伙伴一起努力,確保軟件生態(tài)系統(tǒng)能夠在未來處理器上市后盡快利用發(fā)揮這些功能的優(yōu)勢。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9452

    瀏覽量

    385766
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37050

    瀏覽量

    290104
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49504

    瀏覽量

    258239
  • ARM架構(gòu)
    +關(guān)注

    關(guān)注

    15

    文章

    184

    瀏覽量

    38815

原文標題:Arm A-Profile 架構(gòu) 2023 擴展

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    FPGA+DSP/ARM架構(gòu)開發(fā)與應用

    自中高端FPGA技術(shù)成熟以來,F(xiàn)PGA+DSP/ARM架構(gòu)的硬件設(shè)計在眾多工業(yè)領(lǐng)域得到廣泛應用。例如無線通信、圖像處理、工業(yè)控制、儀器測量等。
    的頭像 發(fā)表于 10-15 10:39 ?870次閱讀
    FPGA+DSP/<b class='flag-5'>ARM</b><b class='flag-5'>架構(gòu)</b><b class='flag-5'>開發(fā)</b>與應用

    什么是ARM架構(gòu)?你需要知道的一切

    從智能手機到工業(yè)邊緣計算機,ARM?架構(gòu)為全球數(shù)十億臺設(shè)備提供動力。ARM?以其效率優(yōu)先的設(shè)計和靈活的許可模式而聞名,已迅速從移動處理器擴展到人工智能邊緣計算、工業(yè)控制器,甚至數(shù)據(jù)中心。本文我們將
    的頭像 發(fā)表于 09-11 14:48 ?502次閱讀
    什么是<b class='flag-5'>ARM</b><b class='flag-5'>架構(gòu)</b>?你需要知道的一切

    一文了解Arm神經(jīng)超級采樣 (Arm Neural Super Sampling, Arm NSS) 深入探索架構(gòu)、訓練和推理

    本文將從訓練、網(wǎng)絡架構(gòu)到后處理和推理等方面,深入探討 Arm 神經(jīng)超級采樣 (Arm Neural Super Sampling, Arm NSS) 的工作原理,希望為機器學習 (ML
    的頭像 發(fā)表于 08-14 16:11 ?2245次閱讀

    一文回顧 Arm架構(gòu) 40 年的創(chuàng)新歷程

    從 1980 年代為 BBC Micro 打造的低功耗 ARM1 處理器,到如今的人工智能 (AI) 設(shè)備,Arm 架構(gòu)始終立于世界上最具變革性技術(shù)的核心。40 年來,Arm
    的頭像 發(fā)表于 07-09 18:41 ?2262次閱讀
    一文回顧 <b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b> 40 年的創(chuàng)新歷程

    同一水平的 RISC-V 架構(gòu)的 MCU,和 ARM 架構(gòu)的 MCU 相比,運行速度如何?

    ARM 架構(gòu)與 RISC-V 架構(gòu)的 MCU 在同一性能水平下的運行速度對比,需從架構(gòu)設(shè)計原點、指令集特性及實際測試數(shù)據(jù)展開剖析。以 ARM
    的頭像 發(fā)表于 07-02 10:29 ?928次閱讀
    同一水平的 RISC-V <b class='flag-5'>架構(gòu)</b>的 MCU,和 <b class='flag-5'>ARM</b> <b class='flag-5'>架構(gòu)</b>的 MCU 相比,運行速度如何?

    Arm架構(gòu)何以成為現(xiàn)代計算的基礎(chǔ)

    2025 年 4 月,Arm 架構(gòu)迎來了問世 40 周年。這個始于英國劍橋一隅、懷揣雄心壯志的項目,如今已成為全球廣泛采用的計算架構(gòu)。從傳感器、智能手機、筆記本電腦,到汽車、數(shù)據(jù)中心等諸多領(lǐng)域,有數(shù)十億設(shè)備如今運行在
    的頭像 發(fā)表于 05-20 10:02 ?744次閱讀

    Arm助力開發(fā)者加速遷移至Arm架構(gòu)云平臺 Arm云遷移資源分享

    隨著基于 Arm 架構(gòu)的云實例日益擴展,越來越多的用戶正從傳統(tǒng)平臺遷移至 Arm 平臺上。
    的頭像 發(fā)表于 04-09 18:23 ?920次閱讀

    Arm推出GitHub Copilot新擴展程序,助力快速遷移至Arm架構(gòu)服務器

    者工具之一,此次推出的擴展程序能讓數(shù)百萬Copilot用戶更容易地訪問Arm?架構(gòu)的技術(shù),并為開發(fā)者提供更友好的體驗。此外,此次發(fā)布亦首次為全球開發(fā)者免費提供了完整的
    的頭像 發(fā)表于 03-04 16:07 ?765次閱讀
    <b class='flag-5'>Arm</b>推出GitHub Copilot新擴展程序,助力快速遷移至<b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b>服務器

    Arm與RISC-V架構(gòu)的優(yōu)劣勢比較

    關(guān)于Arm與RISC-V的討論涉及多個層面。雖然多種因素共同作用于這些架構(gòu)的整體性能,但每種架構(gòu)都有其最適合的幾類主要應用場景。 Arm 長期以來,專有技術(shù)往往意味著高昂的許可費用,
    發(fā)表于 02-01 22:30

    一文詳解Arm架構(gòu)Armv9.6-A中的最新功能

    計算的需求,包括 AI 的興起、機器學習 (ML) 和芯粒 (chiplet) 技術(shù)的使用,以及應對高級安全威脅。持續(xù)創(chuàng)新確保了 Arm 架構(gòu)的普及性、普適性能、出色能效、安全性和開發(fā)者靈活性。
    的頭像 發(fā)表于 12-17 10:22 ?4244次閱讀
    一文詳解<b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b>Armv9.6-A中的最新功能

    為什么開發(fā)者都往Arm平臺遷移

    開發(fā)者深知,構(gòu)建既能高效擴展又能控制成本的應用至關(guān)重要。云技術(shù)日新月異,其背后的技術(shù)也在不斷發(fā)展。近年來,越來越多的公司意識到,將其應用從 x86 架構(gòu)遷移到 Arm 架構(gòu)能夠帶來諸多
    的頭像 發(fā)表于 12-17 10:19 ?699次閱讀

    英偉達進軍ARM架構(gòu)CPU市場,預計2025年推出新產(chǎn)品線

    近日,英偉達公司傳出了一則令人矚目的消息:該公司正在積極開發(fā)一款基于ARM架構(gòu)的新型CPU。這一消息不僅證實了之前業(yè)界關(guān)于英偉達ARM PC CPU的傳言,更展示了英偉達在CPU市場方
    的頭像 發(fā)表于 11-11 15:33 ?1096次閱讀

    ARM開發(fā)板與FPGA的結(jié)合應用

    一、引言 ARM開發(fā)板是一種基于ARM架構(gòu)的嵌入式開發(fā)平臺,具有高性能、低功耗的特點。FPGA是一種可編程的數(shù)字電路,可以根據(jù)需要配置不同的
    的頭像 發(fā)表于 11-05 11:42 ?1901次閱讀

    ARM開發(fā)板與樹莓派的比較

    ARM開發(fā)板和樹莓派都是基于ARM架構(gòu)的單板計算機,它們在教育、工業(yè)控制、物聯(lián)網(wǎng)等領(lǐng)域有著廣泛的應用。 硬件配置 ARM
    的頭像 發(fā)表于 11-05 11:11 ?1731次閱讀

    Arm推出GitHub平臺AI工具,簡化開發(fā)者AI應用開發(fā)部署流程

    專為 GitHub Copilot 設(shè)計的 Arm 擴展程序,可加速從云到邊緣側(cè)基于 Arm 平臺的開發(fā)Arm 原生運行器為部署云原生、Windows on
    的頭像 發(fā)表于 10-31 18:51 ?3572次閱讀