chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹Armv9.5-A中Arm架構(gòu)的最新特性

冬至子 ? 來源:Martin Weidmann ? 作者:Martin Weidmann ? 2023-10-11 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能AI)的崛起和安全威脅加劇,計算的需求持續(xù)加強。因此,世界上各種設(shè)備核心的基礎(chǔ)計算架構(gòu)的持續(xù)演進顯得尤為重要。這就是為什么我們的工程團隊向Arm架構(gòu)中添加新的功能和技術(shù),然后軟件團隊確保軟件盡可能無縫地利用這些未來的功能和技術(shù)。

Arm架構(gòu)是怎樣開發(fā)的

Arm每年發(fā)布對Arm指令集架構(gòu)(ISA)的更新,這些更新是與Arm生態(tài)系統(tǒng)的多樣化合作伙伴共同創(chuàng)建的。該過程涉及芯片合作伙伴、操作系統(tǒng)供應(yīng)商和OEMs、Arm的內(nèi)部工程團隊和標準制定機構(gòu)。

經(jīng)過嚴格規(guī)劃的ISA可以確保軟件在新舊硬件上繼續(xù)工作很多年。Arm與Linaro以及其他眾多合作伙伴緊密合作,以便最廣泛使用的軟件上游社區(qū)(例如Linux內(nèi)核和發(fā)行版)可以利用Arm ISA,以幫助提供全球最廣泛的開發(fā)者生態(tài)系統(tǒng)。

每年九月,我們發(fā)布一篇博客,討論當年A-Profile架構(gòu)的關(guān)鍵更新。然后我們通過開發(fā)者網(wǎng)頁發(fā)布完整的指令集和系統(tǒng)寄存器文檔。

完整的Arm架構(gòu)參考手冊(Arm ARM)也每年更新一次。預(yù)計將在2024年初發(fā)布包含2023擴展的更新。在2023年和2024年,“Learn the Architecture”頁面也將更新。

Architecture 2023 image 1.png

發(fā)布博客和文檔只是部署新架構(gòu)的第一步。下一步我們將和生態(tài)系統(tǒng)伙伴合作,確保一旦硬件可用,開源軟件就能立即利用這一功能。

2023年,Arm引入新功能,以支持我們持續(xù)關(guān)注的人工智能(AI)、機器學(xué)習(xí)(ML)和安全性。讓安全的AI無處不在是Arm架構(gòu)的關(guān)鍵優(yōu)先任務(wù),神經(jīng)網(wǎng)絡(luò)(NNs)的訓(xùn)練對AI的持續(xù)發(fā)展和進步至關(guān)重要。這就是為什么2023年的架構(gòu)擴展包括FP8的新8位浮點格式的支持,此格式已在NNs中迅速被采納。在安全性方面,我們正在添加Checked Pointer Arithmetic,該功能基于Arm Memory Tagging Extension (MTE),允許開發(fā)人員快速檢測內(nèi)存安全性違規(guī),從而在應(yīng)用開發(fā)過程中節(jié)省成本和時間。

之前對A-Profile架構(gòu)的更新的詳細信息可以在這里找到:2014、2015、2016、2017、2018、2019、2020、2021和2022。

讓我們看看今年增加了哪些新功能。

Floating Point 8 (FP8)

2022年,Arm、Intel 和 Nvidia 宣布了他們在FP8上的合作,這是一個交換格式,允許軟件生態(tài)系統(tǒng)輕松地共享NN模型,并支持AI計算能力的持續(xù)進步。作為2023年擴展的一部分,SME2、SVE2 和 Advanced SIMD (Neon) 增加了對FP8的支持。

FP8支持兩種數(shù)據(jù)格式:E5M2 和 E4M3。這兩種格式在精度和范圍之間提供了不同的權(quán)衡。
image.png

由FPMR寄存器控制選擇使用那種格式??梢詾橐粭l指令的不同輸入選擇不同的格式,從而有效地處理不同格式的數(shù)據(jù)集。我們堅信,行業(yè)共創(chuàng)的FP8帶來的好處,使開發(fā)者能夠集中精力在真正重要的創(chuàng)新和差異化上。我們很興奮地看到FP8如何推動未來的AI發(fā)展.

實時遷移

實時遷移是將虛擬機(VM)從一個主機移動到另一個主機的過程,同時保留其可用性和狀態(tài)。高效的實時遷移支持是大規(guī)模數(shù)據(jù)中心管理的重要工具。

image.png

為了實現(xiàn)實時遷移,hypervisor需要在VM仍在舊主機上運行時將頁面復(fù)制到新主機。這通常需要一個迭代過程,因為VM可能會“弄臟”已經(jīng)被復(fù)制的頁面。解決這個問題有不同的方法,但它們都必須面對三個挑戰(zhàn):

記錄(Recording):創(chuàng)建VM寫入(弄臟)的頁面的記錄。
調(diào)查(Surveying):處理記錄,以確定哪些頁面需要重新復(fù)制。
清理(Cleaning):在每次迭代上重置記錄機制。

2023年的擴展引入了新特性,幫助優(yōu)化這三個過程。

FEAT_HDBSS增加了記錄被弄臟的stage 2頁面或塊日志的能力。這種機制減少了記錄成本,因為內(nèi)存管理單元(MMU)可以有效地創(chuàng)建日志,而不中斷VM的執(zhí)行。該日志還減少了調(diào)查成本,因為生成的數(shù)據(jù)是hypervisor可以高效使用的格式。

image.png

為了解決清理成本,F(xiàn)EAT_HACDBS為清理 stage 2頁表中的臟狀態(tài)增加了一個加速器。該引擎使用臟頁面的日志來定位需要更新的stage 2頁表描述符。

這些特性一起為實時遷移帶來顯著的性能和效率提升。

Checked Pointer Arithmetic 檢驗過的指針運算

AArch64支持的特性可以重新利用保存地址的寄存器的高位。例如,Armv8.0-A中引入的Tagged Pointers和Armv8.5-A中引入的MTE。

軟件經(jīng)常需要操作指針,例如給基址加上一個偏移量。這通常使用常規(guī)的算術(shù)操作來完成,如加或減。地址計算上的溢出可能導(dǎo)致非地址位被損壞。例如,如果正在使用MTE,地址操作可能導(dǎo)致存儲在指針中的MTE Tag被更改。損壞的MTE Tag可能導(dǎo)致處理器無法檢測到內(nèi)存安全違規(guī),如下所示:

image.png

2023年的擴展引入了專門用于操作指針的新指令。這些指令包含多個指針特定的檢查,包括檢查bits[63:56]是否被修改,并防止溢出。尋址模式的加載和存儲指令也可以被配置為保留bits[63:56]。

取之前的MTE例子,新的特性允許處理器檢測指針的前8位是否已經(jīng)被修改。這意味著,如果MTE標簽被損壞,它將被報告回到軟件中。

其他功能

2023年擴展部分引入的其他增強功能包括:

  • 支持使用PC(程序計數(shù)器)和SP(當前選擇的堆棧指針)的組合作為生成或檢查指針認證代碼時的modifier 。
  • 支持具備Realm Management Extension (RME) 的設(shè)計,在Granule Protection Tables中支持non secure only,并具有禁用某些Physical Address Spaces (PAS)的能力。
  • EL3配置寫入陷阱。
  • 斷點支持地址范圍和mismatch觸發(fā),而無需鏈接。
  • 支持從EL3有效地將SErrors委托給EL2或EL1。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5620

    瀏覽量

    130423
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4842

    瀏覽量

    108183
  • 人工智能
    +關(guān)注

    關(guān)注

    1820

    文章

    50335

    瀏覽量

    266971
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    67

    文章

    8565

    瀏覽量

    137226
  • ARM架構(gòu)
    +關(guān)注

    關(guān)注

    15

    文章

    187

    瀏覽量

    39348
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于ARM Cortex-M3架構(gòu)用于各類通用微控制器應(yīng)用的指紋識別芯片-P1032BF1

    ARM Cortex-M3是一款專為嵌入式系統(tǒng)優(yōu)化的32位RISC(精簡指令集)處理器內(nèi)核,基于 ?ARMv7-M架構(gòu)?,廣泛應(yīng)用于STM32、GD32等微控制器。
    的頭像 發(fā)表于 04-21 09:21 ?60次閱讀
    基于<b class='flag-5'>ARM</b> Cortex-M3<b class='flag-5'>架構(gòu)</b>用于各類通用微控制器應(yīng)用的指紋識別芯片-P1032BF1

    STR71xF ARM7TDMI? 32位MCU深度解析:特性、架構(gòu)與應(yīng)用指南

    STR71xF ARM7TDMI? 32位MCU深度解析:特性、架構(gòu)與應(yīng)用指南 在電子工程師的日常工作,選擇一款合適的微控制器(MCU)至關(guān)重要。ST公司的STR71xF系列
    的頭像 發(fā)表于 04-17 15:15 ?205次閱讀

    TAS3103A數(shù)字音頻處理器:特性、架構(gòu)與應(yīng)用詳解

    TAS3103A數(shù)字音頻處理器:特性架構(gòu)與應(yīng)用詳解 引言 在當今數(shù)字化音頻處理領(lǐng)域,一款高性能、可配置的音頻處理器至關(guān)重要。德州儀器(Texas Instruments)的TAS3103A
    的頭像 發(fā)表于 02-27 16:25 ?291次閱讀

    ARMv8體系結(jié)構(gòu)入門(附流程圖+腦圖)

    ARMv8是 手機、平板、甚至部分服務(wù)器里處理器的“底層設(shè)計藍圖” ——它是ARM公司推出的第一代支持64位計算的架構(gòu),能讓設(shè)備同時用大內(nèi)存、跑新程序和舊程序。下面用“大白話+圖”拆解它的核心邏輯
    的頭像 發(fā)表于 01-06 07:03 ?1134次閱讀
    <b class='flag-5'>ARMv</b>8體系結(jié)構(gòu)入門(附流程圖+腦圖)

    深入解析RA2A2微控制器:特性、電氣參數(shù)與設(shè)計要點

    功耗、豐富外設(shè)和出色的安全特性,成為眾多成本敏感和低功耗應(yīng)用的理想選擇。本文將深入剖析RA2A2的各項特性、電氣參數(shù)以及設(shè)計過程的注意事項。 文件下載: Renesas Electr
    的頭像 發(fā)表于 12-29 15:15 ?630次閱讀

    芯源MCU架構(gòu)是不是基本都是ARM架構(gòu)?還有其他的架構(gòu)嗎?

    芯源MCU架構(gòu)是不是基本都是ARM架構(gòu)?還有其他的架構(gòu)嗎?
    發(fā)表于 11-20 06:21

    Arm Flexible Access方案引入Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺(專為物聯(lián)網(wǎng)及邊緣 AI 工作負載優(yōu)化)將納入 Arm Flexible Access 方案,助力創(chuàng)新者以低成本、便捷的方式,在邊緣側(cè)獲得先進的 AI 性能與安全保障
    的頭像 發(fā)表于 10-29 15:27 ?1202次閱讀

    什么是ARM架構(gòu)?你需要知道的一切

    深入探討ARM?架構(gòu)的真正含義、其核心特性、與NVIDIAJetson?等平臺的差異,以及與傳統(tǒng)x86系統(tǒng)的比較。什么是ARM架構(gòu)
    的頭像 發(fā)表于 09-11 14:48 ?1691次閱讀
    什么是<b class='flag-5'>ARM</b><b class='flag-5'>架構(gòu)</b>?你需要知道的一切

    同一水平的 RISC-V 架構(gòu)的 MCU,和 ARM 架構(gòu)的 MCU 相比,運行速度如何?

    ARM 架構(gòu)與 RISC-V 架構(gòu)的 MCU 在同一性能水平下的運行速度對比,需從架構(gòu)設(shè)計原點、指令集特性及實際測試數(shù)據(jù)展開剖析。以
    的頭像 發(fā)表于 07-02 10:29 ?1732次閱讀
    同一水平的 RISC-V <b class='flag-5'>架構(gòu)</b>的 MCU,和 <b class='flag-5'>ARM</b> <b class='flag-5'>架構(gòu)</b>的 MCU 相比,運行速度如何?

    在IAR Embedded Workbench for Arm中使用Arm Cortex-R52 NEON

    隨著嵌入式系統(tǒng)變得越來越智能,對嵌入式處理器的要求也越來越高。為了更好應(yīng)對汽車、醫(yī)療和工業(yè)機器人等領(lǐng)域?qū)η度胧教幚砥鞯囊螅?b class='flag-5'>Arm推出了采用Armv8-R架構(gòu)的Cortex-R52。Cortex-R52相對之前的處理器引入了很多
    的頭像 發(fā)表于 06-05 09:57 ?2069次閱讀
    在IAR Embedded Workbench for <b class='flag-5'>Arm</b>中使用<b class='flag-5'>Arm</b> Cortex-R52 NEON

    Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀

    :異構(gòu)集成與 AI 優(yōu)化 Arm Niva 基于 ? Armv9.2 架構(gòu) ? 設(shè)計,整合了 Cortex-X 超大核、Cortex-A 高效核及
    的頭像 發(fā)表于 05-29 09:56 ?1887次閱讀

    Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀

    子系統(tǒng)(CSS)? ? 在移動端的落地形態(tài),Lumex 旨在通過高度集成化的軟硬件方案,解決移動設(shè)備在 AI 性能、能效比與開發(fā)效率上的挑戰(zhàn)。以下從技術(shù)架構(gòu)、性能突破、應(yīng)用場景、生態(tài)系統(tǒng)及戰(zhàn)略價值展開分析: 一、技術(shù)架構(gòu):異構(gòu)計算與能效優(yōu)化 Lumex 基于 ?
    的頭像 發(fā)表于 05-29 09:54 ?4565次閱讀

    Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀

    汽車市場的落地形態(tài),Zena 旨在解決汽車智能化轉(zhuǎn)型的算力需求、開發(fā)效率與功能安全挑戰(zhàn)。以下從技術(shù)架構(gòu)、性能優(yōu)勢、應(yīng)用場景、生態(tài)系統(tǒng)及戰(zhàn)略意義展開分析: 一、技術(shù)架構(gòu):異構(gòu)集成與功能安全強化
    的頭像 發(fā)表于 05-29 09:51 ?2701次閱讀

    ARM最強超大核Cortex-X925與小米玄戒O1的深度解析

    ARM Cortex-X925:架構(gòu)革新與性能巔峰的全新標桿 作為ARM迄今最強大的CPU核心,Cortex-X925基于Armv9.2-A架構(gòu)
    的頭像 發(fā)表于 05-23 15:29 ?4009次閱讀

    Arm架構(gòu)何以成為現(xiàn)代計算的基礎(chǔ)

    2025 年 4 月,Arm 架構(gòu)迎來了問世 40 周年。這個始于英國劍橋一隅、懷揣雄心壯志的項目,如今已成為全球廣泛采用的計算架構(gòu)。從傳感器、智能手機、筆記本電腦,到汽車、數(shù)據(jù)中心等諸多領(lǐng)域,有數(shù)十億設(shè)備如今運行在
    的頭像 發(fā)表于 05-20 10:02 ?1367次閱讀