chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

RISC-V迎來關鍵拐點

穎脈Imgtec ? 2026-03-05 15:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:編譯自semiwiki


RVA23 標志著主流 CPU 性能擴展方式的一個轉折點。它強制要求使用 RISC-V 向量擴展 (RVV),從而將結構化、顯式并行計算提升到與標量執(zhí)行相同的架構地位。向量計算不再是附加在高負載運算核心上的可選加速器,而是軟件可以依賴的基礎功能。

RVA23 并非強制標量執(zhí)行實現(xiàn)確定性,而只是使確定性成為可能,因為標量部分不再負責吞吐量。向量單元顯式地處理并行工作,而標量核心則成為一個協(xié)調(diào)器,在不犧牲性能的前提下,實現(xiàn)簡單、可預測和低功耗。

要理解這種轉變?yōu)楹稳绱酥匾环粱仡櫼幌峦茰y執(zhí)行是如何徹底主導高性能 CPU 設計的。它確實帶來了速度提升,但代價也越來越高——功耗、復雜性、驗證負擔和安全風險都在增加。RVA23 并非否定推測執(zhí)行,而是力求恢復平衡。它承認,可預測的、向量驅動的并行計算如今已成為提升性能的可靠主流途徑。

強制向量支持從根本上改變了軟件性能契約。編譯器、庫和應用程序現(xiàn)在可以假定每個兼容的核心都存在 RVV(資源向量向量)。優(yōu)化策略從“讓 CPU 猜測”轉向顯式、結構化的并行處理。工具鏈必須能夠可靠地生成向量代碼。數(shù)學和 DSP 庫可以減少或消除標量回退。應用程序開發(fā)人員獲得了一個可預測的模型,用于擴展循環(huán)和數(shù)據(jù)并行工作負載。

這種文化轉變意義重大:并行性不再是硬件試圖推斷的東西,而是軟件直接表達的東西。對于硬件設計者而言,這種轉變雖然不同,但同樣意義深遠。向量單元現(xiàn)在是強制性的,但規(guī)范仍然保留了微架構的自由度。

實現(xiàn)者可以選擇通道寬度、流水線深度、指令發(fā)出策略和內(nèi)存設計。改變的是性能重心。設計者不再被迫完全依賴更深層次的推測——更大的分支預測器、更寬的重排序緩沖區(qū)和日益復雜的恢復機制——來保持競爭力。

相反,面積和功耗可以轉移到向量吞吐量和內(nèi)存帶寬上。對于曾經(jīng)需要復雜推測性機制的工作負載而言,配備強大向量引擎的更簡單的順序執(zhí)行內(nèi)核變得可行。

推測執(zhí)行并非一蹴而就,而是從放寬嚴格順序執(zhí)行限制的技術中逐步發(fā)展而來。1967 年,羅伯特·托馬蘇洛 (Robert Tomasulo) 在IBM System/360 Model 91上的工作引入了動態(tài)調(diào)度和寄存器重命名,使得指令可以亂序執(zhí)行而不違反程序語義。大約在同一時期,詹姆斯·桑頓 (James Thornton) 在CDC 6600中設計的記分板機制,使得流水線在遇到?jīng)_突時也能保持運行。這些機制本身并不進行推測,但它們消除了曾經(jīng)迫使處理器停頓的結構性障礙。一旦亂序執(zhí)行成為可能,推測便勢不可擋。

20世紀70年代末80年代初,詹姆斯·E·史密斯正式提出了分支預測的概念,將推測性操作建立在概率基礎之上。內(nèi)存不再是處理器被動等待的對象,而是需要預先獲取的對象。數(shù)據(jù)在確認需要之前就被提取出來。緩存也從局部性優(yōu)化器演變?yōu)槟軌蛭胀茰y性執(zhí)行過程中各種波動的緩沖區(qū)。

學術界也強化了這一方向。斯坦福大學和伯克利大學的指令級并行研究將推測視為前進的方向。約翰·亨尼西將推測定義 為一種在不放棄順序編程的前提下提高性能的方法。大衛(wèi)·帕特森闡述了“內(nèi)存墻”的概念,鼓勵采用更深層次的緩存和分層存儲。

業(yè)界紛紛效仿。英特爾奔騰Pro(P6)將具有深度緩存層次結構的推測性亂序執(zhí)行技術確立為主流CPU模板。IBM POWER和AMD Zen強化了這一模式:通過擴展緩沖、帶寬和內(nèi)存級并行性來支持日益增長的在執(zhí)行推測性工作量。每一代CPU都在擴展推測能力,而不是質(zhì)疑它。

隨著時間的推移,成本問題變得愈發(fā)清晰。在2014年國際計算機科學與技術大會(ISSCC)全體會議上,馬克·霍洛維茨指出,能源——而非晶體管密度或原始邏輯速度——已成為計算領域的主要制約因素。算術運算僅消耗幾個皮焦耳的能量。緩存訪問的成本要高出一個數(shù)量級。DRAM訪問的成本則要高出兩到三個數(shù)量級。數(shù)據(jù)傳輸而非計算,才是能源消耗的主要來源。

電壓調(diào)節(jié)停滯不前,頻率調(diào)節(jié)也達到了散熱極限。簡單地增加核心數(shù)已無法恢復以往的性能曲線。與此同時,末級緩存和寄存器文件體積龐大,其能耗開始與它們所服務的核心相當,甚至往往超過后者?,F(xiàn)代內(nèi)存層次結構并非獨立演進,而是與推測執(zhí)行協(xié)同發(fā)展。它們成為支撐大量進行中、不確定工作所需的框架。推測執(zhí)行旨在優(yōu)化程序運行的假象。內(nèi)存系統(tǒng)的存在正是為了維持這種假象,并在預測失敗時進行清理。

在 DRAM 層面上,Onur Mutlu展示了現(xiàn)代處理器如何通過干擾、行沖突和不可預測的訪問模式來給內(nèi)存系統(tǒng)帶來壓力——其中許多并非由已提交的計算驅動,而是由最終會被丟棄的推測驅動。

從這個角度來看,現(xiàn)代CPU內(nèi)存層次結構并非獨立演化而來,而是與推測性亂序執(zhí)行共同演化,成為支撐這種機制的物理基礎。推測性執(zhí)行的核心在于優(yōu)化一種錯覺——即通過預測未來執(zhí)行的線程,使單個順序線程的運行速度看起來更快。

相比之下,確定性執(zhí)行針對已知因素進行優(yōu)化。它將延遲視為可調(diào)度因素,而不是需要通過不斷增加帶寬來掩蓋的問題。推測性架構通過增加復雜性來彌補不確定性,而確定性架構則通過提高可預測性和持續(xù)吞吐量來提升性能。

推測并非不可避免。西摩·克雷的向量機證明,推測絕非唯一的出路。他們完全摒棄了推測,轉而依賴可預測的內(nèi)存步長模式、明確的向量長度和確定性調(diào)度。并行性直接暴露在硬件面前,而非通過猜測推斷,延遲也需要提前規(guī)劃,而不是試圖隱藏。

他們的內(nèi)存系統(tǒng)設計旨在實現(xiàn)穩(wěn)定、高吞吐量的訪問,而不是后來推測性架構所需的猜測和恢復行為。從這個意義上講,Cray 的方法更接近 RVV 的結構化、長度無關模型,而不是后來主導通用 CPU 的推測性超標量架構。

歷史上,推測編程之所以能夠勝出,是因為它保留了順序編程模型,并將軟件中斷降至最低。但這種成功也造成了路徑依賴。內(nèi)存層次結構為了提高推測吞吐量而進行了優(yōu)化,卻導致功耗、驗證復雜性和架構不透明性不斷增加。

人工智能、機器學習信號處理工作負載具有結構化特征,并且本質(zhì)上是數(shù)據(jù)并行的。它們的訪問模式通常是可知的,而非概率性的。在這些領域,顯式并行比推測性猜測更具優(yōu)勢。RVA23 通過強制使用 RVV,確保了硬件對這類工作負載的支持。結構化并行從可選擴展轉變?yōu)榧軜嫽€。這并沒有消除推測,而是消除了排他性。

諸如 Simplex Micro 探索的那種確定性、基于時間的調(diào)度方法等架構,現(xiàn)在可以將向量計算能力作為基礎。它們不再彌補推測性計算的低效,而是顯式地協(xié)調(diào)計算和內(nèi)存。性能的擴展取決于資源利用率和可預測性,而非推測深度。對于向量和矩陣工作負載而言,這與其說是一場革命,不如說是回歸到曾經(jīng)被推測性計算所取代的架構傳統(tǒng)。

RVA23 的意義遠不止于指令編碼。編譯器基礎設施可以假定支持向量。操作系統(tǒng)可以考慮向量資源進行調(diào)度。硬件實現(xiàn)可以優(yōu)化向量效率,而無需擔心生態(tài)系統(tǒng)是否會忽略它。三十年來,推測性技術獲得了持續(xù)的架構投資,而結構化并行技術卻沒有。

RVA23 改變了這一點。它并非強制放棄推測式架構,而是強制要求架構上的對等性。設計人員可以在適當?shù)那闆r下同時部署這兩種架構,但結構化并行不再是次要的。非此即彼的錯誤二元論——要么通過推測式架構擴展,要么接受性能下降——不再適用。

借助 RVA23,向量運算能力的不確定性降低,確定性方法能夠實現(xiàn)一流性能的疑慮減少,擴展性方面對推測計算的依賴也降低。不再僅僅依賴推測計算來實現(xiàn)擴展。如今的工作負載本身就是并行的,而非通過編譯器從順序代碼中巧妙提取而來。對于這類工作負載,推測計算的成本越來越大于其收益。

RVA23 并沒有終結投機時代,而是終結了投機壟斷。這種轉變——而非任何單一的技術特性——或許才是它對處理器架構最重要的貢獻。

參考鏈接:

https://semiwiki.com/ip/risc-v/367094-rva23-ends-speculations-monopoly-in-risc-v-cpus/

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20250

    瀏覽量

    252190
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11277

    瀏覽量

    224936
  • RISC-V
    +關注

    關注

    48

    文章

    2887

    瀏覽量

    52935
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RISC-V,正式崛起

    編譯自financialcontent全球半導體行業(yè)迎來里程碑式的變革:開源指令集架構(ISA)RISC-V已于2026年1月正式占據(jù)全球處理器市場25%的份額。這一里程碑標志著x86和Arm長期雙
    的頭像 發(fā)表于 01-16 15:17 ?628次閱讀
    <b class='flag-5'>RISC-V</b>,正式崛起

    新思科技全棧工具鏈助力RISC-V設計高效進階

    RISC-V 架構席卷全球的當下,新思科技(Synopsys)通過在整個硅生命周期開發(fā)工具、驗證平臺與定制 IP 方面的深厚積累,成為 RISC-V 生態(tài)中最為關鍵的“隱形推手”,在整個 R
    的頭像 發(fā)表于 12-17 10:29 ?730次閱讀
    新思科技全棧工具鏈助力<b class='flag-5'>RISC-V</b>設計高效進階

    躍昉科技亮相2025 RISC-V產(chǎn)業(yè)發(fā)展大會暨RDSA國際論壇

    2025年11月24日,珠海與澳門雙城聯(lián)動,迎來了一場全球RISC-V與人工智能領域的頂級盛會——“2025 RISC-V產(chǎn)業(yè)發(fā)展大會暨RDSA國際論壇”。
    的頭像 發(fā)表于 11-30 09:36 ?486次閱讀

    為什么RISC-V是嵌入式應用的最佳選擇

    最近RISC-V基金會在社交媒體上發(fā)文,文章說物聯(lián)網(wǎng)和嵌入式系統(tǒng)正在迅速發(fā)展,需要更高的計算性能、更低的功耗和人工智能。RISC-V是為未來而建的,包括超高效的MCU到高性能應用處理器,RISC-V使開發(fā)人員能夠設計以下解決方案
    的頭像 發(fā)表于 11-07 10:09 ?1603次閱讀

    普華基礎軟件亮相2025 RISC-V中國峰會

    此前,7月16日至18日,第五屆RISC-V中國峰會在上海盛大召開。普華基礎軟件副總經(jīng)理兼戰(zhàn)略研究院院長張曉先受邀參會,發(fā)表《開源小滿助力RISC-V軟硬協(xié)同生態(tài)發(fā)展》主題演講,分享了開源小滿
    的頭像 發(fā)表于 07-28 16:51 ?1170次閱讀
    普華基礎軟件亮相2025 <b class='flag-5'>RISC-V</b>中國峰會

    RISC-V 手冊

    以下是關于RISC-V的詳細介紹,結合其核心技術特點與當前發(fā)展現(xiàn)狀:核心概念RISC-V(第五代精簡指令集)是一種基于精簡指令集(RISC)的開源指令集架構(ISA),由加州大學伯克利分校于2010
    發(fā)表于 07-28 16:27 ?11次下載

    2025新思科技RISC-V科技日活動圓滿結束

    新思科技深度參與2025 RISC-V中國峰會并于2025年7月16日舉辦同期活動“新思科技RISC-V科技日”技術論壇,聚焦“從芯片到系統(tǒng)重構RISC-V創(chuàng)新”主題,議題覆蓋當前最前沿的技術領域
    的頭像 發(fā)表于 07-25 17:31 ?1407次閱讀

    RISC-V如何盈利?本土企業(yè)率先破局

    了全行業(yè)對RISC-V美好未來的信心。 RISC-V崛起:芯片產(chǎn)業(yè)高質(zhì)量發(fā)展的必由之路 當前,全球兩大處理器架構中,x86完全封閉,Arm需付費購買。關鍵技術被境外壟斷,相關芯片也依賴境外的生態(tài)和軟件,使國內(nèi)供應鏈面臨著巨大的風
    的頭像 發(fā)表于 07-18 11:32 ?3389次閱讀
    <b class='flag-5'>RISC-V</b>如何盈利?本土企業(yè)率先破局

    RISC-V 發(fā)展態(tài)勢與紅帽系統(tǒng)適配進展

    2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國峰會的軟件與生態(tài)系統(tǒng)分論壇上,紅帽軟件(北京)有限公司首席軟件工程師、RISC-V 國際基金會大使傅煒分享的主題是《紅帽在
    發(fā)表于 07-18 10:55 ?4060次閱讀
    <b class='flag-5'>RISC-V</b> 發(fā)展態(tài)勢與紅帽系統(tǒng)適配進展

    RISC-V International CEO:RISC-V 應用全面開花,2031 年滲透率將達 25.7%

    7 月 16 日~19 日,第五屆(2025)RISC-V 中國峰會在上海張江科學會堂拉開帷幕。峰會設置 1 場主論壇、8 大垂直領域分論壇、多場研習會及多項同期活動。在 7 月 17 日的主論壇上
    發(fā)表于 07-17 10:28 ?3698次閱讀
    <b class='flag-5'>RISC-V</b> International CEO:<b class='flag-5'>RISC-V</b> 應用全面開花,2031 年滲透率將達 25.7%

    RISC-V和ARM有何區(qū)別?

    在微處理器架構領域,ARM與RISC-V是兩個備受關注的體系。ZLG致遠電子在推出ARM核心版后,又推出了基于RISC-V的MR6450核心版,這引發(fā)了人們對這兩種架構差異的深入探討。ARM
    的頭像 發(fā)表于 06-24 11:38 ?2017次閱讀
    <b class='flag-5'>RISC-V</b>和ARM有何區(qū)別?

    RISC-V賽道的“硬核”突圍之路

    RISC-V作為一種開源指令集架構(ISA),近年來在全球范圍內(nèi)迅速崛起,有望重塑半導體產(chǎn)業(yè)格局。從芯片設計公司到軟件開發(fā)商,從學術研究機構到行業(yè)巨頭,都在積極探索RISC-V的應用和創(chuàng)新
    的頭像 發(fā)表于 04-24 15:34 ?555次閱讀
    <b class='flag-5'>RISC-V</b>賽道的“硬核”突圍之路

    FPGA與RISC-V淺談

    全球半導體產(chǎn)業(yè)競爭格局正在經(jīng)歷深刻變革,物聯(lián)網(wǎng)、邊緣計算等新興技術的蓬勃發(fā)展,讓RISC-V憑借其開源、精簡以及模塊化的靈活優(yōu)勢,日益成為業(yè)界焦點,也為全球半導體產(chǎn)業(yè)注入新的活力與挑戰(zhàn)
    發(fā)表于 04-11 13:53 ?672次閱讀
    FPGA與<b class='flag-5'>RISC-V</b>淺談

    原來,它們用的都是國產(chǎn)RISC-V芯片

    2025年,RISC-V生態(tài)迎來重大發(fā)展機遇。據(jù)媒體報道,中國計劃首次發(fā)布政策指導,鼓勵在全國范圍內(nèi)使用開源RISC-V芯片,以加速減少對西方技術的依賴。RISC-
    的頭像 發(fā)表于 04-02 11:42 ?1284次閱讀
    原來,它們用的都是國產(chǎn)<b class='flag-5'>RISC-V</b>芯片

    RISC-V生態(tài)崛起:政策落地與高性能芯片的崛起

    領域的理想選擇。RISC-V生態(tài)崛起2025年,RISC-V生態(tài)迎來重大發(fā)展機遇。據(jù)路透社報道,中國計劃首次發(fā)布政策指導,鼓勵在全國范圍內(nèi)使用開源RISC-V芯片,
    的頭像 發(fā)表于 03-06 11:35 ?1408次閱讀
    <b class='flag-5'>RISC-V</b>生態(tài)崛起:政策落地與高性能芯片的崛起