chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

性能突破 | SpacemiT-X60 在 LLVM 編譯器上實(shí)現(xiàn) 16% 顯著提升

進(jìn)迭時(shí)空 ? 2025-11-21 18:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2025年10月,在北美RISC-V峰會(huì)上,Igalia編譯器工程師Mikhail發(fā)表專題演講《Unlocking 15% More Performance: A Case Study in LLVM Optimization for RISC-V》。演講基于在進(jìn)迭時(shí)空 SpacemiT-X60 RISC-V 處理器上開展的十個(gè)月優(yōu)化實(shí)踐,系統(tǒng)闡述如何通過上游 LLVM 的多項(xiàng)改進(jìn),顯著提升 RISC-V 處理器性能,并在 SPEC CPU 2017 基準(zhǔn)測試中實(shí)現(xiàn)最高達(dá) 16% 的性能提升。

本次優(yōu)化的重點(diǎn)涵蓋三大方面:

為 SpacemiT-X60 引入定制調(diào)度模型

增強(qiáng)向量化在跨函數(shù)調(diào)用場景下的分析能力

支持過程間寄存器分配(IPRA)以優(yōu)化寄存器使用

SPEC 測試

SPEC CPU 2017 是業(yè)界公認(rèn)的 CPU 性能評(píng)估標(biāo)準(zhǔn),通過運(yùn)行一系列計(jì)算密集型任務(wù)(如代碼編譯、科學(xué)計(jì)算、AI 推理等),全面測量處理器的整數(shù)與浮點(diǎn)運(yùn)算性能。其測試結(jié)果能夠客觀反映 CPU 在實(shí)際應(yīng)用中的執(zhí)行效率,是衡量服務(wù)器、工作站及高端 PC 處理器性能的關(guān)鍵基準(zhǔn)。

調(diào)度模型:性能提升的關(guān)鍵


調(diào)度模型的引入是本次性能提升的關(guān)鍵。SpacemiT-X60作為一款按序雙發(fā)射CPU核心,其執(zhí)行效率高度依賴于編譯器生成的指令序列能否充分適配硬件特性。以LOAD指令為例,在等待數(shù)據(jù)就緒的周期內(nèi),通過智能調(diào)度插入其他可執(zhí)行指令,可有效避免流水線空等——這正如點(diǎn)外賣后,在送達(dá)前處理其他事務(wù),而非一味守在門口。


通過引入針對(duì) X60 的調(diào)度模型,多個(gè) SPEC 2017 子項(xiàng)目均實(shí)現(xiàn)性能提升,其中最高達(dá) 16.8%,整體性能平均提升 4.75%。由于該調(diào)度優(yōu)化作用于指令序列層面,不依賴特定程序邏輯,因此大多數(shù)軟件均可受益于該項(xiàng)改進(jìn)。


6767517e-c6c1-11f0-8ce9-92fbcf53809c.png


目前,LLVM 中的 RISC-V 后端尚缺乏一個(gè)默認(rèn)的調(diào)度模型。此次為 SpacemiT-X60 開發(fā)的模型,有望成為LLVM RISC-V 目標(biāo)默認(rèn)的調(diào)度模型,為更多RISC-V場景提供優(yōu)化支持。

突破難點(diǎn):跨函數(shù)調(diào)用的向量化優(yōu)化


SpacemiT-X60 支持 256 位寬的 RISC-V Vector (RVV) 1.0 擴(kuò)展。在數(shù)據(jù)并行度高的任務(wù)中,正確使用向量指令可大幅提升程序性能,因此自動(dòng)向量化始終是編譯器優(yōu)化的重點(diǎn)之一。然而,自動(dòng)向量化的關(guān)鍵難點(diǎn)在于代價(jià)評(píng)估:編譯器需準(zhǔn)確判斷在何種場景下向量化能帶來性能提升,又在哪些情況下可能帶來性能回退。


Mikhail 在報(bào)告中重點(diǎn)分析了跨函數(shù)調(diào)用這一典型場景。最終落地的 SLP fix 方案取得了顯著優(yōu)化效果,在測試中實(shí)現(xiàn)單個(gè)用例最高11.9%的性能提升,整體平均提升幅度也接近 1%。


67762582-c6c1-11f0-8ce9-92fbcf53809c.png


減少冗余:過程間寄存器分配(IPRA)


報(bào)告同時(shí)介紹了對(duì)過程間寄存器分配(IPRA,Inter-Procedural Register Allocation)的技術(shù)支持。在函數(shù)調(diào)用過程中,為確保程序正確執(zhí)行,需對(duì)寄存器進(jìn)行保存與恢復(fù)。傳統(tǒng)編譯方式下,由于編譯器無法預(yù)知被調(diào)用函數(shù)的具體寄存器使用情況,往往采取保守策略,對(duì)所有可能涉及的寄存器執(zhí)行保存與恢復(fù)操作,造成不必要的性能開銷。


而 IPRA 技術(shù)通過過程間分析,使編譯器能夠精確掌握被調(diào)用函數(shù)的寄存器使用情況。當(dāng)確認(rèn)某些寄存器不會(huì)被破壞時(shí),即可省略相應(yīng)的保存與恢復(fù)指令,從而減少內(nèi)存訪問、提升執(zhí)行效率。目前IPRA還有bug尚在修復(fù),暫未默認(rèn)啟用,但在Spec上的測試已經(jīng)顯示出0.5%的穩(wěn)定性能提升,其優(yōu)化效果已經(jīng)得到驗(yàn)證。


67834d16-c6c1-11f0-8ce9-92fbcf53809c.png


結(jié)語


從報(bào)告展示的最終數(shù)據(jù)來看,當(dāng)前 GCC 與 LLVM 兩大開源編譯器在 RISC-V 平臺(tái)上的表現(xiàn)各有優(yōu)勢,在不同測試項(xiàng)目中互有領(lǐng)先,這也表明未來仍有廣闊的協(xié)同優(yōu)化空間。


678f5624-c6c1-11f0-8ce9-92fbcf53809c.png


6799fd86-c6c1-11f0-8ce9-92fbcf53809c.png


本次優(yōu)化工作獲RISE(RISC-V Software Ecosystem)項(xiàng)目RP009課題支持。RISE是由Linux基金會(huì)托管的全球合作計(jì)劃,匯聚行業(yè)領(lǐng)導(dǎo)者共同推動(dòng)RISC-V開源軟件發(fā)展。作為RISE成員,進(jìn)迭時(shí)空榮幸見證 SpacemiT-X60被選用于 RISC-V 的編譯器性能優(yōu)化研究并取得顯著成果,特此感謝 Mikhail 及所有開發(fā)者的貢獻(xiàn)。


截至目前,進(jìn)迭時(shí)空 8 核 RISC-V AI CPU 芯片 K1 累計(jì)量產(chǎn)交付量突破 13 萬顆,已成為量產(chǎn)速度最快的 RISC-V 高算力芯片。同時(shí),公司通過 Bianbu Cloud 等云服務(wù)方式,為開發(fā)者提供便捷、即時(shí)的 RISC-V 算力服務(wù)。我們堅(jiān)信,隨著更多行業(yè)伙伴與開發(fā)者的加入,RISC-V 生態(tài)將加速邁向成熟。


附錄


1.RISC-V Summit 2025:

https://riscvsummit2025.sched.com/event/28OTp/unlocking-15-more-performance-a-case-study-in-llvm-optimization-for-risc-v-mikhail-r-gadelha-igalia

2.RISE RP009:

https://blogs.igalia.com/compilers/2025/05/05/boosting-risc-v-application-performance-an-8-month-llvm-journey/

3.RISE BLOG :

https://riseproject.dev/2025/05/08/project-rp009-llvm-spec-optimization/

4.Igalia BLOG :

https://blogs.igalia.com/compilers/2025/05/05/boosting-risc-v-application-performance-an-8-month-llvm-journey/

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1672

    瀏覽量

    51232
  • RISC-V處理器
    +關(guān)注

    關(guān)注

    0

    文章

    86

    瀏覽量

    10969
  • 進(jìn)迭時(shí)空
    +關(guān)注

    關(guān)注

    0

    文章

    54

    瀏覽量

    355
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    開源鴻蒙技術(shù)大會(huì)2025丨編譯器與編程語言分論壇:語言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,編譯賦能生態(tài)繁榮

    萬物智聯(lián)的時(shí)代背景下,操作系統(tǒng)底層能力的構(gòu)建離不開編程語言與編譯器的關(guān)鍵支撐。作為開源鴻蒙生態(tài)的核心技術(shù),語言設(shè)計(jì)與編譯器、虛擬機(jī)實(shí)現(xiàn)的進(jìn)步直接關(guān)系到開發(fā)效率、運(yùn)行
    的頭像 發(fā)表于 11-20 17:24 ?745次閱讀
    開源鴻蒙技術(shù)大會(huì)2025丨<b class='flag-5'>編譯器</b>與編程語言分論壇:語言驅(qū)動(dòng)系統(tǒng)創(chuàng)新,<b class='flag-5'>編譯</b>賦能生態(tài)繁榮

    Altera發(fā)布 Quartus? Prime 專業(yè)版和 FPGA AI 套件 25.3 版:編譯更快,智能更強(qiáng)

    投產(chǎn)以來編譯時(shí)間縮短多達(dá) 27%,同時(shí)顯著提升了 AI 工具的易用性; 得益于增強(qiáng)型編譯器和架構(gòu)優(yōu)化,設(shè)計(jì)人員平均可節(jié)省
    的頭像 發(fā)表于 11-13 09:24 ?7.5w次閱讀
    Altera發(fā)布 Quartus? Prime 專業(yè)版和 FPGA AI 套件 25.3 版:<b class='flag-5'>編譯</b>更快,智能更強(qiáng)

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件中未被調(diào)用的函數(shù),不會(huì)被編譯呢?

    GCC編譯器,怎么才能實(shí)現(xiàn)c文件中未被調(diào)用的函數(shù),不會(huì)被編譯?有什么編譯選項(xiàng)可以設(shè)置嗎? 移植代碼,有些函數(shù)沒被調(diào)用的函數(shù)想留在代碼里,但不想被編譯
    發(fā)表于 09-28 12:25

    如何在Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6?

    Keil中將NuMicro BSP從Arm編譯器5遷移到編譯器6!
    發(fā)表于 08-20 06:29

    【HZ-T536開發(fā)板免費(fèi)體驗(yàn)】2 - 交叉編譯倉頡編程語言程序到開發(fā)板運(yùn)行

    AARCH64的編譯器(我使用的是WSL2): sudo apt install gcc-aarch64-linux-gnu 然后需要拷貝aarch64開發(fā)包中以下三個(gè)目錄的文件到x86_64的Linux軟件包
    發(fā)表于 07-16 21:27

    邊緣設(shè)備AI部署:編譯器如何實(shí)現(xiàn)輕量化與高性能?

    、ASIC等)上高效執(zhí)行的機(jī)器代碼。AI編譯器AI模型的部署和優(yōu)化中扮演著關(guān)鍵角色,能夠顯著提升模型的運(yùn)行效率和性能。 ? AI
    的頭像 發(fā)表于 07-06 05:49 ?6374次閱讀

    兆松科技發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本

    近日,兆松科技(武漢)有限公司(以下簡稱“兆松科技”)宣布正式發(fā)布高性能 RISC-V 編譯器 ZCC 4.0.0 版本。新版本性能優(yōu)化、廠商自定義指令支持和軟件庫等方面
    的頭像 發(fā)表于 06-27 14:48 ?2558次閱讀
    兆松科技發(fā)布高<b class='flag-5'>性能</b>RISC-V<b class='flag-5'>編譯器</b>ZCC 4.0.0版本

    兆松科技ZCC編譯器全面支持芯來科技NA系列處理

    近日,兆松科技(武漢)有限公司(以下簡稱“兆松科技”)宣布正式發(fā)布高性能RISC-V編譯器ZCC 4.0.0版本。
    的頭像 發(fā)表于 06-11 09:56 ?1413次閱讀

    RISC-V架構(gòu)下的編譯器自動(dòng)向量化

    性能算力生態(tài)的建設(shè),正投入編譯器自動(dòng)向量化優(yōu)化等多項(xiàng)關(guān)鍵技術(shù),全面助力RISC-V的高性能發(fā)展。RISC-V向量設(shè)計(jì)SpacemiT現(xiàn)代
    的頭像 發(fā)表于 06-06 16:59 ?1087次閱讀
    RISC-V架構(gòu)下的<b class='flag-5'>編譯器</b>自動(dòng)向量化

    先楫 x 兆松:打造國產(chǎn)高性能 RISC-V MCU生態(tài)里程碑

    2025年06月06日,兆松科技(武漢)有限公司(以下簡稱“兆松科技”)宣布正式發(fā)布高性能RISC-V編譯器ZCC4.0.0版本。新版本性能優(yōu)化、廠商自定義指令支持和軟件庫等方面
    的頭像 發(fā)表于 06-06 15:53 ?2109次閱讀
    先楫 <b class='flag-5'>x</b> 兆松:打造國產(chǎn)高<b class='flag-5'>性能</b> RISC-V MCU生態(tài)里程碑

    RVCT編譯器是否比GNU的編譯器的代碼執(zhí)行速度更快?

    使用FX3S遇到了RVCT編譯器的問題。 1、SDK的release note中有支持RVCT的描述, 但是EZ USB Suite的設(shè)置中沒有找到RVCT的選項(xiàng), 請(qǐng)問支持的具體版本
    發(fā)表于 05-08 07:49

    迅為RK3568開發(fā)板內(nèi)核模塊實(shí)現(xiàn)-設(shè)置交叉編譯器

    1 下載網(wǎng)盤資料下的交叉編譯器,網(wǎng)盤路徑為:“iTOP-3568 開發(fā)板\\\\03_【iTOP-RK3568 開 發(fā)板】指南教程\\\\02_Linux 驅(qū)動(dòng)配套資料\\\\03_交叉編譯器”,將
    發(fā)表于 04-21 16:45

    Windows 編譯 KiCad

    “?Ethan 同學(xué)為我們分享了 Windows 編譯 KiCad 的準(zhǔn)備工作、操作步驟及閉坑指南。以下是核心的操作視頻及 PPT,完整的直播視頻后續(xù)分享給大家!?” 流程概要 準(zhǔn)備工作 編譯器
    的頭像 發(fā)表于 03-28 11:23 ?963次閱讀
    <b class='flag-5'>在</b> Windows <b class='flag-5'>上</b><b class='flag-5'>編譯</b> KiCad

    請(qǐng)問基于GCC編譯器的initcallSTM32如何實(shí)現(xiàn)

    請(qǐng)問各位基于GCC編譯器的initcallSTM32如何實(shí)現(xiàn)?有哪位實(shí)現(xiàn)了嗎?
    發(fā)表于 03-13 06:24

    Microchip推出MPLAB? XC統(tǒng)一編譯器許可證 更高效的管理多個(gè)許可證

    MPLAB XC8、XC16、XC-DSC 和 XC32 C 編譯器的 MPLAB XC 統(tǒng)一編譯器許可證 。該解決方案整合了必要的許可證,以減少開銷,并提供更大的靈活性、可擴(kuò)展性和易用性,解決了為每種
    的頭像 發(fā)表于 02-25 17:35 ?1607次閱讀