chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

緩存分區(qū)可提高安全關鍵型多核應用程序的CPU利用率

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:TIM KING ? 2022-11-08 14:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

緩存分區(qū)減少了關鍵任務的最壞情況下的執(zhí)行時間,從而提高了 CPU 利用率,尤其是對于多核應用程序。

多核處理器 (MCP) 的可認證、安全關鍵型軟件應用程序的開發(fā)人員面臨的最大挑戰(zhàn)之一是管理對共享資源(如緩存)的訪問。MCP 顯著增加緩存爭用,導致最壞情況執(zhí)行時間 (WCET) 超過平均案例執(zhí)行時間 (ACET) 100% 或更多。由于安全關鍵型開發(fā)人員必須為 WCET 制定預算,因此平均分配的任務(關鍵和非關鍵)的時間超過了所需的時間,從而導致 CPU 利用率顯著降低。解決此問題的一種方法是利用支持緩存分區(qū)的 RTOS,它使開發(fā)人員能夠以減輕爭用和減少 WCET 的方式綁定和控制干擾模式,從而在不影響安全關鍵性的情況下最大化可用 CPU 帶寬。

緩存爭用

在簡單的雙核處理器配置(圖 1)中,每個內核都有自己的 CPU 和 L1 緩存。兩個內核共享一個二級緩存。(請注意,未顯示共享內存和可選 L3。

圖1:雙核配置,無需緩存分區(qū)

pYYBAGNp9jOAc1p6AAAzASo43tM277.jpg

在此配置中,在核心 0 上執(zhí)行的應用程序與在核心 1 上執(zhí)行的應用程序競爭整個二級緩存。(請注意,同一內核上的應用程序也會相互競爭 L2;緩存分區(qū)也適用于這種情況。如果核心 0 上的應用程序 A 使用的數(shù)據(jù)映射到與核心 1 上的應用程序 B 相同的緩存行,則會發(fā)生沖突。

例如,假設 A 的數(shù)據(jù)駐留在 L2 中;對該數(shù)據(jù)的任何訪問都將花費很少的處理器周期。但假設 B 訪問的數(shù)據(jù)恰好映射到與 A 的數(shù)據(jù)相同的 L2 緩存行。此時,必須從 L2 中逐出 A 的數(shù)據(jù)(包括對 RAM 的潛在“寫回”),并且必須將 B 的數(shù)據(jù)從 RAM 中引入緩存。處理此碰撞所需的時間通常由 B 收取。然后,假設 A 再次訪問其數(shù)據(jù)。由于該數(shù)據(jù)不再位于 L2 中(B 的數(shù)據(jù)在其位置),因此必須從 L2 中逐出 B 的數(shù)據(jù)(包括潛在的“寫回”到 RAM),并且 A 的數(shù)據(jù)必須從 RAM 中恢復到緩存中。處理此碰撞所需的時間通常由 A 收取。

大多數(shù)時候,A和B很少會遇到這樣的碰撞。在這些情況下,它們各自的執(zhí)行時間可以被視為“平均情況”(ACET)。但是,有時,它們的數(shù)據(jù)訪問會以高頻率發(fā)生沖突。在這些情況下,它們各自的執(zhí)行時間必須被視為“最壞情況”(WCET)。

在開發(fā)可認證的安全關鍵型軟件時,必須為最壞情況的行為預算應用程序的執(zhí)行時間。此類軟件必須有足夠的時間預算才能在每次執(zhí)行時完成其預期功能,以免導致不安全的故障情況。安全關鍵型 RTOS 必須強制實施時間分區(qū),以便每個應用程序都有固定的 CPU 時間預算來執(zhí)行。

由于多個內核上的多個應用程序可能會產生對 L2 緩存的爭用,因此 MCP 上的 WCET 通常比 ACET 高得多。由于可認證的安全關鍵型應用程序必須有時間預算來容納其 WCET,這種情況會導致大量預算但未使用的時間,從而導致 CPU 利用率顯著下降。

緩存分區(qū)

緩存分區(qū)通過減少 WCET 來提高 CPU 利用率,從而減少必須預算以容納 WCET 的時間量。同樣,在簡單的雙核處理器配置(圖 2)中,每個內核都有自己的 CPU 和 L1 緩存,并且兩個內核共享一個 L2 緩存。

圖2:具有緩存分區(qū)的雙核配置

poYBAGNp9jWAU6wnAABFE6kB0AU379.jpg

在此配置中,RTOS 對 L2 緩存進行分區(qū),以便每個內核都有自己的 L2 段,這意味著內核 0 上的應用程序使用的數(shù)據(jù)將僅緩存在內核 0 的 L2 分區(qū)中。同樣,核心 1 上的應用程序使用的數(shù)據(jù)將僅緩存在核心 1 的 L2 分區(qū)中。這種分區(qū)消除了不同內核上的應用程序通過 L2 沖突相互干擾的可能性。如果沒有這種干擾,應用程序 WCET 和 ACET 之間的增量通常比沒有緩存分區(qū)的情況要低得多。通過限制和控制這些干擾模式,緩存分區(qū)使應用程序執(zhí)行時間更具確定性,并使開發(fā)人員能夠更嚴格地預算執(zhí)行時間,從而保持較高的處理器利用率。

測試環(huán)境和應用程序

為了演示緩存分區(qū)的優(yōu)勢,DDC-I 使用 Deos(其可認證、安全關鍵、時間和空間分區(qū)的 RTOS)來運行一套四個內存密集型測試應用程序,所有這些應用程序都具有一系列數(shù)據(jù)/代碼大小、順序和隨機訪問策略以及各種工作集大?。?/p>

只讀

只寫

復制

代碼執(zhí)行

測試是在具有 32 KB L1 數(shù)據(jù)緩存、24 KB L1 指令緩存和 512 KB 統(tǒng)一 L2 緩存的 1.6 GHz 凌動處理器 (x86) 上進行的。請注意,雖然這些測試使用了單核 x86 處理器,但 Deos 的緩存分區(qū)功能同樣適用于在同一內核上執(zhí)行的應用程序(這些應用程序也競爭 L2)。此外,它不依賴于 x86 處理器所特有的任何功能,并且同樣適用于其他處理器類型(如 ARM 或 PowerPC)。

測試是在有和沒有“緩存垃圾箱”應用程序的情況下運行的,該應用程序從L2中逐出測試應用程序數(shù)據(jù)/代碼,并使用自己的數(shù)據(jù)/代碼“臟”L2。實際上,從測試應用程序的角度來看,緩存垃圾程序將 L2 置于最壞情況狀態(tài)。也就是說,緩存垃圾箱模擬真實場景,其中不同的應用程序同時運行并爭用共享的 L2 緩存。

每個測試應用程序在三種情況下執(zhí)行。在場景 1 中,在沒有緩存分區(qū)或緩存垃圾的情況下執(zhí)行,測試應用程序將競爭整個 512 KB 二級緩存以及 RTOS 內核和各種調試工具。此測試建立基線平均性能,其中每個測試都以“平均”數(shù)量的 L2 爭用執(zhí)行。

在不使用緩存分區(qū)的場景 2 中,測試應用程序與 RTOS 內核、場景 1 中使用的同一組調試工具以及惡意緩存垃圾程序應用程序競爭整個 512 KB 二級緩存。此測試建立基線最壞情況性能,其中每個測試在來自其他應用程序(主要是緩存垃圾程序)的最壞情況下執(zhí)行 L2 干擾。

在使用緩存分區(qū)和緩存垃圾的場景 3 中,將創(chuàng)建三個 L2 分區(qū):

分配給測試應用程序的 256 KB 分區(qū)

分配給 RTOS 內核的 64 KB 分區(qū)以及方案 1 和方案 2 中使用的同一組調試工具

分配給惡意緩存垃圾程序應用程序的 192 KB 分區(qū)。

此方案建立了優(yōu)化的最壞情況性能,其中每個測試在其自己的 L2 分區(qū)內執(zhí)行,不受其他應用程序(包括緩存垃圾程序)的干擾。

緩存分區(qū)結果、優(yōu)勢

圖 3 顯示了只讀測試應用程序的結果。

圖3:緩存分區(qū)對只讀測試的影響

pYYBAGNp9jaAJhwZAABLOKtqL98240.jpg

例如,在沒有緩存分區(qū)和緩存垃圾的情況下(方案 1,ACET),只讀測試在工作集大小為 512 KB 的情況下,每次執(zhí)行的平均時間為 105 微秒。在方案 2(沒有分區(qū)的 WCET,添加了緩存垃圾箱)中,對于相同的 512 KB 工作集,測試平均每次執(zhí)行 400 微秒,增加了 280%。添加緩存分區(qū)(方案 3,帶緩存垃圾的 WCET)時,平均執(zhí)行時間降至 117 微秒,僅比 ACET 高 11%。

這些結果證明了緩存分區(qū)對于每個周期執(zhí)行大量讀取的應用程序的有效性。盡管由于量級差異,此處很難辨別,但當應用程序的工作集大小適合其使用的緩存分區(qū)(在本例中為 256 KB)時,對邊界 WCET 的影響更為明顯。由于緩存的性質,此結果是預期的。也就是說,嵌入式實時應用程序的工作集大小往往相對較小,因此我們預計緩存分區(qū)將使大多數(shù)應用程序受益。

只寫測試的結果與只讀測試相似,但對于較小的工作集更明顯。對于較大的工作集,結果顯示具有和不具有緩存分區(qū)的 WCET 之間的差異相對較小。

復制測試的結果與只讀測試相似,但對于較小的工作集更明顯。對于較大的工作集,結果不那么顯著,但仍然顯示出具有緩存分區(qū)的 WCET 的顯著改進(大約 2 倍)。

代碼執(zhí)行測試的結果與只讀測試類似,但稍微不那么引人注目。

請注意,在同一緩存分區(qū)中執(zhí)行的應用程序可能會相互干擾。但是,與在具有共享緩存的不同內核上執(zhí)行的應用程序之間可能發(fā)生的不可預測的干擾模式相比,此類干擾通常更容易分析和綁定。在這些情況下,如果干擾不可預測,則可以將應用程序映射到單獨的緩存分區(qū)。

基準測試結果清楚地表明,緩存分區(qū)提供了一種有效的方法來綁定和控制 MCP 上共享緩存中的干擾模式。特別是,在對緩存進行分區(qū)時,可以更嚴格地綁定和控制 WCET。這允許應用程序開發(fā)人員設置相對緊湊但安全的執(zhí)行時間預算,從而最大限度地提高 MCP 利用率。

當然,不同的應用和硬件配置的結果會有所不同,并且需要額外的RTOS功能才能成功認證基于安全關鍵型MCP的系統(tǒng)。無論如何,這些結果代表了在使用MCP托管可認證的安全關鍵應用程序的目標方面的重大進步。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19896

    瀏覽量

    235220
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11080

    瀏覽量

    217089
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    高性能緩存設計:如何解決緩存偽共享問題

    多核高并發(fā)場景下, 緩存偽共享(False Sharing) 是導致性能驟降的“隱形殺手”。當不同線程頻繁修改同一緩存行(Cache Line)中的獨立變量時,CPU
    的頭像 發(fā)表于 07-01 15:01 ?130次閱讀
    高性能<b class='flag-5'>緩存</b>設計:如何解決<b class='flag-5'>緩存</b>偽共享問題

    海光DCU率先展開文心系列模型的深度技術合作 FLOPs利用率(MFU)達47%

    海光DCU實現(xiàn)文心4.5模型高效適配; FLOPs利用率突破47%。 2025年6月30日,在百度文心4.5系列大模型正式開源當日,海光信息技術股份有限公司宣布其深度計算單元(DCU)率先完成對該系
    的頭像 發(fā)表于 07-01 14:35 ?564次閱讀

    拼版怎么拼好,板廠經常說利用率太低,多收費用?

    做板的時候,板廠經常說我拼版利用率太低,要多收取費用,哪位大神知道怎么算利用率
    發(fā)表于 05-14 13:42

    mes工廠管理系統(tǒng):如何讓設備利用率提升50%?

    在制造業(yè)競爭日益激烈的今天,設備利用率直接決定了企業(yè)的盈利能力。許多工廠管理者都在思考同一個問題:如何在不增加設備投資的情況下,讓現(xiàn)有產能發(fā)揮出最大價值?MES工廠管理系統(tǒng)正是解決這一難題的金鑰匙
    的頭像 發(fā)表于 05-09 15:55 ?203次閱讀
    mes工廠管理系統(tǒng):如何讓設備<b class='flag-5'>利用率</b>提升50%?

    DeepSeek MoE架構下的網絡負載如何優(yōu)化?解鎖90%網絡利用率關鍵策略

    、All-to-All等),網絡面臨高并發(fā)、低延遲、無損傳輸?shù)膰揽列枨?。然而,傳統(tǒng)以太網的網絡利用率長期徘徊在35%~40%,成為制約AI算力釋放的關鍵瓶頸。
    的頭像 發(fā)表于 04-28 12:04 ?390次閱讀
    DeepSeek MoE架構下的網絡負載如何優(yōu)化?解鎖90%網絡<b class='flag-5'>利用率</b>的<b class='flag-5'>關鍵</b>策略

    TECS OpenStack資源池主機磁盤分區(qū)使用率過高的問題處理

    某運營商TECS資源池上報“主機磁盤分區(qū)使用率過高”的告警,如下圖所示。
    的頭像 發(fā)表于 03-21 09:47 ?497次閱讀
    TECS OpenStack資源池主機磁盤<b class='flag-5'>分區(qū)</b>使<b class='flag-5'>用率</b>過高的問題處理

    三星平澤晶圓代工產線恢復運營,6月沖刺最大產能利用率

    據(jù)媒體最新報道,韓國三星電子的晶圓代工部門已正式解除位于平澤園區(qū)的晶圓代工生產線的停機狀態(tài),并計劃在今年6月將產能利用率提升至最高水平。這一舉措標志著三星在應對市場波動、調整產能策略方面邁出了重要一步。
    的頭像 發(fā)表于 02-18 15:00 ?568次閱讀

    如何提高嵌入式代碼質量?

    的錯誤和改進點,提高代碼的可讀性和健壯性。 4. 版本控制:使用版本控制系統(tǒng)如Git,可以追蹤代碼變更并輕松進行團隊協(xié)作,確保每個版本都是可控和重現(xiàn)的。 優(yōu)化性能和資源利用率 在嵌入式系統(tǒng)中
    發(fā)表于 01-15 10:48

    源網荷儲充一體化,提高能源利用率和電網消納能力

    是基于物聯(lián)網和大數(shù)據(jù)技術的充電設施管理系統(tǒng),實現(xiàn)對充電樁的監(jiān)控、調度和管理提高充電樁的利用率和充電效率,提升用戶充電體驗和服務質量
    的頭像 發(fā)表于 01-10 09:24 ?1207次閱讀
    源網荷儲充一體化,<b class='flag-5'>提高</b>能源<b class='flag-5'>利用率</b>和電網消納能力

    低空載功耗,高能源利用率 BDA5-20W BOSHIDA DCDC

    低空載功耗,高能源利用率 BDA5-20W BOSHIDA DCDC BDA5-20W系列產品具有以下特點:寬輸入電壓范圍(4:1),可以適應多種輸入電壓條件;高效率,能夠達到88%以上,節(jié)能環(huán)保
    的頭像 發(fā)表于 11-06 10:30 ?582次閱讀
    低空載功耗,高能源<b class='flag-5'>利用率</b> BDA5-20W BOSHIDA DCDC

    華納云:什么是負載均衡?優(yōu)化資源利用率的策略

    負載均衡是現(xiàn)代計算機網絡架構中不可或缺的一部分,它通過智能分配請求和任務,確保系統(tǒng)資源的高效利用。本文將探討負載均衡的概念、工作原理、優(yōu)化資源利用率的策略及其在實際應用中的重要性。 1. 什么是負載
    的頭像 發(fā)表于 10-28 16:07 ?612次閱讀

    交換機內存利用率過高會是什么問題

    在現(xiàn)代網絡架構中,交換機扮演著至關重要的角色,負責在網絡設備之間高效地轉發(fā)數(shù)據(jù)包。然而,隨著網絡規(guī)模的擴大和數(shù)據(jù)流量的增加,交換機的內存資源可能會變得緊張,導致內存利用率過高。這種情況如果不加
    的頭像 發(fā)表于 10-18 09:53 ?2175次閱讀

    服務器cpu用率高怎么解決

    服務器CPU用率高是一個常見的問題,它可能會導致服務器性能下降,甚至影響用戶體驗。 一、了解服務器CPU用率高的原因 應用程序問題
    的頭像 發(fā)表于 10-10 15:14 ?1859次閱讀

    什么是CPU緩存?它有哪些作用?

    CPU緩存(Cache Memory)是計算機系統(tǒng)中一個至關重要的組成部分,它位于CPU與內存之間,作為兩者之間的臨時存儲器。CPU緩存的主
    的頭像 發(fā)表于 08-22 14:54 ?6153次閱讀

    多核CPU的優(yōu)勢是什么

    多核CPU(Central Processing Unit,中央處理器)作為現(xiàn)代計算機技術的重要里程碑,其優(yōu)勢在于顯著提升了計算性能、多任務處理能力、系統(tǒng)穩(wěn)定性以及能效比等多個方面。以下將詳細闡述多核
    的頭像 發(fā)表于 08-22 14:30 ?5342次閱讀