1, 介紹
前面的文章《一文搞懂Cortex-A77(ARMv8架構(gòu))工作原理》,《一文搞懂cpu cache工作原理》介紹CPU、cache的組成與工作原理,這篇文章將介紹CPU與cache之間的MMU的組成與工作原理。通過本文可以了解CPU訪問的虛擬地址是怎么轉(zhuǎn)換成物理地址,然后通過物理地址在cache、主存或者EMMC中獲取相應(yīng)的數(shù)據(jù)。
早期的內(nèi)存是比較小的,一般是幾十k,不過相應(yīng)的程序也是比較小的,這時(shí)程序可以直接加載到內(nèi)存中運(yùn)行。后來為了支持多個(gè)程序的并行,內(nèi)存中出現(xiàn)了固定分區(qū),在編譯階段將不同程序,劃分在不同的內(nèi)存區(qū)域上。這種方式存在不少問題:一是內(nèi)存分區(qū)大小與程序大小要匹配,二是地址空間無法動(dòng)態(tài)的增長(zhǎng)。于是內(nèi)存動(dòng)態(tài)分區(qū)思想便誕生了,內(nèi)存上線劃出一塊區(qū)域給操作系統(tǒng),然后剩余的內(nèi)存空間給用戶進(jìn)程使用,這樣用戶程序所使用的內(nèi)存空間,跟隨程序大小及數(shù)目進(jìn)行變動(dòng)。
不論是靜態(tài)分析,還是動(dòng)態(tài)分區(qū),都存在一些問題:進(jìn)程地址空間安全問題、內(nèi)存使用效率低。為了能夠讓多程序安全、高效地并行運(yùn)行,物理內(nèi)存中需要存放多個(gè)程序的代碼及數(shù)據(jù),這時(shí)虛擬內(nèi)存便誕生了。不得不說虛擬內(nèi)存是一個(gè)偉大的發(fā)明,一方面它讓每個(gè)程序認(rèn)為自己是獨(dú)自、連續(xù)的使用內(nèi)存,另一方面,每個(gè)程序之間的內(nèi)存形成了安全隔離,避免程序破壞彼此的內(nèi)存。
后來隨著軟件的快速發(fā)展,一個(gè)程序的大小變得很大,這時(shí)物理內(nèi)存大小跟不上程序大小增加的速度。這樣便不能將整個(gè)程序加載到物理內(nèi)存中,一是物理內(nèi)存沒有這么大,二是如果將整個(gè)程序加載到內(nèi)存,為了多程序并行,就需要將大量的數(shù)據(jù)及代碼換入、換出,這導(dǎo)致程序運(yùn)行效率低下。
虛擬內(nèi)存并沒解決高效使用內(nèi)存的問題,好在程序運(yùn)行遵循時(shí)間、空間局部性原理,進(jìn)而出現(xiàn)了分頁(yè)機(jī)制。分頁(yè)機(jī)制從根本上解決了高效使用物理內(nèi)存的問題。每次只需要將幾頁(yè)的代碼、數(shù)據(jù)從磁盤中加載到內(nèi)存,程序就能正常運(yùn)行。當(dāng)程序運(yùn)行的過程中,需要新的代碼、數(shù)據(jù)會(huì)產(chǎn)生缺頁(yè)異常,這些代碼、數(shù)據(jù)就會(huì)從磁盤加載到內(nèi)存,然后程序從異?;謴?fù)正常運(yùn)行。
對(duì)于支持虛擬內(nèi)存,分頁(yè)機(jī)制的系統(tǒng),處理器直接尋址虛擬地址,這個(gè)地址不會(huì)直接發(fā)給內(nèi)存控制器,而是先發(fā)給內(nèi)存管理單元(Memory Manager Unit,MMU)。MMU就是負(fù)責(zé)將虛擬地址轉(zhuǎn)換和翻譯成物理地址的一個(gè)硬件模塊,其實(shí)MMU所做的事,完全可以通過CPU來實(shí)現(xiàn)。為啥還要一個(gè)MMU硬件模塊呢?就是為了提升虛擬地址到物理地址轉(zhuǎn)換的速度,減少轉(zhuǎn)換所消耗的時(shí)間。
MMU包含兩個(gè)模塊TLB(Translation Lookaside Buffer)和TWU(Table Walk Unit)。TLB是一個(gè)高速緩存,用于緩存頁(yè)表轉(zhuǎn)換的結(jié)果,從而縮短頁(yè)表查詢的時(shí)間。TWU是一個(gè)頁(yè)表遍歷模塊,頁(yè)表是由操作系統(tǒng)維護(hù)在物理內(nèi)存中,但是頁(yè)表的遍歷查詢是由TWU完成的,這樣減少對(duì)CPU資源的消耗。
虛擬內(nèi)存及分頁(yè)機(jī)制的出現(xiàn),解決了進(jìn)程地址空間安全性的問題和內(nèi)存使用效率低的問題,但是也引入了系統(tǒng)性能變差的問題。本來CPU可以直接通過訪存執(zhí)行程序,但是現(xiàn)在引入了虛擬地址到物理地址的轉(zhuǎn)換。MMU硬件模塊的出現(xiàn),就是為了解決這個(gè)性能問題。因此,幾G運(yùn)行內(nèi)存的電腦,可以并行運(yùn)行幾十G的多程序,讓你在聽歌的同時(shí),能夠并行處理編輯文檔,下載電影,收發(fā)郵件等。
2, 框架
2.1 內(nèi)存管理體系結(jié)構(gòu)
在SMP(Symmetric Multi Process,對(duì)稱多處理器)系統(tǒng)中,每個(gè)處理器內(nèi)置了MMU模塊,MMU模塊包含了TLB和TWU兩個(gè)子模塊。TLB是一個(gè)高速緩存,用于緩存虛擬地址到物理地址的轉(zhuǎn)換結(jié)果。頁(yè)表的查詢過程是由TWU硬件自動(dòng)完成的,但是頁(yè)表的維護(hù)是需要操作系統(tǒng)實(shí)現(xiàn)的,頁(yè)表存放在主存中。
頁(yè)表的查詢是一個(gè)耗時(shí)的過程,理想情況下,TLB命中,可以從中直接得到虛擬地址對(duì)應(yīng)的物理地址。當(dāng)TLB未命中的時(shí)候,MMU才會(huì)通過TWU查詢頁(yè)表,從而翻譯虛擬地址得到物理地址。得到物理地址后,首先要查詢?cè)撐锢淼刂返膬?nèi)容是否存在于cache中,若cache命中,則直接取出物理地址對(duì)應(yīng)的內(nèi)容返回給處理器。
若cache沒有命中,會(huì)進(jìn)一步訪問主存獲取相應(yīng)的內(nèi)容,然后回寫到cache,并返回給處理器。如果沒能在頁(yè)表中查詢到虛擬地址對(duì)應(yīng)的物理地址,則會(huì)觸發(fā)一個(gè)與MMU相關(guān)的缺頁(yè)異常,在異常處理的過程中,會(huì)將EMMC中相關(guān)的數(shù)據(jù)加載到主存,然后建立相應(yīng)的頁(yè)表,然后將物理地址對(duì)應(yīng)的內(nèi)容返回給cache及處理器。
2.2 MMU相關(guān)的基本概念
(1)虛擬地址相關(guān)基本概念
虛擬內(nèi)存(Virtual Memory,VM):為每個(gè)進(jìn)程提供了一致的、連續(xù)的、私有的內(nèi)存空間,簡(jiǎn)化了內(nèi)存管理。將主存看成是一個(gè)存儲(chǔ)在磁盤上的地址空間的高速緩存,當(dāng)運(yùn)行多個(gè)進(jìn)程或者一個(gè)進(jìn)程需要更多的空間時(shí),主存顯然是不夠用的,這時(shí)需要更大、更便宜的磁盤保存一部分?jǐn)?shù)據(jù)。
虛擬地址空間(Virtual Address Space,VAS):每個(gè)進(jìn)程獨(dú)有。
虛擬頁(yè)(Virtual Page,VP):把虛擬內(nèi)存按照頁(yè)表大小進(jìn)行劃分。
虛擬地址(Virtual Address,VA):處理器看到的地址。
虛擬頁(yè)號(hào)(Virtual Page Number,VPN):用于定位頁(yè)表的PTE。
(2)物理地址相關(guān)的基本概念
物理內(nèi)存(Physical Memory,PM):主存上能夠使用的物理空間。
物理頁(yè)(Physical Page):把物理內(nèi)存按照頁(yè)表的大小進(jìn)行劃分。
物理地址(Physical Address,PA):物理內(nèi)存劃分很多塊,通過物理內(nèi)存進(jìn)行定位。
物理頁(yè)號(hào)(Physical Page Number,PPN):定位物理內(nèi)存中塊的位置。
(3)頁(yè)表相關(guān)的基本概念
頁(yè)表(Page Tabel):虛擬地址與物理地址映射表的集合。
頁(yè)表?xiàng)l目(Page Table Entry,PTE):虛擬地址與獨(dú)立地址具體對(duì)應(yīng)的記錄。
頁(yè)全局目錄(Page Global Directory,PGD):多級(jí)頁(yè)表中的最高一級(jí)。
頁(yè)上級(jí)目錄(Page Upper Directory,PUD):多級(jí)頁(yè)表中的次高一級(jí)。
頁(yè)中間目錄(Page Middle Directory,PMD):多級(jí)頁(yè)表中的一級(jí)。
2.3 頁(yè)命中、缺頁(yè)
(1)頁(yè)命中
a) 處理器要對(duì)虛擬地址VA進(jìn)行訪問。 b) MMU的TLB沒有命中,通過TWU遍歷主存頁(yè)表中的PTE地址。 c) 主存向MMU返回PTE。 d) MMU通過PTE映射物理地址,并把它傳給高速緩存或主存。 e) 高速緩存或主存返回物理地址對(duì)應(yīng)的數(shù)據(jù)給處理器。
(2)缺頁(yè)
a) 處理器要對(duì)虛擬地址VA進(jìn)行訪問。 b) MMU的TLB沒有命中,通過TWU遍歷主存頁(yè)表中的PTE地址。 c) 主存向MMU返回PTE。 d) PTE中有效位是0,MMU觸發(fā)一次異常,CPU相應(yīng)缺頁(yè)異常,運(yùn)行相應(yīng)的處理程序。 e) 缺頁(yè)異常處理程序選出物理內(nèi)存中的犧牲頁(yè),若這個(gè)頁(yè)面已經(jīng)被修改,將其換出到EMMC。 f) 缺頁(yè)異常處理程序從EMMC中加載新的頁(yè)面,并更新內(nèi)存中頁(yè)表的PTE。 g) 缺頁(yè)異常處理程序返回到原來的進(jìn)程,再次執(zhí)行導(dǎo)致缺頁(yè)的指令。CPU將引起缺頁(yè)異常的虛擬地址重新發(fā)給MMU。由于虛擬頁(yè)面現(xiàn)在緩存在主從中,主存會(huì)將所請(qǐng)求的地址對(duì)應(yīng)的內(nèi)容返回給cache和處理器。
2.4 多級(jí)頁(yè)表映射過程
物理頁(yè)面大小一級(jí)地址總線寬度不同,頁(yè)表的級(jí)數(shù)也不同。以AArch64運(yùn)行狀態(tài),4KB大小物理頁(yè)面,48位地址寬度為例,頁(yè)表映射的查詢過程如圖:
對(duì)于多任務(wù)操作系統(tǒng),每個(gè)用戶進(jìn)程都擁有獨(dú)立的進(jìn)程地址空間,也有相應(yīng)的頁(yè)表負(fù)責(zé)虛擬地址到物理地址之間的轉(zhuǎn)換。MMU查詢的過程中,用戶進(jìn)程的一級(jí)頁(yè)表的基址存放在TTBR0。操作系統(tǒng)的內(nèi)核空間公用一塊地址空間,MMU查詢的過程中,內(nèi)核空間的一級(jí)頁(yè)表基址存放在TTBR1。
當(dāng)TLB未命中時(shí),處理器查詢頁(yè)表的過程如下:
處理器根據(jù)虛擬地址第63位,來選擇使用TTBR0或者TTBR1。當(dāng)VA[63]為0時(shí),選擇TTBR0,TTBR中存放著L0頁(yè)表的基址。
處理器以VA[47:39]作為L(zhǎng)0的索引,在L0頁(yè)表中查找頁(yè)表項(xiàng),L0頁(yè)表有512個(gè)頁(yè)表項(xiàng)。
L0頁(yè)表的頁(yè)表項(xiàng)中存放著L1頁(yè)表的物理基址。處理器以VA[38:30]作為L(zhǎng)1索引,在L1頁(yè)表中找到相應(yīng)的頁(yè)表項(xiàng),L1頁(yè)表中有512個(gè)頁(yè)表項(xiàng)。
L1頁(yè)表的頁(yè)表項(xiàng)中存放著L2頁(yè)表的物理基址。處理器以VA[29:21]作為L(zhǎng)2索引,在L2頁(yè)表中找到相應(yīng)的頁(yè)表項(xiàng),L2頁(yè)表中有512個(gè)頁(yè)表項(xiàng)。
L2頁(yè)表的頁(yè)表項(xiàng)中存放著L3頁(yè)表的物理基址。處理器以VA[20:12]作為L(zhǎng)1索引,在L3頁(yè)表中找到相應(yīng)的頁(yè)表項(xiàng),L3頁(yè)表中有512個(gè)頁(yè)表項(xiàng)。
L3頁(yè)表的頁(yè)表項(xiàng)里,存放著4KB頁(yè)面的物理基址,然后加上VA[11:0],這樣就構(gòu)成了物理地址,至此處理器完成了一次虛擬地址到物理地址的查詢與翻譯的工作。
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
20069瀏覽量
242811 -
ARM
+關(guān)注
關(guān)注
135文章
9451瀏覽量
385745 -
SMP
+關(guān)注
關(guān)注
0文章
79瀏覽量
20562 -
TLB電路
+關(guān)注
關(guān)注
0文章
9瀏覽量
5372 -
MMU
+關(guān)注
關(guān)注
0文章
92瀏覽量
19020
原文標(biāo)題:一文搞懂MMU工作原理
文章出處:【微信號(hào):IC大家談,微信公眾號(hào):IC大家談】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
嵌入式中ARM的MMU和Cache機(jī)制
處理器在讀內(nèi)存的過程中,CPU核、cache、MMU如何協(xié)同工作?
ARM920T的高速緩沖存儲(chǔ)器cache與MMU簡(jiǎn)析
ARMv8 Uboot支持MMU和Cache對(duì)比實(shí)驗(yàn)指南
Cache的工作原理
Buffer和Cache之間區(qū)別是什么?
cache結(jié)構(gòu)與工作原理

MMU的工作原理梳理

ARM920T的MMU與Cache介紹

MMU內(nèi)存管理單元的工作原理和作用

Cache工作原理講解 Cache寫入方式原理簡(jiǎn)介

Cache工作原理是什么

MMU原理:CPU是如何訪問到內(nèi)存的?

評(píng)論