電子發(fā)燒友網(wǎng)>電子資料下載>嵌入式開發(fā)>嵌入式軟件開發(fā)之基于ARM處理器的嵌入式系統(tǒng)設(shè)計方案解析

嵌入式軟件開發(fā)之基于ARM處理器的嵌入式系統(tǒng)設(shè)計方案解析

2362486 2017-10-19 | rar | 0.6 MB | 次下載 | 1積分

資料介紹

　本章主要介紹嵌入式應(yīng)用程序的設(shè)計方法。本章中的一些實例程序是以ARM公司的Realview2.2為開發(fā)平臺。由于目前嵌入式應(yīng)用環(huán)境相差非常大，這里主要是通過這些實例程序來更直接地介紹嵌入式應(yīng)用系統(tǒng)的開發(fā)方法，具體的代碼因具體的嵌入式環(huán)境不同而有所差異。
　　13.1 基于ARM處理器的嵌入式系統(tǒng)設(shè)計
　　ARM系列處理器是RISC（Reducded Instruction Set Computing）處理器。很多基于ARM的高效代碼的程序設(shè)計策略都源于RISC處理器。和很多RISC處理器一樣，ARM系列處理器的內(nèi)存訪問也要求數(shù)據(jù)對齊，即存取“字（Word）”數(shù)據(jù)時要求四字節(jié)對齊，地址的bits［1：0］=0b00；存取“半字（Halfwords）”時要求兩字節(jié)對齊，地址的bit［0］=0b0；存取“字節(jié)（Byte）”數(shù)據(jù)時要求該數(shù)據(jù)按其自然尺寸邊界（Natural Size Boundary）定位。
　　ARM編譯程序通常將全局變量對齊到自然尺寸邊界上，以便通過使用 LDR和STR指令有效地存取這些變量。
　　這種內(nèi)存訪問方式與多數(shù)CISC（Complex Instruction Set Computing）體系結(jié)構(gòu)不同，在CISC體系結(jié)構(gòu)下，指令直接存取未對齊的數(shù)據(jù)。因而，當(dāng)需要將代碼從CISC體系結(jié)構(gòu)向 ARM處理器移植時，內(nèi)存訪問的地址對齊問題必須予以注意。在RISC體系結(jié)構(gòu)下，存取未對齊數(shù)據(jù)無論在代碼尺寸或是程序執(zhí)行效率上，都將付出非常大的代價。
　　注意在ARM11處理器上，新增加了支持非內(nèi)存對齊數(shù)據(jù)訪問的硬件，此結(jié)構(gòu)在本章中不作討論。
　　下面將從4個方面詳細(xì)討論在ARM體系結(jié)構(gòu)下的程序設(shè)計：
　　· 未對齊指針；
　　· 結(jié)構(gòu)體中的未對齊字段；
　　· 用于半字存取的Load指令；
　　· 移植代碼并檢測非對齊存取。
　　13.1.1 未對齊的數(shù)據(jù)指針
　　C和C++編程標(biāo)準(zhǔn)規(guī)定，指向某一數(shù)據(jù)類型的指針，必須和該類型的數(shù)據(jù)地址對齊方式一致，所以ARM編譯器期望程序中的C指針指向存儲器中字對齊地址，因為這可使編譯器生成更高效的代碼。
　　比如，如果定義一個指向int數(shù)據(jù)類型的指針，用該指針讀取一個字，ARM 編譯器將使用LDR指令來完成此操作。如果讀取的地址為4的倍數(shù)（即在一個字的邊界）即能正確讀取。但是，如果該地址不是4的倍數(shù)，那么，一條LDR指令返回一個循環(huán)移位結(jié)果，而不是執(zhí)行真正的未對齊字載入。循環(huán)移位結(jié)果取決于該地址相對于字的邊界的偏移量和系統(tǒng)所使用的端序（Endianness）。例如，如果代碼要求從指針指向的地址0x8006載入數(shù)據(jù)，即要載入0x8006、0x8007、0x8008和0x8009 4個字節(jié)的內(nèi)容。但是，在ARM處理器上，這個存取操作載入了0x8004、0x8005、0x8006和0x8007字節(jié)的內(nèi)容。這就是在未對齊的地址上使用指針存取所得到的循環(huán)移位結(jié)果。
　　因而，如果想將指針定義到一個指定地址（該地址為非自然邊界對齊），那么在定義該指針時，必須使用__packed限定符來定義指針：
　　例如：
　　__packed int *pi; // 指針指向一個非字對其內(nèi)存地址
　　使用了__packed限定符限定之后，ARM編譯器將產(chǎn)生字節(jié)存取命令（LDRB或STRB指令）來存取內(nèi)存，這樣就不必考慮指針對齊問題。所生成的代碼是字節(jié)存取的一個序列，或者取決于編譯選項、跟變量對齊相關(guān)的移位和屏蔽。但這會導(dǎo)致系統(tǒng)性能和代碼密度的損失。
　　值得注意的是，不能使用__packed限定的指針來存取存儲器映射的外圍寄存器，因為ARM編譯程序可使用多個存儲器存取來獲取數(shù)據(jù)。因而，可以對實際存取地址附近的位置進行存取，而這些附近的位置可能對應(yīng)于其他外部寄存器。當(dāng)使用了位字段（Bitfield）時，ARM程序?qū)⒃L問整個結(jié)構(gòu)體，而非指定字段。
　　13.1.2 結(jié)構(gòu)體中未對齊字段
　　與全局變量位于其自然尺寸邊界相同，結(jié)構(gòu)體（Structure）中的域字段（Filed）也如此。也就是說編譯程序經(jīng)常要在字段間插入填充字節(jié)（Padding）來確保域字段對齊。當(dāng)編譯程序插入填充字節(jié)時，編譯器將產(chǎn)生以下警告信息。
　　#1301-D： padding inserted in struct mystruct
　　可以使用-remark編譯選項使編譯器產(chǎn)生備份信息，或使用-diag_warning選項選擇編譯器產(chǎn)生的備份信息。
　　如果不希望編譯器產(chǎn)生填充字節(jié)，可以使用__packed限定符來創(chuàng)建字段之間沒有填充字節(jié)的結(jié)構(gòu)，且這些結(jié)構(gòu)需要非對齊存取。
　　如果ARM編譯器能夠確定所訪問結(jié)構(gòu)體的對齊方式，那么它就可以自動識別所存取結(jié)構(gòu)體中的字段的對齊方式。在這些情況下，編譯程序盡可能地采用更有效的對齊字或半字存取方式。否則，編譯器將使用多個對齊存儲器存?。↙DR、STR、LDM和STM）與固定移位和屏蔽相結(jié)合來存取存儲器中的字節(jié)。
　　對非對齊元素的存取是通過內(nèi)聯(lián)還是通過調(diào)用一個函數(shù)來完成，由編譯程序-Ospace（默認(rèn)，調(diào)用一個函數(shù)）和-Otime（執(zhí)行非對齊存取內(nèi)聯(lián)）選項來控制。
　　例如：
　　創(chuàng)建一個名為foo.c源文件。
　　__packed struct mystruct {
　　int aligned_i;
　　short aligned_s;
　　int unaligned_i;
　　};
　　struct mystruct S1;
　　int foo （int a， short b）
　　{
　　S1.aligned_i=a;
　　S1.aligned_s=b;
　　return S1.unaligned_i;
　　}
　　使用armcc -c -Otime foo.c編譯。所生成的代碼為：
　　MOV r2，r0
　　LDR r0，|L1.84|
　　MOV r12，r2，LSR #8
　　STRB r2，［r0，#0］
　　STRB r12，［r0，#1］
　　MOV r12，r2，LSR #16
　　STRB r12，［r0，#2］
　　MOV r12，r2，LSR #24
　　STRB r12，［r0，#3］
　　MOV r12，r1，LSR #8
　　STRB r1，［r0，#4］
　　STRB r12，［r0，#5］
　　ADD r0，r0，#6
　　BIC r3，r0，#3
　　AND r0，r0，#3
　　LDMIA r3，{r3，r12}
　　MOV r0，r0，LSL #3
　　MOV r3，r3，LSR r0
　　RSB r0，r0，#0x20
　　ORR r0，r3，r12，LSL r0
　　BX lr
　　其中，“|L1.84|”為結(jié)構(gòu)體mystruct在內(nèi)存中的地址。
　　從上例可以看出，所有對結(jié)構(gòu)體域成員的訪問都是通過字節(jié)訪問實現(xiàn)的，所以這種不對齊內(nèi)存訪問無論從代碼占用的存儲器空間，還是代碼的執(zhí)行時間上都要付出一定的代價。
　　然而，開發(fā)者可以給編譯器提供更多的信息，使其知道結(jié)構(gòu)體內(nèi)哪個字段是對齊的，哪個字段不是。為此，必須將未對齊字段聲明為__packed，并從struct本身除去__packed屬性。通過這種方法可以保證對struct中自然對齊成員的快速訪問。而且，哪個字段是未對齊的也更清楚，但這樣就增加了訪問struct結(jié)構(gòu)的難度，當(dāng)用戶從結(jié)構(gòu)中增加或刪除字段時需要特別小心。
　　修改上例中結(jié)構(gòu)體的定義，來減少訪問結(jié)構(gòu)體的開銷。具體代碼如下所示。
　　struct mystruct {
　　int aligned_i;
　　short aligned_s;
　　__packed int unaligned_i;
　　};
　　struct mystruct S1;
　　對修改后的程序進行編譯，產(chǎn)生的匯編代碼如下所示。
　　MOV r2，r0
　　LDR r0，|L1.32|
　　STR r2，［r0，#0］
　　STRH r1，［r0，#4］
　　LDMIB r0，{r3，r12}
　　MOV r0，r3，LSR #16
　　ORR r0，r0，r12，LSL #16
　　BX lr
　　從編譯后的匯編代碼不難看出，對結(jié)構(gòu)體內(nèi)符號自然邊界對齊的域，編譯器直接使用相應(yīng)的Load/Store指令進行訪問，而只有那些非自然邊界對齊的域，編譯器才進行附加處理。這樣，從時間和空間兩方面減小了程序的開銷。
　　同一原理也適應(yīng)于聯(lián)合體結(jié)構(gòu)（unions）。使用在存儲器中未對齊的聯(lián)合組件的__packed屬性。
　　13.1.3 用于半字存取的非對齊 LDR指令
　　一些特殊情況下，ARM編譯程序可以生成非對齊LDR指令。特別是編譯程序從存儲器中載入半字時將使用該方法。這是因為，通過使用相應(yīng)地址，所需的半字可以載入到寄存器的高半段（bits［31:16］），然后通過移位，將有效數(shù)據(jù)移到寄存器的低半段（bits［15：0］）。這樣做的目的是通過減少內(nèi)存訪問次數(shù)來減少程序的執(zhí)行時間。通過上面的方法，程序只需要一次存儲器的訪問，而使用LDRB指令做同樣的操作需要兩次存儲器的存取，而且還要為將這兩個字節(jié)合并在一起添加特殊的代碼。在ARM體系結(jié)構(gòu)v3和其早期版本中，通常使用該方法進行所有的半字載入。但在ARMv4及其以后版本中，出現(xiàn)了專門的半字載入指令，這種方法逐漸被取代。但是，非對齊LDR指令仍可能會出現(xiàn)，比如在一個充填結(jié)構(gòu)中存取一個非對齊short域類型。
　　注意在RVCT中已經(jīng)不再支持ARMv3架構(gòu)。
　　13.1.4 移植代碼并檢測非對齊內(nèi)存訪問
　　在非RISC體系結(jié)構(gòu)的處理器上執(zhí)行的代碼中，可能會存在使用指針訪問非自然邊界對齊的數(shù)據(jù)類型。這種操作，在ARM體系結(jié)構(gòu)中是不允許的。這就給代碼的移植帶來很大困難。用戶必須識別并更改此類內(nèi)存訪問代碼才能使其在RISC體系結(jié)構(gòu)的處理器上正確執(zhí)行。
　　識別非對齊存取可能會很困難，因為使用非對齊地址進行的載入或存儲操作會產(chǎn)生不正確的動作。追蹤到底是哪部分的C源程序造成了這個問題是很困難的。
　　具有完整存儲器管理單元（MMUs）的ARM處理器，例如ARM920TTM，支持內(nèi)存對齊檢測功能，用戶可以通過設(shè)置MMU使處理器檢測每一次的內(nèi)存訪問以確保其被正確地對齊。如果出現(xiàn)非對齊內(nèi)存訪問，MMU將產(chǎn)生數(shù)據(jù)中斷。這樣就給追蹤出錯代碼帶來了很大的方便。
　　對于一些簡單的沒有MMU的內(nèi)核，如ARM7TDMI，最好的方法是在ASIC（Application Specific Integrated Circuit）/ASSP（Application Specific Standard Product）內(nèi)部實現(xiàn)對齊檢測。可以增加專門的ARM內(nèi)核擴展硬件，由其監(jiān)控每次數(shù)據(jù)的訪問的內(nèi)存大小和存取地址總線的最低有效位。在非對齊存取的情況下，可以通過配置ASIC/ASSP產(chǎn)生中斷信號（ABORT）。ARM公司建議在需要運行移植代碼設(shè)備中包含這樣的ASIC/ASSP邏輯。
　　如果在設(shè)計系統(tǒng)時，將系統(tǒng)設(shè)計成為當(dāng)出現(xiàn)非對齊的內(nèi)存訪問時產(chǎn)生異常，則必須安裝數(shù)據(jù)中斷異常處理程序（Data Abort Handler）。出現(xiàn)非對齊存取時，程序進入數(shù)據(jù)中斷處理程序，并由此識別位于返回地址（在LR中保存的地址）減8（r14-8）的出錯數(shù)據(jù)存取指令。
　　一旦出現(xiàn)數(shù)據(jù)中斷異常，必須通過改變C源程序來修復(fù)非對齊的數(shù)據(jù)訪問。使用下列指令可有條件地完成修復(fù)：
　　#ifdef __arm
　　#define PACKED __packed
　　#else
　　#define PACKED
　　#endif
　　：
　　PACKED int *pi;
　?。?br /> 　　由于代碼大小和性能上的開銷，最好盡可能少采用存取非對齊數(shù)據(jù)。
　　ARM編譯器支持--pointer_alignment和--min_array_alignment與內(nèi)存對齊相關(guān)的編譯選項，詳見ARM相關(guān)文檔。
?