作者: xhackerustc@21ic
國慶前有一塊RA生態(tài)工作室出品的RA8D1B-CPKCOR開發(fā)板到了,主控瑞薩RA8D1B MCU,基于Arm Cortex-M85,支持Helium 和 TrustZone,CPU頻率高達480MHZ。似乎是世界第一款使用Cortex-M85的MCU?RA8D1集成2MB flash和1MB的SRAM,I/D-cache 32KB。集成一堆豐富外設(shè)主控,比如usb、eth、i2c、i3c、spi、sdhci、ospi、canfd、MIPI-DSI、CEU攝像頭、2D圖形、TFT顯示控制等等,MCU功能已經(jīng)非常強大。更有意思的是RA8D1B-CPKCOR板載了32MB SDRAM,16MB的QSPI flash,看到這些尤其是32MB的SDRAM筆者覺得這板子足夠跑linux系統(tǒng)了,雖然Cortex-M85無MMU,但主線linux早已經(jīng)支持NOMMU了。要說生態(tài)沒有哪個RTOS能和linux比生態(tài),在不要求硬實時的應用場景中利用linux系統(tǒng)的豐富生態(tài)能大大降低軟件工作量。一個復雜MCU平臺的軟件工作量非常大,特別是集成M7、M85這樣高性能的core(M7 coremark/MHZ超過A7)的MCU,外設(shè)通常也是比較豐富的,大多數(shù)系統(tǒng)還板載了SDRAM或PSRAM,如果再以裸機思維去做軟件,軟件復雜度大到不可想象。
那咱們就開始RA8D1B移植linux的旅程了:

初始化sdram,其實RA生態(tài)工作室其實做好了,直接把他們的board_sdram.c和board_sdram.h拷貝過來即可。這一步最好做下內(nèi)存讀寫的壓力測試,我沒用他們的測試code,自己寫了一份,為啥呢:linux下讀寫內(nèi)存1字節(jié)、2字節(jié)、4字節(jié)都可能的,我想都測到,測試代碼如下:
#define SDRAM_BASE_ADDRESS (0x68000000U) static void sdram_test(void) { int i; uint32_t addr; uint32_t t1; uint8_t testbuf[64]; void *p = (void *)SDRAM_BASE_ADDRESS; APP_PRINT("Writing SDRAM...\n"); printf("Writing SDRAM...\n"); for (addr = 0; addr < 32 * 1024 * 1024; ++addr) { uint8_t data = addr & 0xff; *(uint8_t *)(p + addr) = data; } APP_PRINT("Reading SDRAM...\n"); printf("Reading SDRAM...\n"); for (addr = 0; addr < 32 * 1024 * 1024; ++addr) { uint8_t data, expected; expected = addr & 0xff; data = *(uint8_t *)(p + addr); if (data != expected) APP_PRINT("SDRAM 8bit read failed at %lx (%x != %x)\n", addr, data, expected); } APP_PRINT("SDRAM 8bit read pass.\n"); printf("SDRAM 8bit read pass.\n"); for (addr = 0; addr < 32 * 1024 * 1024; addr += 2) { uint16_t data, expected; expected = (((addr + 1) & 0xff) << 8) | (addr & 0xff); data = *(uint16_t *)(p + addr); if (data != expected) APP_PRINT("SDRAM 16bit read failed at %lx (%x != %x)\n", addr, data, expected); } APP_PRINT("SDRAM 16bit read pass.\n"); printf("SDRAM 16bit read pass.\n"); for (addr = 0; addr < 32 * 1024 * 1024; addr += 4) { uint32_t data, expected; expected = (((addr + 3) & 0xff) << 24) | (((addr + 2) & 0xff) << 16) | (((addr + 1) & 0xff) << 8) | (addr & 0xff); data = *(uint32_t *)(p + addr); if (data != expected) APP_PRINT("SDRAM 32bit read failed at %lx (%lx != %lx)\n", addr, data, expected); } APP_PRINT("SDRAM 32bit read pass.\n"); printf("SDRAM 32bit read pass.\n"); memset(testbuf, 0x5a, sizeof(testbuf)); DWT_init(); t1 = DWT_get_count(); for (i = 0; i < 10000; ++i) { memcpy(p, testbuf, 64); } t1 = DWT_get_count() - t1; t1 = DWT_count_to_us(t1); t1 /= 1000; APP_PRINT("SDRAM write speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); printf("SDRAM write speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); t1 = DWT_get_count(); for (i = 0; i < 10000; ++i) { memcpy(testbuf, p, 64); } t1 = DWT_get_count() - t1; t1 = DWT_count_to_us(t1); t1 /= 1000; APP_PRINT("SDRAM read speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); printf("SDRAM read speed: %ld B/s.\n", 64 * 10000 * 1000 / t1); for (;;) { APP_PRINT("SDRAM test done\n"); printf("SDRAM test done\n"); __WFI(); } }
這一步其實還有用FSP配置并生成項目工程,本人因習慣于Linux下開發(fā),所以生成的是CMake工程。這一步網(wǎng)上測評很多鋪天蓋地,且FSP使用并非本次主目標,這里不再贅述。

加載內(nèi)核image、dtb等可以從sd卡加載也可以從flash上加載,但bootloader不是本次主目標,能否偷懶呢?不要忘記板載的jlink,完全可以用jlink把內(nèi)核image和dtb加載到SDRAM指定位置,jlink加載命令語法如下:
loadfile FILE address noreset
比如
loadfile /tmp/Image.bin 0x68008000 noreset
noreset意思是只加載后不要reset目標板,jlink loadfile默認是reset的。
加載解決了,跳轉(zhuǎn)內(nèi)核入口呢?easy,使用jlink的wreg命令即可,語法如下:
wreg rN value
建議segger這里做下簡單更新,方便用戶,畢竟打雙引號再空格再括號相當繁瑣。

32位arm對每款cpu都有一個所謂proc_info的結(jié)構(gòu)體,成員包含cpu setup函數(shù),cache操作函數(shù),hwcaps變量等等,cortex-m85呢筆者做這個事情的時候主線linux中還沒有這個結(jié)構(gòu)體。經(jīng)閱讀cortex-m85 TRM可以知道就上述操作函數(shù)等來講它和cortex-m55是兼容的,所以筆者打了個補丁如下:
--- a/arch/arm/mm/proc-v7m.S +++ b/arch/arm/mm/proc-v7m.S @[url=home.php?mod=space&uid=72445]@[/url] -194,6 +194,16 @[url=home.php?mod=space&uid=72445]@[/url] ENDPROC(__v7m_setup) .long \cache_fns .endm + /* + * Match ARM Cortex-M85 processor. + */ + .type __v7m_cm85_proc_info, #object +__v7m_cm85_proc_info: + .long 0x410fd230 /* ARM Cortex-M85 0xD23 */ + .long 0xff0ffff0 /* Mask off revision, patch release */ + __v7m_proc __v7m_cm85_proc_info, __v7m_cm7_setup, hwcaps = HWCAP_EDSP, cache_fns = v7m_cache_fns, proc_fns = cm7_processor_functions + .size __v7m_cm85_proc_info, . - __v7m_cm85_proc_info + /* * Match ARM Cortex-M55 processor. */

+++ b/arch/arm/include/asm/v7m.h @[url=home.php?mod=space&uid=72445]@[/url] -51,6 +51,7 @@ */ #define EXC_RET_STACK_MASK 0x00000004 #define EXC_RET_THREADMODE_PROCESSSTACK (3 << 2) +#define EXC_RET_FTYPE (1 << 4) /* Cache related definitions */ diff --git a/arch/arm/mm/proc-v7m.S b/arch/arm/mm/proc-v7m.S index ed7781c84341..fdae077d2654 100644 --- a/arch/arm/mm/proc-v7m.S +++ b/arch/arm/mm/proc-v7m.S @[url=home.php?mod=space&uid=72445]@[/url] -138,6 +138,7 @[url=home.php?mod=space&uid=72445]@[/url] __v7m_setup_cont: 1: cpsid i /* Calculate exc_ret */ orr r10, lr, #EXC_RET_THREADMODE_PROCESSSTACK + orr r10, #EXC_RET_FTYPE ldmia sp, {r0-r3, r12} str r5, [r12, #11 * 4] @ restore the original SVC vector entry mov lr, r6 @ restore LR

linux系統(tǒng)必有至少一個clockevent提供心跳中斷,一個clocksource提供計時。其中clockevent必須的,clocksource可以由內(nèi)核的jiffies代替,詳細筆者就不贅述了,因為前前后后講清楚它們可以長篇大論寫兩三篇大文章,linux內(nèi)核這塊其實還蠻復雜的,但對clockevent和clocksource驅(qū)動要提供的接口來說變簡單了,以后有機會再寫吧。對應到MCU來說,其實就是timer嘛,RA8D1B里集成的timer多的是,各種口味的都有。對著RA8D1B的手冊寫clockevent/clocksource驅(qū)動難度不大,但是,筆者這次想換個**,咱能不能利用arm自由的資源呢?我們知道arm M類cpu都有一個systick且支持中斷,所以理論上可以把它抽象成一個clockevent的。目前l(fā)inux內(nèi)核主線中把這個systick當clocksource用的,不支持clockevent,它的代碼在drivers /clocksource /armv7m _ systick.c。咱給它改造改造整個容,經(jīng)筆者整容之后的armv7m _ systick.c眉清目秀,盤亮條順。

要看基本linux啟動成功可用,最簡單的還是一個tty console。console用uart做比較簡單,這個RA8D1B里也有好幾個uart,而且特性豐富功能強大,而且似乎內(nèi)核中有一個同出一門眾芯片的串口驅(qū)動drivers/tty/serial/sh-sci.c,但似乎寄存器不是太一致,所以接下來咱就對著手冊改寫串口驅(qū)動嗎?NoNoNo,一般來說特性豐富功能強大就暗示著還是蠻復雜的,不信你去讀一讀sh-sci.c,咱能否粗糙猛方式搞定linux呢?咱又看上jlink了,它不是有個RTT (Real Time Terminal)么,既然號稱Real Time Terminal,代替?zhèn)€串口做console那是小菜一碟阿。但是Segger的RTT代碼不能直接用,因為SDRAM有32MB,這么大空間都搜一遍么?而且別忘記Cortex-M85是可以帶有D-cache的,恰好RA8D1B里的這個M85就配置了D-Cache, linux肯定開啟cache了,RTT代碼注釋和文檔里對使能了cache這塊其實有很多的說明。筆者這>里換了一個思路,不要用SDRAM而是SRAM阿或者DTCM一部分來做RTT控制塊,DTCM是不經(jīng)cache的。另外為了通用性,咱們這里還需要使用DT(Device Tree)技術(shù)而不是hardcoding來設(shè)置RTT控制塊的地址,然后通過如下命令告訴jlink到哪里去找RTT控制塊:
exec SetRTTAddr 0x20000000

最后根據(jù)MCU和板級具體情況做個簡單的dts,主要就是告訴SDRAM起始地址阿大小阿什么的,還有上面說的rtt的設(shè)備節(jié)點。
至此,linux內(nèi)核層的事情搞定了,咱來搞定linux用戶層。

buildroot對NOMMU Linux支持得非常好,基本是拿來就用,buildroot使用方法網(wǎng)上也是很多的,前后>講完也是很費時的,這里筆者也不多著筆墨了,因為linux userspace也不是主要目標。這個步驟的輸>出是一個用busybox做的簡單rootfs,可以在內(nèi)核編譯時builtin進去省去加載initrd/rootfs的過程。

上述dts編譯成一個dtb,重命名為dtb.bin,內(nèi)核(帶rootfs builtin)編譯成一個Image,重命名為Image.bin。

板子上電,燒錄前面講的bootloader,重啟板子,運行jlink掛上去,運行如下命令:
halt exec SetRTTAddr 0x20000000 loadfile /tmp/Image.bin 0x68008000 noreset loadfile /tmp/dtb.bin 0x68004000 noreset wreg "R15 (PC)" 0x68008001 wreg r0 0 wreg r2 0x68004000 go
第一個命令停止cpu,第二個命令是告訴jlink RTT控制塊地址,后面是加載內(nèi)核Image和跳轉(zhuǎn)內(nèi)核入口,至于為啥這么設(shè)置請參考arm linux內(nèi)核啟動協(xié)議,網(wǎng)上很多,筆者不再贅述了。
再起一個shell運行如下命令獲得RA8D1B的linux shell
telnet 127.0.0.1 19021
最后運行NOMMU Linux的視頻供參考:

-
mcu
+關(guān)注
關(guān)注
146文章
17751瀏覽量
358770 -
Linux
+關(guān)注
關(guān)注
87文章
11432瀏覽量
212460 -
開發(fā)板
+關(guān)注
關(guān)注
25文章
5432瀏覽量
101237
發(fā)布評論請先 登錄
瑞薩RA8D1單片機IO中斷配置實現(xiàn)方法

瑞薩電子RA8E1和RA8E2 MCU新品解讀

【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】帶你認識RA-Eco-RA2E1-48PIN-V1.0開發(fā)板
【瑞薩RA8D1 CPK開發(fā)板】RA8D1移植ThreadX操作系統(tǒng)
【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】先來點個燈
【瑞薩RA8D1 CPK開發(fā)板試用】開箱與點燈
【RA-Eco-RA0E1-32PIN-V1.0開發(fā)板試用】點燈
基于Arm Cortex-CM85內(nèi)核的RA8D1作為控制器 通過MIPI DSI實現(xiàn)LVGL顯示

基于瑞薩電子RA系列的野火耀陽RA8D1開發(fā)板產(chǎn)品簡介

《RA8D1 Vision Board開發(fā)實踐指南》上線啦

評論