无码专区人妻系列日韩老司机,周晓琳88部全集BT

一、背景

在《先楫hpm6000的SPI外設(shè)使用四線模式操作讀寫華邦flash》一文中介紹了先楫SPI外設(shè)是為flash器件而生的控制器，但是樓主在該篇文章讀寫flash的頁是用的poll輪詢讀寫spi fifo的接口，并沒用DMA來進行加速優(yōu)化。本篇就是基于SPI配合DMA實現(xiàn)理論速度性能。

二、問題點

（一） SPI FIFO poll阻塞發(fā)送無法發(fā)揮SPI理論速度性能

使用spi poll阻塞的時候，雖然能實現(xiàn)數(shù)據(jù)的完整傳輸，但是傳輸?shù)臅r間并不能達到理想傳輸速度，比如SPI四線模式下，30M的SPI SCLK時鐘，理論可以達到15MB/S速度。但實際測量當(dāng)中并未達到該性能。從邏輯分析儀看到，發(fā)送flas一頁數(shù)據(jù)，也就是256字節(jié)，從開始傳輸?shù)浇Y(jié)束傳輸?shù)臅r間需要37.034us，合計為6.91MB/S，與理論速度相差了2到3倍的距離。

從波形上看，導(dǎo)致這個速度達不到原因就在于，每個字節(jié)之間存在了一定的間隔時間，這些間隔的累積導(dǎo)致傳輸時間變長，導(dǎo)致總的時間變長，進而速度遠遠跟不上。

（二）使用了DMA仍然有SPI SCLK時鐘不連續(xù)問題

從（一）的問題可以看出，要想達到理論速度，必須消除每個字節(jié)的SCLK間隔，縮短傳輸時間。這時候需要DMA來加持速度性能，但實際上，在使用了相關(guān)配置之后，速度雖然有些提升，但還是存在些許間隔產(chǎn)生。

在這里的例子驗證條件是：SPI SCLK時鐘頻率為50M，主機發(fā)送512字節(jié)。理論傳輸速度可以25MB/S.從邏輯分析儀可看到，間隔有所縮短，但依然存在字節(jié)間隔。512字節(jié)傳輸需要45.97us,合計為11.173MB/S。距離25MB/S也有兩倍的差距。

三、解決問題

在二問題的所有描述當(dāng)中，速度達不到理想性能，歸根到底是字節(jié)之間產(chǎn)生間隔累積形成。

所以我們的問題解決點是：再配合DMA，進行其他優(yōu)化。達到理想速度性能。

(一) 使用AHB SRAM(內(nèi)存32KB空間)作為數(shù)據(jù)交互RAM。

在HPM6000系列中，AHB/APB外設(shè)總線連接了一個內(nèi)存為32KB空間的AHB SRAM，與之同時連接的也有DMA控制器之一HDMA。

從官方文檔可知，AHB SRAM和HDMA以及SPI外設(shè)同樣位于AHB/APB外設(shè)總線中，AHB SRAM是專門給HDMA進行低延時訪問的內(nèi)存，也是SPI進行DMA低延時傳輸保證。

在上面的DMA搬運中，待發(fā)送的數(shù)據(jù)放在AXI SRAM中。那么把這發(fā)送的數(shù)據(jù)放在AHB SRAM，看下會不會有所提升。

從以下邏輯分析儀結(jié)果看出，傳輸512字節(jié)，相比放在AXI_SRAM中，在AHB_SRAM只需要22.97us，縮短了23us, 合計22MB/S，提高了兩倍速度性能。當(dāng)仍與25MB/S理想速度有些許差距。

通過放大波形查看，有些字節(jié)依然產(chǎn)生間隔，這也是導(dǎo)致速度沒達到理想速度的原因。

（二）使用DMA的burst突發(fā)傳輸

先楫的DMA，對于源地址數(shù)據(jù)來說，支持突發(fā)傳輸。例如傳輸位寬為8，設(shè)置burst數(shù)量為4，那么就是相當(dāng)一次DMA請求設(shè)置了4個節(jié)拍，連續(xù)傳輸4個字節(jié)。是單次傳輸?shù)?倍效率。在這里來說，待發(fā)送的數(shù)據(jù)就是源地址數(shù)據(jù)。

先楫的SPI控制器有四個字的FIFO數(shù)據(jù)空間，每個FIFO是32位。SPI請求DMA搬運是通過發(fā)送FIFO閾值請求。從效率上來看，最好是一次請求中能把FIFO數(shù)據(jù)全部搬運。從上面的優(yōu)化流程來看，都設(shè)置為了默認，TX FIFO閾值設(shè)置為了0，也就是只要TXFIFO有一個為空就請求一次，DMA的源數(shù)據(jù)burst數(shù)量為0，也就是相當(dāng)設(shè)置了1個節(jié)拍的突發(fā)傳輸，傳輸寬度為8位，一次DMA請求就塞給一次FIFO，等待FIFO完全塞滿后這時候沒法請求，所以會導(dǎo)致一次周期的間隔，當(dāng)DMA收到請求后連這樣能解釋上面為何每隔四個字節(jié)會產(chǎn)生間隔的原因。

所以這里我們可以SPI的TXFIFO閾值為3，當(dāng)出現(xiàn)一個空位的時候就請求一次，設(shè)置burst數(shù)量為2，也就是四個字節(jié)，一次請求搬運四個字節(jié)。通過邏輯分析儀可看到:

配合（一）的方案，傳輸512字節(jié)，只需要20.468us,合計為25MB/S左右，接近了理想速度性能了。

放大波形查看，也能看到SCLK時鐘連續(xù)了。

（三）壓榨性能（使用SPI的字節(jié)合并merge功能）

先楫官方手冊說明的是SPI時鐘可以80M，保守是40M。在四線模式下，SPI時鐘SCLK為80M，相比單線來說可以提高四倍性能傳輸，也就是可以達到40MB/S。

但是在實際操作的時候，分頻SPI SCLK頻率到66M，又出現(xiàn)了SCLK時鐘不連續(xù)的情況，導(dǎo)致與理想速度不符合。

仔細翻下官方手冊，可以知道SPI有個寄存器是TRANSFMT，有一個位是DATAMERGE，對于描述如下：

特別說明的是，由于SPI的數(shù)據(jù)FIFO是32位，這個功能只在數(shù)據(jù)單位長度為8位的時候有效，而且合并的數(shù)據(jù)量需要以四的整數(shù)倍。如此來說，在配置DMA的時候，傳輸寬度可以從8位變到32位，傳輸?shù)膸捯材芴岣吡怂谋丁Ｄ敲次覀冞@樣配置下，邏輯分析儀結(jié)果如下：

在66M的SPI SCLK時鐘下，邏輯分析儀抓到的SCLK能保持連續(xù)，并且數(shù)據(jù)能對得上。512字節(jié)耗時15.352us，合計33MB/S左右，與理論速度33MB/S接近。

80M的SPI SCLK頻率，傳輸512字節(jié)，耗時12.794us，合計40MB/S左右，也能滿足預(yù)期40MB/S速度。

SCLK波形也能保持連續(xù)。

四、號外（單線SPI總線可以達到120M）

四線模式既然能達到80M，那么樓主想試下80M的單線，也是沒問題的，效果如下：

再嘗試一把，把SPI SCLK分頻到120M，只是稍微有點間隔，但單線SPI也是沒問題的。

五、總結(jié)

對于先楫這個SPI外設(shè)來說，配合DMA，SPI的數(shù)據(jù)FIFO以及相關(guān)SPI配置，能達到手冊描述的性能。無論是四線模式還是二線模式還是單線模式，都能到達80M的SPI時鐘性能。

對于SCLK不連續(xù)的問題在于DMA搬運和SPI傳輸不同步造成，導(dǎo)致傳輸間隔中斷，特別是SPI頻率越來越高的情況下。解決同步問題就不會有SCLK不連續(xù)的問題存在。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴