chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TMS320C6678存儲器訪問性能 (下)

電子工程師 ? 來源:網(wǎng)絡(luò)整理 ? 2018-02-19 01:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. DMA訪問存儲器的性能

EDMA3架構(gòu)支持很多功能,可以實現(xiàn)高效的并行數(shù)據(jù)傳輸。本節(jié)討論影響它性能的很多因素,如存儲器類型,地址偏移等。

1.1 DMA傳輸?shù)念~外開銷

一般的傳輸時延被定義為EDMA被觸發(fā)到真正的數(shù)據(jù)傳輸開始的時間。由于數(shù)據(jù)傳輸開始的時間無法用簡單的方法測量,所以我們用最小數(shù)據(jù)單元的傳輸完成時間來代表DMA傳輸?shù)臅r延或額外開銷。根據(jù)不同源/目的地址的組合,這個值會有所不同。表4列出了在1GHz C6678 EVM(64-bit 1333MTS DDR)上測得的從EDMA觸發(fā)(寫ESR)最小數(shù)據(jù)傳輸(1 word)到EDMA 傳輸結(jié)束(讀到IPR=1) 的平均的時鐘周期數(shù)。

表4 EDMA CC0傳輸?shù)念~外開銷

表5 EDMA CC1和EDMA CC2傳輸?shù)念~外開銷

由于EDMA CC0 連接到離SL2 和DDR 比較近的內(nèi)部總線交換網(wǎng)絡(luò),因此它訪問SL2 和DDR 額外開銷比較小。而EDMA CC1 和CC2 連接到離DSP 核的L1 和LL2 比較近的內(nèi)部總線交換網(wǎng)絡(luò),所以它們訪問L1 和LL2 的額外開銷比較小。

IDMA 一般用來在LL2 內(nèi)部拷貝數(shù)據(jù),測試得到的IDMA 的平均額外開銷是61 個時鐘周期。

傳輸?shù)念~外開銷是小數(shù)據(jù)量傳輸要考慮的重要因素。單個數(shù)據(jù)單元的傳輸時間完全由DMA 的額外開銷決定。所以,對于小數(shù)據(jù)量的拷貝,我們需要在用DMA 和用DSP 核之間做權(quán)衡選擇。

1.2 EDMA 10 個傳輸引擎的區(qū)別

C6678 上包含10 個EDMA3 TC (Transfer Controller) 。這10 個傳輸引擎并不完全相同。Table 6 總結(jié)了它們之間的區(qū)別。

表6 EDMA 傳輸引擎之間的區(qū)別

表7 比較了在1GHz C6678 EVM(64-bit 1333MTS DDR)上測得的各個EDMA TC 的最大吞吐量。測試的參數(shù)是ACNT=1024,BCNT=128,AB_Sync(一次傳完ACNTxBCNT)。

表7 1GHz C6678 上EDMA TC 吞吐量比較

對SL2 和DDR 之間的傳輸,TC0_0 和TC0_1 能達(dá)到的吞吐量是其它TC 的兩倍。在本文其它部分,如果沒有特殊說明,EDMA 性能數(shù)據(jù)都是在TC0_0 上測得的。

1.3 EDMA 帶寬和傳輸靈活性的權(quán)衡

EDMA3 支持很多靈活的傳輸參數(shù)配置。多數(shù)配置情況下EDMA 可以充分利用存儲器帶寬;但在某些情況下,傳輸性能可能會有所下降。為了設(shè)計高效的系統(tǒng),我們需要理解什么樣的配置能夠?qū)崿F(xiàn)高效的傳輸,而某些情況下必須在靈活性和效率之間做權(quán)衡。

1.3.1 第一維大小 (ACNT) 的考慮(突發(fā)數(shù)據(jù)塊大?。?/p>

為了充分利用傳輸引擎的帶寬,傳輸盡量大的數(shù)據(jù)塊是非常重要的。

為了充分利用128-bit 或256-bit 的總線,ACNT 應(yīng)該是16 bytes 的整數(shù)倍;為了充分利用EDMA的突發(fā)數(shù)據(jù)塊,ACNT 需要是64 bytes 的整數(shù)倍;為了充分利用EDMA FIFO,ACNT 應(yīng)該至少是512 bytes。

圖7 畫出了在1GHz C6678 EVM(64-bit 1333MTS DDR)上,從SL2 到DDR 傳輸1~24K bytes 數(shù)據(jù)時測得的吞吐量。

圖7 ACNT 對EDMA 效率的影響

從測試結(jié)果可以看出,ACNT 越大,帶寬的利用率越高。

1.3.2 二維傳輸?shù)目紤](傳輸優(yōu)化)

如果2D 傳輸 (AB_Sync)是線性的 (BIDX=ACNT),并且ACNT 是2 的冪次方,EDMA 會把這個2D 傳輸優(yōu)化為1D 傳輸。我們在1GHz C6678 EVM(64-bit 1333MTS DDR)上測試了不同的ACNT 和BCNT 的組合;圖 8是線性2D 傳輸?shù)臏y試結(jié)果,它說明,不管BCNT 是多少,帶寬由ACNTxBCNT 的乘積決定。

圖8 線性 2D 傳輸

如果2D 傳輸不是線性的,帶寬的利用率完全有ACNT 決定(參見圖 7)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲器
    +關(guān)注

    關(guān)注

    38

    文章

    7653

    瀏覽量

    167435
  • TMS320C6678
    +關(guān)注

    關(guān)注

    3

    文章

    39

    瀏覽量

    18566
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    想建立一個TMS320C6678的工程,但是DEVICE選擇的時候沒有TMS320C6678的選項,能指點一嗎?

    本帖最后由 一只耳朵怪 于 2018-6-19 14:37 編輯 我想建立一個TMS320C6678的工程,但是DEVICE選擇的時候沒有TMS320C6678的選項,能指點一嗎?如下圖:?
    發(fā)表于 06-19 00:31

    請問SM320C6678TMS320C6678的區(qū)別有哪些?

    出溫度范圍外,請問SM320C6678TMS320C6678的區(qū)別有哪些?謝謝。
    發(fā)表于 07-24 06:42

    TMS320C6678 連接CMOS攝像頭的接口,請問是將攝像頭連接到TMS320C6678的哪個端口?

    您好!我們項目中需要使用TMS320C6678連接攝像頭進(jìn)行圖像數(shù)據(jù)采集,請問是將攝像頭連接到TMS320C6678的哪個端口?是將CMOS攝像頭直接連上嗎?還是中間需要轉(zhuǎn)換
    發(fā)表于 08-03 08:33

    請問tms320c6678在CPCI板卡上如何設(shè)計

    我想用tms320c6678作為處理設(shè)計一款CPCI的板卡,可是6678上只有PCIE,沒有PCI,我應(yīng)該怎么做才能實現(xiàn)6678與上位機(jī)之間通信,謝謝?。?!
    發(fā)表于 12-28 11:05

    TMS320C6678處理性能怎么樣?

    TMS320C6678處理性能怎么樣?怎么探討TMS320C6678處理的VLFFT演示?
    發(fā)表于 04-19 10:53

    TI TMS320C6678是什么?有何功能

    CPU處理TI TMS320C6678是一款TI KeyStone C66x多核定點/浮點DSP處理,集成了8個C66x核,每核心主頻高
    發(fā)表于 12-30 06:08

    TMS320C6678的相關(guān)資料推薦

    CPU處理TI TMS320C6678是一款TI KeyStone C66x多核定點/浮點DSP處理,集成了8個C66x核,每核心主頻高
    發(fā)表于 01-03 06:07

    TI推出適合高性能計算的8核DSP產(chǎn)品TMS320C6678/TMS320TCI6609

    德州儀器 (TI) 宣布推出 TMS320C66x系列最新產(chǎn)品TMS320C6678TMS320TCI6609 數(shù)字信號處理 (DSP),為開發(fā)人員帶來業(yè)界
    發(fā)表于 11-22 10:40 ?3348次閱讀

    TMS320C6678視頻編解碼實現(xiàn)

    TI 提供了包含有綜合而全面的視頻、音頻和語音編解碼組合的全新多媒體解決方案。TMS320C6678可以幫助實現(xiàn)系統(tǒng)級的低成本、低功耗和高密度媒體解決方案,適用于多媒體網(wǎng)關(guān)、IMS 媒體服務(wù)、視頻會議服務(wù)以及視頻廣播設(shè)備等應(yīng)
    發(fā)表于 01-20 15:52 ?15次下載

    TMS320C6678的用于多核軟件開發(fā)套件 (MCSDK) K的安裝資料

    TMS320C6678的用于多核軟件開發(fā)套件 (MCSDK) K的安裝資料
    發(fā)表于 10-19 09:25 ?15次下載
    <b class='flag-5'>TMS320C6678</b>的用于多核軟件開發(fā)套件 (MCSDK) K的安裝資料

    TMS320C6678處理的VLFFT演示探討與研究

    1,2,4或8核時各自的運行時間。演示的結(jié)果證明了C66X DSP內(nèi)核的優(yōu)異性能,以及TMS320C6678處理跨多核平行化執(zhí)行性能與內(nèi)核
    發(fā)表于 01-31 22:58 ?4715次閱讀
    <b class='flag-5'>TMS320C6678</b>處理<b class='flag-5'>器</b>的VLFFT演示探討與研究

    TMS320C6678存儲器訪問性能詳細(xì)中文資料

    TMS320C6678 有8 個C66x 核,典型速度是1GHz,每個核有 32KB L1D SRAM,32KBL1P SRAM 和512KB LL2 SRAM;所有DSP 核共享4MB SL2 SRAM。一個64-bit1333MTS DDR3 SDRAM接口可以支持8
    發(fā)表于 04-26 17:46 ?14次下載
    <b class='flag-5'>TMS320C6678</b><b class='flag-5'>存儲器</b><b class='flag-5'>訪問</b><b class='flag-5'>性能</b>詳細(xì)中文資料

    TMS320C6678 多核定點和浮點數(shù)字信號處理

    電子發(fā)燒友網(wǎng)為你提供TI(ti)TMS320C6678相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有TMS320C6678的引腳圖、接線圖、封裝手冊、中文資料、英文資料,TMS320C6678真值表,TMS32
    發(fā)表于 11-02 19:35
    <b class='flag-5'>TMS320C6678</b> 多核定點和浮點數(shù)字信號處理<b class='flag-5'>器</b>

    TI TMS320C6678 DSP多核通信開發(fā)說明手冊

    前言本文主要介紹TMS320C6678處理開發(fā)中比較常用的兩種多核通信方式:TI-IPC和OpenMP,以及多核編程注意事項。OpenMP依賴于BIOS-MCSDK多核軟件開發(fā)包中
    發(fā)表于 01-06 09:37 ?32次下載

    基于TMS320C6678的八核DSP雷達(dá)信號分選電路

    電子發(fā)燒友網(wǎng)站提供《基于TMS320C6678的八核DSP雷達(dá)信號分選電路.pdf》資料免費下載
    發(fā)表于 11-06 10:28 ?1次下載
    基于<b class='flag-5'>TMS320C6678</b>的八核DSP雷達(dá)信號分選電路