chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Cortex-A15架構(gòu)解析:它為什么這么強(qiáng)

電子工程師 ? 2018-04-06 08:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Cortex-A15架構(gòu)解析:它為什么這么強(qiáng),今年的新手機(jī)趨勢無異是全面向四核靠攏,不過同樣是四核,在實(shí)際的性能上其實(shí)是千差萬別。例如針對入門級主流市場的四核手機(jī)普遍采用的都是Cortex-A7以及Cortex-A9級別的CPU內(nèi)核,這類內(nèi)核性能、成本以及發(fā)熱都會

今年的新手機(jī)趨勢無異是全面向四核靠攏,不過同樣是四核,在實(shí)際的性能上其實(shí)是千差萬別。例如針對入門級主流市場的四核手機(jī)普遍采用的都是Cortex-A7以及 Cortex-A9 級別的CPU內(nèi)核,這類內(nèi)核性能、成本以及發(fā)熱都會較低,因此在入門市場上大行其道。

而在高端智能手機(jī)中則出現(xiàn)了一些新的變化,除了去年就已經(jīng)嶄露頭角的高通Krait系列架構(gòu)四核外,ARM正統(tǒng)的Cortex-A15也開始走上了四核手機(jī)的舞臺,例如三星的Exynos 5 Octa、NVIDIA 的Tegra 4。

Cortex-A15是ARM Cortex-A家族中目前最強(qiáng)勁的CPU內(nèi)核架構(gòu),發(fā)布時間為2010年,德州儀器是最早(2011年)投產(chǎn)基于該架構(gòu)處理器(型號為OMAP 5)的授權(quán)廠商。

和ARM的Cortex-A7、Cortex-A9等微架構(gòu)相比,Cortex-A15有很大的不同。

A15和A9同樣具備亂序執(zhí)行,但是Cortex-A15具備(兩倍)的指令發(fā)射端口和執(zhí)行資源,指令解碼能力也要高出50%,動態(tài)分支預(yù)測能力更強(qiáng)(采用了多層級分支表緩存),指令拾取帶寬更強(qiáng)(128 bit vs 64 bit),這些都能讓A15的流水線執(zhí)行具備更高的效率。除此以外,A15采用了VFPv4浮點(diǎn)單元設(shè)計,能執(zhí)行FMA指令以及硬件除法指令,相較而言A9的峰值向量浮點(diǎn)性能基本上只有A15的一半。

不過在現(xiàn)實(shí)中,A15 的對手應(yīng)該是高通自行設(shè)計的 ARMv7A 兼容處理器架構(gòu) Krait。高通對 Krait 的架構(gòu)細(xì)節(jié)透露并不是很多,大致上就是 3 個指令解碼端口(和 A15 一樣)、7個指令發(fā)射端口(A15 是8個)、4個發(fā)射端口(A15 是8個),具備4KB+4KB的單周期時延L0 Cache設(shè)計。

如果采用老掉牙的Dhrystone DMIPS/MHz作為性能衡量指標(biāo),Krait 是3.3,A9 是2.5,而A15則是3.5,從紙面上看Krait的確非常適合作為A15的對手。

不過Dhrystone的缺點(diǎn)是顯而易見,它是完全可以塞進(jìn)CPU的L1 cache里執(zhí)行,這就意味著無法以此對L2 cache(A15是一體化設(shè)計,Krait是分離式設(shè)計,一體化設(shè)計可以減少內(nèi)存交換導(dǎo)致的大量時延)、亂序執(zhí)行的硬件效率/復(fù)雜性、內(nèi)存子系統(tǒng)單元(A15的內(nèi)存單元可以實(shí)現(xiàn)在一定條件下預(yù)執(zhí)行一條加載指令,而Krait能否具備這樣的能力尚不清楚)等諸多體系架構(gòu)區(qū)別對實(shí)際性能的影響作出有價值評估。

當(dāng)然,ARM采用的DMIPS指標(biāo)實(shí)際上并非28年前的那個Dhrystone,而是來自EEBMC Coremark(其實(shí) Coremark 就是前者的改善版本,主要是為了減少預(yù)優(yōu)化、對測試有比較嚴(yán)格的規(guī)則),但是CoreMark同樣可以塞進(jìn)現(xiàn)今大多數(shù)處理器的L1 cache里,Dhrystone不能反映現(xiàn)今移動設(shè)備真實(shí)應(yīng)用的問題在這里依然存在。

由于應(yīng)用環(huán)境日趨復(fù)雜,要正確評估一個移動設(shè)備處理器的性能變得越來越復(fù)雜,因?yàn)楝F(xiàn)在的移動設(shè)備跑的網(wǎng)頁瀏覽、三維游戲、音視頻、人工智能等都不可能可以完全塞進(jìn)L1 Cache里,因?yàn)檫@些應(yīng)用牽涉到大量的數(shù)據(jù)處理。

這時候,人們在臺式機(jī)性能評估上學(xué)到的經(jīng)驗(yàn)和測試辦法就可以在移動設(shè)備上采用了。對CPU測試來說,最合理的測試方式是采用多種計算規(guī)模的真實(shí)應(yīng)用源代碼以本機(jī)代碼進(jìn)行編譯再進(jìn)行測試,在這樣的情況下移動設(shè)備的計算單元、內(nèi)存單元都得以充分考驗(yàn),測試結(jié)果最具參考價值。

能夠獲得業(yè)界(計算機(jī)工業(yè)、學(xué)術(shù)科研)官方認(rèn)可的CPU測試當(dāng)屬SPEC.org的SPEC CPU,它就是采用源代碼方式,讓測試人員可以編譯為本機(jī)代碼來測試,許多處理器在研發(fā)伊始就采用SPEC CPU作為最重要的性能評估指標(biāo)。

SPEC CPU的最新版本為CPU2006,但是CPU2006針對的是當(dāng)前的臺式機(jī)、工作站、服務(wù)器處理器應(yīng)用環(huán)境,內(nèi)存容量(CPU2006 支持多線程測試,因此要求的內(nèi)存容量相當(dāng)高,8線程處理器用16 GB內(nèi)存也是有點(diǎn)勉強(qiáng))和自身存儲空間(未編譯時就要數(shù)GB空間,編譯后就要占用1xGB了)要求都較高,因此采用CPU2006對目前的移動設(shè)備來說是不太現(xiàn)實(shí)的。

SPEC CPU是每隔幾年就更新一次,在CPU2006之前的舊版本為CPU2000,它的speed整數(shù)性能測試完全可以在1GB級別的移動設(shè)備上運(yùn)行,在以前甚至有一些 CPU2000的測試被移植到GPU上做加速性能測試。

ARM陣營極少公布SPEC CPU測試結(jié)果,這當(dāng)然也是有原因的,因?yàn)樵谶^去的不少時間里,ARM針對的設(shè)備大都只有幾百兆內(nèi)存空間,塞進(jìn)操作系統(tǒng)后,留給程序運(yùn)行的空間就更少,此外由于省電先決的考量ARM處理器的性能其實(shí)真的不怎么樣。

不過有意思的是,今年ARM陣營里的NVIDIA在發(fā)布Tegra 4的時候公布了CPU2000INT的測試結(jié)果:在1.9GHz 頻率設(shè)定的NVIDIA參考平臺里,Tegra 4的SPEC PU2000int_base 為1168。這個測試結(jié)果相當(dāng)于2003年第四季度 SPEC.org 上公布的AMD K8 Sledgehammer 2GHz測試結(jié)果。

NVIDIA還進(jìn)行了在小米手機(jī)2(采用高通 Snapdragon S4 Pro 即 APQ8064 1.7GHz)上的CPU2000測試,并且根據(jù)高通公布的S800相對S600在IPC(每周期指令)和頻率上的變化幅度而估算出來的S800的CPU2000測試結(jié)果:

從圖表來看,S600的CPUINT2000_base測試結(jié)果相當(dāng)于Tegra 4的一半不到,這在很大程度上反映了Cortex-A15相對Krait系處理器的真實(shí)應(yīng)用差別。

需要指出的是,雙方的測試平臺本身也是有一些影響的,例如小米手機(jī)2執(zhí)行這個測試的時候,CPU頻率是否存在降頻現(xiàn)象,NVIDIA對此沒有說明。

一般來說,像APQ8064在四核全速運(yùn)行的時候,會在一段時間內(nèi)由于過熱而導(dǎo)致頻率從最高的1.7GHz開始下降。當(dāng)然,NVIDIA在這里公布的是speed模式下的CPU2000INT測試結(jié)果,這個模式下是單線程的測試,只有一個CPU內(nèi)核會被使用。

比較遺憾的是高通對這個測試結(jié)果尚未提出異議(據(jù)說高通對于處理器性能的孰高孰低并不十分看重,他們戲稱是賣基帶送CPU),而CPU2000的配置對一般人來說是相當(dāng)復(fù)雜的事情,所以這個測試暫時沒有第三方使用同樣的平臺測試佐證。

威盛電子在發(fā)布Nano X2處理器的時候曾經(jīng)公布過一份文件,里面也有采用CPU2000對Nano X2 1.2+GHz和Atom D525進(jìn)行測試,其中g(shù)cc編譯器出來的CPU2000 INT成績分別為799和582,采用Intel編譯器出來的成績分別是955和725。

NVIDIA的Tegra 4的CPU屬于ARMv7A指令集,因此編譯器很可能是armcc或者gcc,NVIDIA新近收購的PGI是一家老牌編譯器廠商,也許它能提供內(nèi)部測試版給 NVIDIA,只是PGI過往從未發(fā)布過ARM系編譯器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Cortex-A15
    +關(guān)注

    關(guān)注

    1

    文章

    13

    瀏覽量

    13394
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于蜂鳥E203架構(gòu)的指令集K擴(kuò)展

    向量操作指令,例如向量加法、向量乘法等。 在蜂鳥E203架構(gòu)中,可以添加K擴(kuò)展指令集,以處理大規(guī)模的數(shù)據(jù)集,可以添加以下指令: 1.VADD:向量加法指令,將兩個向量相加并存儲結(jié)果到一個向量寄存器中
    發(fā)表于 10-21 09:38

    迅為Hi3403V610開發(fā)板海思Cortex-A55架構(gòu)核心板卡

    迅為電子重磅推出基于海思Hi3403處理器的高性能核心板,采用先進(jìn)的四核Cortex-A55架構(gòu),主頻高達(dá)1.4GHz,以強(qiáng)勁算力、超凡能效比與卓越的圖像處理能力,為千行百業(yè)的智能化升級注入核心動力。無論是智能視覺、工業(yè)互聯(lián),還是AIoT邊緣計算,它都能輕松駕馭,助您暢快
    的頭像 發(fā)表于 09-30 14:18 ?392次閱讀
    迅為Hi3403V610開發(fā)板海思<b class='flag-5'>Cortex-A</b>55<b class='flag-5'>架構(gòu)</b>核心板卡

    五大電磁頻譜管理系統(tǒng):原理、架構(gòu)與應(yīng)用全景解析

    五大電磁頻譜管理系統(tǒng):原理、架構(gòu)與應(yīng)用全景解析
    的頭像 發(fā)表于 09-26 10:21 ?339次閱讀
    五大電磁頻譜管理系統(tǒng):原理、<b class='flag-5'>架構(gòu)</b>與應(yīng)用全景<b class='flag-5'>解析</b>

    【PZ-ZU15EG-KFB】——ZYNQ UltraScale + 異構(gòu)架構(gòu)下的智能邊緣計算標(biāo)桿

    璞致電子推出PZ-ZU15EG-KFB異構(gòu)計算開發(fā)板,搭載Xilinx ZYNQ UltraScale+ XCZU15EG芯片,整合四核ARM Cortex-A53、雙核Cortex
    的頭像 發(fā)表于 07-22 09:47 ?696次閱讀
    【PZ-ZU<b class='flag-5'>15</b>EG-KFB】——ZYNQ UltraScale + 異構(gòu)<b class='flag-5'>架構(gòu)</b>下的智能邊緣計算標(biāo)桿

    PTR54L15藍(lán)牙模組的引腳規(guī)劃——電源域

    更加的強(qiáng)大,使用上也有些不同,關(guān)于這個模組的引腳該如何規(guī)劃使用呢,現(xiàn)在我們來說下電源域: “電源域”是芯片的一部分,可以獨(dú)立開機(jī)或關(guān)機(jī)以優(yōu)化能耗 引腳規(guī)劃需注意,PTR54L15架構(gòu)分 MCU、無線電、外設(shè)、低功耗四個電源域,各域含不同外設(shè)及 GPIO 端口,合理分配引腳
    發(fā)表于 06-25 19:13

    迅為iTOP-3588S開發(fā)板核心板引腳240PIN全部引出8GB內(nèi)存32GBEMMC存儲

    性能強(qiáng) iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2
    發(fā)表于 06-23 11:19

    ARM最強(qiáng)超大核Cortex-X925與小米玄戒O1的深度解析

    ARM Cortex-X925:架構(gòu)革新與性能巔峰的全新標(biāo)桿 作為ARM迄今最強(qiáng)大的CPU核心,Cortex-X925基于Armv9.2-A架構(gòu)
    的頭像 發(fā)表于 05-23 15:29 ?2941次閱讀

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強(qiáng) iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2
    發(fā)表于 05-15 10:36

    迅為瑞芯微iTOP-3588開發(fā)板/核心板

    性能強(qiáng) iTOP-3588開發(fā)板采用瑞芯微RK3588處理器,是全新- -代AloT高端 應(yīng)用芯片,采用8nm LP制程,搭載八核64位CPU,四核Cortex-A76 和四核Cortex-A
    發(fā)表于 04-16 17:02

    迅為iTOP-RK3588S開發(fā)板/核心板瑞芯微RK3588S處理器6TOPS算力內(nèi)置NPU

    性能強(qiáng) iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2
    發(fā)表于 04-10 11:13

    iTOP-3588開發(fā)板采用瑞芯微RK3588處理器四核心架構(gòu)GPU內(nèi)置獨(dú)立NPU強(qiáng)大的視頻編解碼

    性能強(qiáng) iTOP-3588開發(fā)板采用瑞芯微RK3588處理器,是全新- -代AloT高端 應(yīng)用芯片,采用8nm LP制程,搭載八核64位CPU,四核Cortex-A76 和四核Cortex-A
    發(fā)表于 04-09 16:09

    Arm發(fā)布基于Armv9架構(gòu)Cortex-A320處理器

    邊緣 AI 需要更卓越的計算性能、更強(qiáng)大的安全性,以及更出色的軟件靈活性。隨著軟件愈發(fā)復(fù)雜化,Armv9 架構(gòu)應(yīng)運(yùn)而生,以提供先進(jìn)的機(jī)器學(xué)習(xí) (ML) 和 AI 功能,并具備增強(qiáng)的安全特性。該架構(gòu)現(xiàn)已在 Cortex-A3xx
    的頭像 發(fā)表于 02-27 17:10 ?1157次閱讀

    迅為iTOP-RK3588S開發(fā)板/核心板6TOPS的NPU算力視頻編解碼8K編碼+8K解碼

    性能強(qiáng) iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2
    發(fā)表于 02-20 14:24

    迅為RK3588S開發(fā)板/核心板介紹

    性能強(qiáng) iTOP-3588S開發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2
    發(fā)表于 02-13 14:40

    迅為RK3588與3588S開發(fā)板/核心板選型硬件的區(qū)別

    ,是全新一代AloT高端應(yīng)用芯片,采用8nm LP制程,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu),主頻高達(dá)2.4GHz,8GB內(nèi)存,32GB EMMC。集成Mali
    發(fā)表于 12-20 15:40