视频一区二区刘玥,在线观看黄AⅤ免费观看无毒 ,中文精品之北条麻妃国产

我們先看一個(gè)例子：

有這么兩個(gè)程序：它們的目的就是將數(shù)組x中的數(shù)，按照下標(biāo)累加到數(shù)組y中，最后在把數(shù)組y中的數(shù)據(jù)累加到一個(gè)數(shù)dest里面。為了驗(yàn)證效果，我們將這個(gè)過程重復(fù)10000遍。

Prog 1 Prog2

這兩個(gè)程序的區(qū)別就在Prog2中紅框里面的內(nèi)容。那么哪個(gè)程序運(yùn)行的更快呢？

話不多說，我們看實(shí)際的結(jié)果：

這里為了說明效果，我們編譯的時(shí)候，并沒有采用優(yōu)化（編譯優(yōu)化，確實(shí)可以提高程序運(yùn)行的效率，但是過高的編譯優(yōu)化等級(jí)會(huì)有一定的副作用，另外編譯器優(yōu)化也具有一定的局限性，高效的代碼仍然應(yīng)該是我們追求的目標(biāo)）。可以看到，Prog2要明顯比Prog1快。

要想理解上面的例子，我們必須先介紹一下寄存器和匯編代碼的相關(guān)知識(shí)：

寄存器

CPU內(nèi)部用來存放數(shù)據(jù)的一些小型存儲(chǔ)區(qū)域，注意寄存器是在CPU內(nèi)部，受限于CPU的物理尺寸，寄存器數(shù)量不會(huì)太多。我們只需要記住兩點(diǎn)：

1）寄存器和CPU的L1 cache相比，速度雖然還在一個(gè)數(shù)量級(jí)，但是L1 cache的訪問速度還是要慢幾倍。具體的數(shù)據(jù)見下文表2

2） CPU只能從寄存器直接取數(shù)據(jù)或者指令，如果取不到，獲取的順序是L1-》L2-》L3-》主存-》磁盤。

從下文表2中可以看出，如果cpu的cache訪問miss了，性能損失還是很大的。如果內(nèi)存里面再miss了，那對(duì)性能來說不亞于一場(chǎng)災(zāi)難了。

計(jì)算機(jī)訪問速度分級(jí)：

表1 時(shí)間單位

以3.3GHz的CPU為例：

表2 系統(tǒng)的各種延時(shí)

正如你所見，CPU周期的時(shí)間非常短，這段時(shí)間，光的速度大約只能走0.5米。想象一下，是不是非常震撼？

x86-64 CPU的整數(shù)寄存器：

我們無需刻意去記住這些寄存器的名稱，不同架構(gòu)的寄存器的數(shù)量和名稱也不一樣，我們只要知道他們是cpu內(nèi)部的效率極高的存儲(chǔ)單元即可。

回到前面的例子，為什么Prog2要比Prog1快，是因?yàn)镻rog2里面用DEST這個(gè)局部變量代替了dest。DEST是一個(gè)局部變量，在匯編指令里是直接訪問寄存器，而dest則需要去訪問內(nèi)存cache。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

寄存器

寄存器

+關(guān)注

關(guān)注
31

文章
5608

瀏覽量
130001
cpu

cpu

+關(guān)注

關(guān)注
68

文章
11279

瀏覽量
225016
內(nèi)存

內(nèi)存

+關(guān)注

關(guān)注
9

文章
3210

瀏覽量
76377
程序

程序

+關(guān)注

關(guān)注
117

文章
3846

瀏覽量
85246

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

訪問寄存器代替內(nèi)存引用

評(píng)論