



版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)算機(jī)體系結(jié)構(gòu)學(xué)科發(fā)展簡(jiǎn)介石教英石教英浙江大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)系統(tǒng)研究所浙江大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)系統(tǒng)研究所20022002年年1111月月目錄目錄一、計(jì)算機(jī)體系結(jié)構(gòu)學(xué)科發(fā)展回顧一、計(jì)算機(jī)體系結(jié)構(gòu)學(xué)科發(fā)展回顧1計(jì)算機(jī)性能高速發(fā)展及其原因2計(jì)算機(jī)的分類3計(jì)算機(jī)設(shè)計(jì)的任務(wù)4技術(shù)發(fā)展趨向二、指令級(jí)并行性開發(fā)技術(shù)二、指令級(jí)并行性開發(fā)技術(shù)1RISC與CISC2流水線技術(shù)3指令級(jí)并行性技術(shù)三、指令多發(fā)射技術(shù)三、指令多發(fā)射技術(shù)1指令多發(fā)射技術(shù)概述2超標(biāo)量處理器3超長(zhǎng)指令字處理器4多發(fā)射處理器的技術(shù)難點(diǎn)四、四、Cache技術(shù)技術(shù)1為什么要引入Cache2為什么引入Cache能提高計(jì)算機(jī)性能?3Cache技術(shù)的發(fā)
2、展五、多處理器技術(shù)五、多處理器技術(shù)1并行計(jì)算機(jī)體系結(jié)構(gòu)分類2集中共享存儲(chǔ)器型多處理計(jì)算機(jī)3分布式存儲(chǔ)器型多處理器計(jì)算機(jī)4并行處理的難點(diǎn)六、我國(guó)計(jì)算機(jī)體系結(jié)構(gòu)研究進(jìn)展六、我國(guó)計(jì)算機(jī)體系結(jié)構(gòu)研究進(jìn)展 一、一、計(jì)算機(jī)體系結(jié)構(gòu)學(xué)科發(fā)展回顧計(jì)算機(jī)體系結(jié)構(gòu)學(xué)科發(fā)展回顧C(jī)omputerArchitecture定義應(yīng)用機(jī)器語(yǔ)言的程序員為了能正確編寫時(shí)序無(wú)關(guān)的程序所必須了解的計(jì)算機(jī)的結(jié)構(gòu)。簡(jiǎn)單講:計(jì)算機(jī)體系結(jié)構(gòu)是一門設(shè)計(jì)計(jì)算機(jī)的學(xué)科,包括計(jì)算機(jī)的指令系統(tǒng)設(shè)計(jì),結(jié)構(gòu)設(shè)計(jì),實(shí)現(xiàn)技術(shù),以及與系統(tǒng)軟件操作系統(tǒng)和編譯器相關(guān)的技術(shù)。1、計(jì)算機(jī)性能高速發(fā)展及其原因1946年第一臺(tái)通用電子計(jì)算機(jī)ENIAS誕生至今僅56年每秒5
3、000次運(yùn)算加法計(jì)算機(jī)技術(shù)以驚人速度發(fā)展,并將繼續(xù)高速發(fā)展1980年百萬(wàn)美元機(jī)器的性能比不上今年1千美元的機(jī)器今天最高性能的微處理器超過(guò)10年前的超級(jí)計(jì)算機(jī)如用于高端網(wǎng)絡(luò)交換機(jī)和最新電子游戲機(jī)的微處理器速度可達(dá)每秒10億次運(yùn)算計(jì)算機(jī)性能高速發(fā)展原因1.構(gòu)建計(jì)算機(jī)的各種技術(shù)進(jìn)步2.計(jì)算機(jī)本身的創(chuàng)新設(shè)計(jì)技術(shù)的發(fā)展技術(shù)進(jìn)步以穩(wěn)定速度發(fā)展,主要指IC技術(shù)創(chuàng)新設(shè)計(jì)發(fā)展速度不穩(wěn)定,有時(shí)快有時(shí)慢 各年代的性能提高速率年代性能的年提高率原因1970年代初 25%-30%1970年代末 35%微處理器芯片廣泛應(yīng)用1980年代末 58%RISC體系結(jié)構(gòu)、Cache等創(chuàng)新設(shè)計(jì)技術(shù)截止2001年微處理器性能增長(zhǎng)率RI
4、SC、Cache技術(shù)發(fā)展階段RISC體系結(jié)構(gòu)發(fā)展又可分為兩個(gè)階段早期集中發(fā)展指令級(jí)并行技術(shù)后期集中發(fā)展多指令發(fā)射技術(shù)Cache技術(shù)發(fā)展同樣經(jīng)歷兩個(gè)階段早期集中發(fā)展Cache的原理性應(yīng)用后期集中發(fā)展新的Cache組織和各種Cache性能優(yōu)化技術(shù)計(jì)算機(jī)創(chuàng)新設(shè)計(jì)對(duì)每年58%性能提高率的貢獻(xiàn)超過(guò)技術(shù)進(jìn)步貢獻(xiàn)達(dá)15倍之多說(shuō)明:計(jì)算機(jī)體系結(jié)構(gòu)學(xué)科的重要性!計(jì)算機(jī)性能高速提高帶來(lái)的影響用戶擁有越來(lái)越高的性能和功能,今天最高性能的微處理器已經(jīng)超出10年前超級(jí)計(jì)算機(jī)的性能?;谖⑻幚砥鞯挠?jì)算機(jī)成為計(jì)算機(jī)設(shè)計(jì)的主流現(xiàn)狀: PC機(jī)、工作站成為主流產(chǎn)品 小型機(jī)被采用微處理器的服務(wù)器所代替 大型機(jī)被采用數(shù)十個(gè)至上百個(gè)微
5、處理器構(gòu)成的多處理器計(jì)算機(jī)所代替 超級(jí)計(jì)算機(jī)正在被成千上萬(wàn)個(gè)微處理器構(gòu)成的 多處理器計(jì)算機(jī)所代替 體系結(jié)構(gòu)發(fā)展的核心定量方法近年來(lái)計(jì)算機(jī)體系結(jié)構(gòu)發(fā)展的核心,也是計(jì)算機(jī)創(chuàng)新設(shè)計(jì)技術(shù)的核心歸功于定量方法定量方法。用定量方法進(jìn)行計(jì)算機(jī)設(shè)計(jì)用定量方法作為工具分析程序?qū)嶋H運(yùn)行結(jié)果、各類實(shí)驗(yàn)和仿真用定量方法尋找計(jì)算機(jī)體系結(jié)構(gòu)的新思路、新技術(shù),保證計(jì)算機(jī)性能繼續(xù)按現(xiàn)在速率提高2、計(jì)算機(jī)的分類傳統(tǒng)的計(jì)算機(jī)分類:大型機(jī)、小型機(jī)、巨型機(jī)(成熟超級(jí)計(jì)算機(jī))按機(jī)器規(guī)模指令(字長(zhǎng),內(nèi)外存儲(chǔ)器容量,速度等指標(biāo)),價(jià)格等指標(biāo)進(jìn)行分類(PC)機(jī)、工作站,服務(wù)器1980年代產(chǎn)生了新的機(jī)型:個(gè)人(PC)機(jī)、工作站、服務(wù)器主要按用
6、途來(lái)分類 1990年代產(chǎn)生了嵌入式系統(tǒng):高性能家電、機(jī)頂盒、電子游戲機(jī)、手機(jī)、網(wǎng)絡(luò)路由器、交換機(jī)等這里微處理器成為設(shè)備的一個(gè)組件,如馬達(dá)所起的作用,主要不是作計(jì)算用 計(jì)算機(jī)的新分類臺(tái)式機(jī)服務(wù)器嵌入式計(jì)算機(jī)它們分別面向不同應(yīng)用,具有不同要求,采用不同技術(shù)臺(tái)式機(jī)、服務(wù)器、嵌入式系統(tǒng)特征對(duì)比3、計(jì)算機(jī)設(shè)計(jì)的任務(wù)計(jì)算機(jī)設(shè)計(jì)目標(biāo):應(yīng)滿足市場(chǎng)對(duì)功能的要求,同時(shí)也應(yīng)滿足成本,功耗和性能的目標(biāo)計(jì)算機(jī)設(shè)計(jì)任務(wù)指令集設(shè)計(jì)這是傳統(tǒng)計(jì)算機(jī)體系結(jié)構(gòu)的任務(wù),即程序員面對(duì)的(看得見的)指令系統(tǒng)的設(shè)計(jì)計(jì)算機(jī)組織設(shè)計(jì)存儲(chǔ)器設(shè)計(jì),CPU設(shè)計(jì),I/O總線結(jié)構(gòu)設(shè)計(jì)等高層內(nèi)容,同一個(gè)指令集可以對(duì)應(yīng)不同組織設(shè)計(jì)硬件設(shè)計(jì)芯片的邏輯設(shè)計(jì)、封
7、裝、冷卻。相同的指令集和組織可以對(duì)應(yīng)不同的硬件實(shí)現(xiàn)形成一個(gè)產(chǎn)品系列,如Pentium和Celeron,使Celeron適用于低端產(chǎn)品計(jì)算機(jī)體系結(jié)構(gòu)學(xué)科應(yīng)包含上述三方面的內(nèi)容Fig1。4,p10計(jì)算機(jī)設(shè)計(jì)技術(shù)人員的任務(wù)明確具體的功能要求,因?yàn)閬?lái)自市場(chǎng)的功能要求往往是不明確的明確最主要的任務(wù)是什么,最主要的功能往往是使用最頻繁的部件,做好了最主要部件的設(shè)計(jì)對(duì)提高性能影響最大。優(yōu)化設(shè)計(jì)根據(jù)不同準(zhǔn)則來(lái)選擇最優(yōu)的設(shè)計(jì)方案,例如前面介紹過(guò)對(duì)于個(gè)人機(jī)、服務(wù)器和嵌入式計(jì)算機(jī)的不同優(yōu)化目標(biāo)4、技術(shù)發(fā)展趨向由于計(jì)算機(jī)技術(shù)發(fā)展十分快速,一個(gè)成功的指令集設(shè)計(jì)不應(yīng)該因?yàn)榧夹g(shù)發(fā)展而遭淘汰計(jì)算機(jī)體系結(jié)構(gòu)設(shè)計(jì)師應(yīng)預(yù)見到技術(shù)發(fā)
8、展的趨向,在設(shè)計(jì)下一代產(chǎn)品時(shí),預(yù)見到產(chǎn)品大規(guī)模進(jìn)入市場(chǎng)時(shí)恰好是所用的下一代技術(shù)的性價(jià)比達(dá)到最佳的時(shí)候,從而使其設(shè)計(jì)的產(chǎn)品生命周期得以延長(zhǎng)影響最大的四種關(guān)鍵技術(shù)集成電路技術(shù)半導(dǎo)體DRAM磁盤技術(shù)網(wǎng)絡(luò)技術(shù)集成電路技術(shù)晶體管密度每年增加35%,即每4年增加4倍集成電路芯片的尺寸每年提高10%-20%綜合上述兩個(gè)參數(shù),芯片的晶體管數(shù)每年提高55%半導(dǎo)體DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)芯片密度每年遞增40%-60%,即每3-4年增加4倍存取周期縮短相對(duì)較慢,每10年縮短1/3DRAM接口改進(jìn)提高了存取帶寬磁盤技術(shù)近年來(lái)磁盤的存儲(chǔ)密度以每年100%速度遞增,并將繼續(xù)一段時(shí)間(1990年以前每年以30%速度遞
9、增)磁盤的存取周期縮短相對(duì)較慢,每10年縮短1/3網(wǎng)絡(luò)技術(shù)網(wǎng)絡(luò)性能與交換機(jī)和發(fā)射端的性能有關(guān)衡量網(wǎng)絡(luò)的指標(biāo)有:延遲時(shí)間和帶寬等,帶寬是主要指標(biāo)近年來(lái)帶寬提高速度較快如以太網(wǎng)從10Mbps提高到100Mbps花了10年時(shí)間,而從100Mbps提高到1Gbps只用了5年二、指令級(jí)并行性技術(shù)二、指令級(jí)并行性技術(shù) (InstructionLevelParallelism-ILP)指令級(jí)并行性技術(shù)是RISC(精減指令集計(jì)算機(jī))(ReducedInstructionsetComputer)的主要貢獻(xiàn)1、RISC與CISCCISC即復(fù)雜指令集計(jì)算機(jī)(ComplexInstructionsetComputer
10、)RISC思想在1980年代初提出1980年代末大規(guī)模投入實(shí)際使用1980年代中期以前的微處理器可統(tǒng)稱為CISC體系結(jié)構(gòu)微處理器 RISC與CISC的最主要的區(qū)別平均執(zhí)行每條指令的時(shí)鐘周期數(shù)CPI(CyclesperInstruction)的不同RISC的CPI1CISC的CPI1CPI的作用:CPI數(shù)越小,CPU速度越快CPI數(shù)越大,CPU速度越慢CPU性能公式CPUfime=IC CPI CCCPUfime執(zhí)行一般代碼所需的中央處理站(CPU)時(shí)間IC代碼的指令條數(shù)(InstructionComt),與指令集設(shè)計(jì)編譯器的優(yōu)化有關(guān)CPI平均執(zhí)行每條指令的時(shí)鐘周期數(shù),與指令集設(shè)計(jì)、體系結(jié)構(gòu)等技
11、術(shù)有關(guān)CC時(shí)鐘周期(ClockCyde)與計(jì)算機(jī)組成,IC工藝等技術(shù)有關(guān)縮短CPI成為縮短CPUtime的主要技術(shù)途徑RISC體系結(jié)構(gòu)追求精減的指令集數(shù)據(jù)類型、尋址主式精減,指令長(zhǎng)度統(tǒng)一,格式統(tǒng)一,提高流水線的效率,實(shí)現(xiàn)了每一時(shí)鐘周期能執(zhí)行一條指令(CPI=1)RISC體系結(jié)構(gòu)進(jìn)一步提出指令多發(fā)射技術(shù)即每一時(shí)鐘周期可發(fā)射多條指令,執(zhí)行多條指令,進(jìn)一步實(shí)現(xiàn)CPI1CISC計(jì)算機(jī)速度提高較慢的原因傳統(tǒng)CISC體系結(jié)構(gòu)計(jì)算機(jī)的CPI5-8原因:以DEC公司的VAX機(jī)器為例,指令系統(tǒng)復(fù)雜,指令集有304條指令,指令長(zhǎng)度:1Byte64Byte,操作數(shù)不足:0-6個(gè),操作數(shù)達(dá)十幾種,尋址方式達(dá)幾十種;采
12、用微程序控制導(dǎo)致流水線結(jié)構(gòu)復(fù)雜,效率低下,速度提高有困難目前幾乎所有微處理器,包括傳統(tǒng)著名的CISC微處理器,如Intel系列和Motorola系列微處理器都采用RISC體系結(jié)構(gòu)2流水線技術(shù)這是理想流水線的性能:達(dá)到每一個(gè)時(shí)鐘周期可以完成一條指令與指令串行執(zhí)行相比較,速度提高5倍簡(jiǎn)介:流水線是一種多條指令重疊執(zhí)行的實(shí)現(xiàn)技術(shù)流水線的競(jìng)爭(zhēng)實(shí)際流水線不可能像上述理想流水線那樣完美存在三種流水線競(jìng)爭(zhēng)結(jié)構(gòu)競(jìng)爭(zhēng):由硬件資源不足造成流水線停頓數(shù)據(jù)競(jìng)爭(zhēng):由前后指令之間存在數(shù)據(jù)相關(guān)性造成流水線停頓控制競(jìng)爭(zhēng):由轉(zhuǎn)移指令造成流水線停頓 實(shí)際流水線的性能實(shí)際流水線的CPI=理想流水線的CPI+結(jié)構(gòu)競(jìng)爭(zhēng)造成的停頓周期+
13、數(shù)據(jù)競(jìng)爭(zhēng)造成的停頓周期+控制競(jìng)爭(zhēng)造成的停頓周期要提高CPU的性能就是要消除或減少三種競(jìng)爭(zhēng)造成的停頓周期流水線競(jìng)爭(zhēng)的解決結(jié)構(gòu)競(jìng)爭(zhēng)可以通過(guò)增加硬件資源來(lái)解決數(shù)據(jù)競(jìng)爭(zhēng)和控制競(jìng)爭(zhēng)只有通過(guò)挖掘代碼指令之間的平行性,即通過(guò)開發(fā)和發(fā)現(xiàn)指令之間存在的可并行(重疊)執(zhí)行的可能性,然后對(duì)指令執(zhí)行順序進(jìn)行調(diào)度,即用不相關(guān)的指令來(lái)填補(bǔ)本來(lái)應(yīng)該停頓周期的方法,達(dá)到消除或減少停頓周期,提高指令執(zhí)行速度3指令級(jí)并行性(ILP)開發(fā)技術(shù)ILP開發(fā)技術(shù)分兩大類:基于硬件的ILP開發(fā)技術(shù),又稱動(dòng)態(tài)開發(fā)ILP技術(shù)基于軟件的ILP開發(fā)技術(shù),又稱靜態(tài)開發(fā)ILP技術(shù)用于解決數(shù)據(jù)競(jìng)爭(zhēng)的ILP開發(fā)技術(shù)靜態(tài)調(diào)度技術(shù)動(dòng)態(tài)調(diào)度技術(shù)采用改名技術(shù)的動(dòng)
14、態(tài)調(diào)度技術(shù)編譯分析數(shù)據(jù)相關(guān)性軟件流水線路經(jīng)調(diào)度用于解決控制相關(guān)性的ILP開發(fā)技術(shù)靜態(tài)轉(zhuǎn)移預(yù)測(cè)技術(shù)動(dòng)態(tài)轉(zhuǎn)移預(yù)測(cè)技術(shù)靜脈投機(jī)技術(shù)動(dòng)態(tài)投機(jī)技術(shù)循環(huán)體展開技術(shù)延時(shí)轉(zhuǎn)移技術(shù)三、指令多發(fā)射技術(shù)三、指令多發(fā)射技術(shù)1指令多發(fā)射技術(shù)概述從CPUtime=ICCPICC公式出發(fā),進(jìn)一步提高CPU性能的途徑是令CPI1要達(dá)到CPI1的目的,必須做到每個(gè)時(shí)鐘周期發(fā)射多條指令,有多個(gè)處理部件和足夠的硬件資源來(lái)并行處理多條指令,達(dá)到平均每條指令的處理時(shí)間小于1個(gè)時(shí)鐘周期指令多發(fā)射處理器有兩類:超標(biāo)量處理器(Superscalarprecessors)超 長(zhǎng) 指 令 字 處 理 器 ( V L I W - v e r yh
15、onginstructionword)根據(jù)指令發(fā)射機(jī)制,即調(diào)度、組織可同時(shí)發(fā)射指令的機(jī)制,也可分為兩類:動(dòng)態(tài)多發(fā)射機(jī)制,即由硬件在程序執(zhí)行過(guò)程中調(diào)度靜態(tài)多發(fā)射機(jī)制,即由編譯器在程序編譯過(guò)程中調(diào)度2超標(biāo)量處理器超標(biāo)量處理器流水線操作超標(biāo)量處理器的特點(diǎn)在一個(gè)周期里能發(fā)射可變數(shù)量的指令,通常為1-8條指令/周期同時(shí)發(fā)射的指令按規(guī)定搭配,不能自由搭配,即有限制:如同時(shí)發(fā)射的指令必須是獨(dú)立的,即無(wú)數(shù)據(jù)競(jìng)爭(zhēng),以及滿足訪存次數(shù)規(guī)定等等。采用靜態(tài)調(diào)度(compiler完成)和/或動(dòng)態(tài)調(diào)度(硬件完成)方法確定可同時(shí)發(fā)射的指令3超長(zhǎng)指令字處理器(VLIW)VLIW處理器特點(diǎn)一次發(fā)射一條超長(zhǎng)指令,其中包含多個(gè)操作,
16、而不像超標(biāo)量處理器那樣一次發(fā)射多條指令在超長(zhǎng)指令當(dāng)中多個(gè)操作按規(guī)定搭配順序排列,即指令類型不能任意搭配,操作順序不能任意顛倒VLIW究竟有多長(zhǎng)?以一個(gè)擁有多個(gè)功能單元的VLIW處理器為例:設(shè)7個(gè)功能單元可支持:2個(gè)整數(shù)操作、2個(gè)FP操作、2個(gè)存儲(chǔ)器訪問(wèn)操作和1個(gè)轉(zhuǎn)移操作,這樣這條含7個(gè)操作的VLIW的功能相當(dāng)于7條指令,為支持每一功能單元正常工作,應(yīng)分配每一功能單元相應(yīng)的數(shù)據(jù)域;一般每個(gè)數(shù)據(jù)域?yàn)?624位這一VLIW長(zhǎng)度為:16bits7 = 112 bits 或?yàn)? 24bits7 = 168 bits比較:一個(gè)擁有7個(gè)功能單元的超標(biāo)量處理器,一次發(fā)射7條指令,總長(zhǎng)度為32 bits7=22
17、4 bits超長(zhǎng)指令字的組裝由編譯器完成,即由編譯器作靜態(tài)調(diào)度,選擇無(wú)相關(guān)性指令按搭配順序填入超長(zhǎng)指令字為充分發(fā)揮VLIW處理器功能單元的作用,必須要有足夠多的可并行執(zhí)行指令提供給VLIW,編譯器必須采用功能更強(qiáng)的全局調(diào)度技術(shù)4多發(fā)射處理器的技術(shù)難點(diǎn)程序固有指令級(jí)并行性有限是多發(fā)射處理器的本質(zhì)困難,需要的可并行執(zhí)行的指令數(shù)大致等于功能單元數(shù)乘以流水線級(jí)數(shù)。多發(fā)射處理器硬件數(shù)量多、速度快,且復(fù)雜性高,從而成本高。超標(biāo)量處理器的特殊困難發(fā)射邏輯復(fù)雜且高速動(dòng)態(tài)調(diào)度硬件極其復(fù)雜超長(zhǎng)指令字處理器的特殊困難對(duì)編譯器的要求高VLIW系列機(jī)二進(jìn)制代碼兼容困難四、四、CacheCache技術(shù)技術(shù)Cache一種小
18、容量的高速緩沖存儲(chǔ)器Cache在計(jì)算機(jī)中的位置1、為什么要引入Cache?首先看一下CPU芯片速度與內(nèi)存儲(chǔ)器DRAM芯片速度的差別有多大CPU與DRAM速度差意味著什么?說(shuō)明單純地改善CPU的設(shè)計(jì),一味追求提高CPU的速度,并不能提高計(jì)算機(jī)整機(jī)的性能,因?yàn)楦咚貱PU的性能被低速的存儲(chǔ)器訪問(wèn)所抵銷。為了提高計(jì)算機(jī)整機(jī)性能,必須消除兩者性能差,或者僅可能縮小兩者性能差。解決辦法在高速CPU與低速M(fèi)emory之間引入一個(gè)小容量的高速緩沖存儲(chǔ)器(Cache),Cache速度與CPU速度之差(不足1個(gè)數(shù)量級(jí))遠(yuǎn)遠(yuǎn)小于CPU與DRAM速度差(3個(gè)數(shù)量級(jí)4個(gè)數(shù)量級(jí)),通過(guò)將存儲(chǔ)器分級(jí)的方法來(lái)緩解這一巨大的速
19、度差,提高計(jì)算機(jī)的性能。2、為什么引入Cache能提高計(jì)算機(jī)性能?問(wèn):既然用作Cache的SRAM芯片的速度遠(yuǎn)遠(yuǎn)高于用作主存儲(chǔ)器的DRAM芯片,那么為什么主存儲(chǔ)器不用SRAM芯片來(lái)實(shí)現(xiàn)?答案: SRAM的價(jià)格遠(yuǎn)高于DRAM,而且主存儲(chǔ)器的容量大,采用高速SRAM使成本急劇上升,因此從性能/價(jià)格綜合考慮只能采用小容量的Cache。問(wèn):小容量的Cache能否滿足程序存取指令和數(shù)據(jù)的需求?答案:計(jì)算機(jī)設(shè)計(jì)定量原理中有一條局部性原理告訴我們:程序總是傾向于重用那些剛剛用過(guò)程序總是傾向于重用那些剛剛用過(guò)的數(shù)據(jù)和指令的數(shù)據(jù)和指令,這是計(jì)算機(jī)程序非常重要的性質(zhì)。局部性原理的另一種表述:程序90%的執(zhí)行時(shí)間是
20、花在10%的代碼上。局部性原理告訴我們:可以根據(jù)程序最近訪問(wèn)的數(shù)據(jù)和指令來(lái)預(yù)測(cè)程序?qū)⒁{(diào)用的數(shù)據(jù)和指令,且這一預(yù)測(cè)正確度是比較高的。所以小容量的Cache能滿足程序存取數(shù)據(jù)和指令的需求3.Cache技術(shù)的發(fā)展采用多級(jí)采用多級(jí)Cache1980年代的微處理器大多沒有片上Cache,只有片外Cache2001年的微處理器大多都有2級(jí)片上Cache,再加上一級(jí)片外Cache增加增加Cache容量容量1980年代的片外Cache通常只有幾十KB2001年的微處理器三級(jí)Cache的容量可達(dá)16MB采用各種優(yōu)化技術(shù)采用各種優(yōu)化技術(shù)來(lái)提高Cache性能,包括減少失配造成的代價(jià)減少失配率減少命中時(shí)間五、多處理
21、器技術(shù)五、多處理器技術(shù)單處理器計(jì)算機(jī)性能是否已接近其極限?然而從1985起到2000,這一段正是單處理器計(jì)算機(jī)性能突飛猛進(jìn)的時(shí)代單處理器計(jì)算機(jī)至少在未來(lái)5年仍將以目前速度發(fā)展多處理器計(jì)算機(jī)將越來(lái)越重要的理由微處理器已主宰單處理器計(jì)算機(jī)技術(shù),因此為了提高單處理器計(jì)算機(jī)性能而將多個(gè)微處理器連接起來(lái)就成為很自然的選擇現(xiàn)在還不清楚使計(jì)算機(jī)體系結(jié)構(gòu)不斷創(chuàng)新的指令級(jí)并行技術(shù)能否繼續(xù)無(wú)限地發(fā)展下去曾經(jīng)是并行機(jī)發(fā)展障礙的軟件有了新的發(fā)展和進(jìn)展,主要是在服務(wù)器和嵌入式系統(tǒng)方面為多處理器計(jì)算機(jī)發(fā)展帶來(lái)曙光1.并行計(jì)算機(jī)體系結(jié)構(gòu)分類Flynn在1966年提出的計(jì)算機(jī)分類方法,即按指令流和數(shù)據(jù)流進(jìn)行計(jì)算機(jī)分類的方法仍適用至今單指令流,單數(shù)據(jù)流(SISD)單處理器計(jì)算機(jī)單指令流,多數(shù)據(jù)流(SIMD)矢量計(jì)算機(jī)多指令流,單數(shù)據(jù)流(MISD)市場(chǎng)上無(wú)此類計(jì)算機(jī)多指令流,多數(shù)據(jù)流(MIMD)通用多處理器并
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 講師合作合同協(xié)議書范本
- 家電工程合同協(xié)議書
- 關(guān)于合同的試題及答案
- 股份轉(zhuǎn)讓協(xié)議范本:外資企業(yè)股權(quán)轉(zhuǎn)讓合同模板
- 影視廣告方案(3篇)
- DB23-T2942-2021-良好農(nóng)業(yè)(種植)管理評(píng)價(jià)規(guī)范-黑龍江省
- 農(nóng)場(chǎng)設(shè)備維護(hù)管理制度
- 工廠后勤日常管理制度
- 地鐵標(biāo)識(shí)標(biāo)牌管理制度
- 醫(yī)院開具假條管理制度
- 醫(yī)院安全生產(chǎn)培訓(xùn)內(nèi)容
- 《乳腺癌外科治療》課件
- 《中藥調(diào)劑技術(shù)》課件-中藥飲片調(diào)劑
- 《TPACK理論框架下幼兒教師信息技術(shù)應(yīng)用能力現(xiàn)狀調(diào)查研究》
- 管理層職責(zé)分工制度
- 《保護(hù)綠色地球》課件
- 2024-2030年中國(guó)天然靛藍(lán)行業(yè)深度調(diào)查及投資價(jià)值研究報(bào)告版
- 《人口與環(huán)境》課件
- 【MOOC】大學(xué)思辨英語(yǔ)聽力-南京大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 【MOOC】家具史-南京林業(yè)大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 中南林業(yè)科技大學(xué)《Python程序設(shè)計(jì)實(shí)驗(yàn)》2021-2022學(xué)年期末試卷
評(píng)論
0/150
提交評(píng)論