




已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主要包括: 擬留學(xué)專業(yè)(研究課題)在國(guó)內(nèi)外研究情況及水平; 擬選擇的留學(xué)國(guó)別、留學(xué)單位及選擇原因(應(yīng)簡(jiǎn)單評(píng)述對(duì)方國(guó)家及留學(xué)單位在申請(qǐng)人所從事學(xué)科、專業(yè)領(lǐng)域的水平、優(yōu)勢(shì),申請(qǐng)人及所在單位與對(duì)方有無(wú)合作基礎(chǔ)及業(yè)務(wù)聯(lián)系); 達(dá)到本次出國(guó)學(xué)習(xí)預(yù)期目標(biāo)的可行性,結(jié)合本人目前從事的工作及掌握的專業(yè)技術(shù)知識(shí)說(shuō)明; 出國(guó)學(xué)習(xí)目的、預(yù)期目標(biāo)、計(jì)劃、實(shí)施方法及所需時(shí)間; 學(xué)成回國(guó)后的工作/學(xué)習(xí)計(jì)劃及工作單位可提供的科研條件。1.國(guó)內(nèi)外現(xiàn)狀目前國(guó)外高性能微處理器的研制有兩個(gè)明顯的趨勢(shì)。一是研制高性能處理器的公司在市場(chǎng)的洗牌中越來(lái)越集中到少數(shù)幾家;二是單處理器性能的繼續(xù)提高在主頻、結(jié)構(gòu)、功耗等方面都碰到了明顯的障礙,因此各微處理器公司都紛紛推出多核結(jié)構(gòu)的微處理器。 在九十年代末生產(chǎn)主流通用處理器的廠家很多,如Intel、AMD、IBM、HP、SUN、DEC、SGI等公司,形成了在通用處理器市場(chǎng)群雄逐鹿的局面。然而,經(jīng)過(guò)近十年的市場(chǎng)洗牌,很多公司由于市場(chǎng)原因退出了通用處理器領(lǐng)域。目前,DEC、HP、SGI已經(jīng)逐漸退出了處理器設(shè)計(jì)的角逐。最早退出通用處理器市場(chǎng)的是DEC 的Alpha處理器。Alpha處理器無(wú)論從結(jié)構(gòu)設(shè)計(jì)還是物理設(shè)計(jì)的角度都堪稱技術(shù)的經(jīng)典,甚至被很多教科書所采用,尤其是Alpha 21264采用0.35um的工藝實(shí)現(xiàn)四發(fā)射亂序執(zhí)行的結(jié)構(gòu)達(dá)到了600MHz的目標(biāo),現(xiàn)在也很難找到另外一支隊(duì)伍能做出來(lái)。但在處理器市場(chǎng)中一個(gè)經(jīng)驗(yàn)的規(guī)律是:技術(shù)越先進(jìn)的公司,越?jīng)]有市場(chǎng)。在DEC公司實(shí)現(xiàn)把同時(shí)多線程結(jié)構(gòu)做到極致的Alpha 21464過(guò)程中,DEC公司就在1998被Compaq收購(gòu)了。具有諷刺意義的是,Alpha處理器的最早收購(gòu)者,Compaq公司卻比它更早消失?;萜展驹诮?jīng)過(guò)一筆富有爭(zhēng)議的交易中合并了Compaq公司(這次的交易甚至導(dǎo)致了惠普管理層與包括惠普家族在內(nèi)的部分股東的長(zhǎng)時(shí)間的劇烈沖突)卻馬上面對(duì)一個(gè)個(gè)棘手的問(wèn)題,即在擴(kuò)展基于新的64位構(gòu)架(IA64)系統(tǒng)生產(chǎn)線的同時(shí),是否還要生產(chǎn)正在走下坡路的另外兩個(gè)系列的產(chǎn)品(PA-RISC和Alpha)。目前,HP公司已經(jīng)宣布原Compaq的所有Alpha處理器開發(fā)和服務(wù)都將逐步中止(至2010年),而原先EV8的開發(fā)小組已經(jīng)完整地被Intel招募了并且馬上就投入了IA64架構(gòu)的研發(fā)工作中,Alpha退出歷史舞臺(tái)已經(jīng)是不爭(zhēng)的事實(shí)。HP公司自己開發(fā)的PA8000系列處理器在2004年1月發(fā)布雙核的PA8800芯片后也很久沒(méi)有看到新產(chǎn)品推出10。生產(chǎn)MIPS系列高性能處理器的SGI公司以2002年宣布停止MIPS 18000的研發(fā)為標(biāo)志,也退出了處理器研發(fā)的歷史舞臺(tái)。由于連續(xù)十幾年的虧損,SGI公司已經(jīng)難以為繼。在剩下的幾個(gè)微處理器生產(chǎn)廠商IBM、Intel、AMD和SUN中,前三者目前還看不到停止研發(fā)處理器的跡象,但I(xiàn)BM已經(jīng)宣布不再對(duì)外銷售Power系列處理器。SUN公司是否繼續(xù)研發(fā)處理器則很大程度上取決于其雄心勃勃的Ultra SPARC V能否取得成功。下面對(duì)上述幾個(gè)公司在多核處理器的研發(fā)方面的情況做簡(jiǎn)單介紹。(1)IBM是最先推出多核微處理器的廠商,在高度自動(dòng)化的MPU開發(fā)工藝上采用0.13微米工藝實(shí)現(xiàn)的Power4+已成為多核微處理器的代表性產(chǎn)品。IBM在藍(lán)色基因巨型機(jī)中使用自己的雙核芯片,奠定了其在多核微處理器研制方面的領(lǐng)先地位。2001年發(fā)布的Power4片內(nèi)集成兩個(gè)Power3處理器核,每個(gè)核為8路超標(biāo)量處理器,亂序執(zhí)行,一級(jí)Cache私有,分別含有32KB的數(shù)據(jù)Cache和64KB的指令Cache,共享片內(nèi)1.5MB的二級(jí)Cache。Power4采用180nm制造工藝銅互連,7層金屬布線,大約集成了1.74億個(gè)晶體管13。2004年IBM又發(fā)布了Power5,Power5是雙核同時(shí)多線程微處理器,集成兩個(gè)處理器核,每個(gè)核為同時(shí)多線程(Simultaneous Multi-Threading, 簡(jiǎn)稱SMT)處理器,能夠同時(shí)執(zhí)行2個(gè)線程。Power5由Power4擴(kuò)展而來(lái),改造為SMT僅增加了24的芯片面積。Power5片內(nèi)集成了1.92MB的二級(jí)Cache,此外還集成了三級(jí)Cache的目錄以及存儲(chǔ)控制器。Power5采用130nm制造工藝,集成了大約2.76億個(gè)晶體管,工作頻率在1.90GHz左右14。Power4/Power5主要用于高性能服務(wù)器和適度規(guī)模并行計(jì)算機(jī)系統(tǒng)。2006年發(fā)布的Power6采用IBM的65nm SOI工藝,10層金屬層,目標(biāo)是5G Hz。相對(duì)于90 nm的工藝,在同樣功耗的情況下,性能提高了30%,主要原因是采用DSL(dual-stress line)技術(shù),該技術(shù)通過(guò)在CMOS channel加上不同的應(yīng)力來(lái)達(dá)到提高電子或電洞遷移率。Power6中主要通過(guò)電路設(shè)計(jì)提高主頻,其處理器核的頻率達(dá)到5GHz。Power6是兩路的多核處理器(Chip Multi-Processor,簡(jiǎn)稱CMP)設(shè)計(jì),集成了兩個(gè)同時(shí)多線程的處理器核,每個(gè)核含有私有的L2 cache。4個(gè)Power6可以封裝在一個(gè)多芯片模組中(MCM),包括32MB的L3 victim cache。(2)Intel在過(guò)去一直不斷對(duì)外表示,要推出超過(guò)十億晶體管的處理器以捍衛(wèi)摩爾定律,而Montecito就是Intel帶給全世界的答案:17.2億晶體管18。在晶體管數(shù)目的競(jìng)賽中,Intel憑借Montecito取得遙遙領(lǐng)先的地位。Montecito是一款雙核多線程處理器,同時(shí)開發(fā)指令集并行性和線程級(jí)并行性,每個(gè)處理器核在Itanium2的基礎(chǔ)上增加了2路阻塞多線程機(jī)制。Montecito采用90nm的制造工藝,片內(nèi)集成17.2億晶體管,每個(gè)處理器核分別含有16KB 一級(jí)指令Cache、16KB一級(jí)數(shù)據(jù)Cache、1MB二級(jí)指令Cache、256KB二級(jí)數(shù)據(jù)Cache以及12MB 三級(jí)Cache,最大功耗大約為100W,但CPU會(huì)根據(jù)當(dāng)時(shí)的情況自動(dòng)超頻或降頻運(yùn)行,最低功耗可減少到70W。Montecito被Microprocessor Report評(píng)為2004最佳的服務(wù)器處理器,于2005年下半年發(fā)布。Intel在自己微處理器的發(fā)展藍(lán)圖中指出,今后各個(gè)領(lǐng)域的CPU都將采用多核結(jié)構(gòu)。Intel基于P4系列的雙核處理器為SmithField,采用90nm工藝,將兩個(gè)P4的處理器直接封裝在芯片上采用共享前端總線的結(jié)構(gòu),Yonah的處理器為共享L2 caches和系統(tǒng)接口,可以部分消除之前的前端總線競(jìng)爭(zhēng)沖突問(wèn)題。2006年Intel推出了基于Core構(gòu)架的處理器Conroe(酷睿2),處理器核基于Pentium M,最重要的一點(diǎn)是增加了流水線的寬度,由處理3條x86指令到能處理4條x86指令,增強(qiáng)了SSE功能,由64位通路增加到128位的通路,以及能執(zhí)行128位的讀指令(load),在cache共享上,能動(dòng)態(tài)調(diào)節(jié)cache的分配,最優(yōu)化cache的性能。Intel的數(shù)據(jù)表明Conroe比上一代處理器在性能上提高了40%,而功耗降低了40%。(3)AMD和Intel一直是全球處理器市場(chǎng)上的兩大宿敵。面對(duì)處理器高功耗的制約,Intel和AMD不約而同地將目光轉(zhuǎn)向了多核處理器。AMD發(fā)展64位多核CPU的步伐走在了Intel前面,2004年8月演示了雙核Opteron,其產(chǎn)品供貨于2005年中期開始。雙核Opteron片內(nèi)集成2個(gè)x86-64核,每個(gè)處理器核有獨(dú)立的L2 cache,通過(guò)crossbar互聯(lián)處理器核和系統(tǒng)請(qǐng)求接口,片內(nèi)集成的內(nèi)存控制器,此外還集成互連和I/O控制器,包含3個(gè)HyperTransport 接口,能夠方便地實(shí)現(xiàn)多處理器互連和I/O通信。雙核Opteron采用90nm制造工藝,晶體管數(shù)量在2億個(gè)以上,功耗小于95W,大大提高了微處理器的實(shí)際效能,相對(duì)于Intel早期推出的雙核處理器,AMD有極大的性能和功耗有效性優(yōu)勢(shì)17,21。(4)SUN和IBM一直在高端服務(wù)器市場(chǎng)競(jìng)爭(zhēng)激烈。2001年,IBM率先發(fā)布了它的雙核處理器POWER4 ,而SUN公司直到2004年上半年才發(fā)布了它的第一款雙核微處理器UltraSPARC IV,并在下半年推出了UltraSPARC IV+。UltraSPARC IV采用CMT(chip multithreading)技術(shù),片上集成了兩個(gè)UltraSPARC III的內(nèi)核、二級(jí)Cache的tag體和MCU,外部緩存16MB,每個(gè)內(nèi)核獨(dú)享8MB。UltraSPARC IV由德州儀器生產(chǎn),采用0.13微米工藝,主頻1.2GHz,功耗100W,和UltraSPARC III管腳兼容,實(shí)現(xiàn)系統(tǒng)的平滑升級(jí)。UltraSPARC IV+是UltraSPARC IV的0.09微米工藝的升級(jí)版本,而且增加了片上高速緩存的容量,主頻1.8GHz。根據(jù)Sun公司內(nèi)部人士透露,Sun公司即將推出片內(nèi)8個(gè)處理器核,每個(gè)處理器核4線程的UntraSPARC V15。2004年Sun公司公布了Niagara,也稱為UltraSPARC T1,包括8個(gè)處理器核,每個(gè)核支持4個(gè)線程,共支持32個(gè)線程16。2006年8月,Sun公司推出了Niagara-2,包括8個(gè)Sparc的處理器核,每個(gè)核支持8個(gè)線程,共享4MB的L2 cache,分為8個(gè)bank,16路組相聯(lián),使用Crossbar把處理器核和L2 cache互聯(lián),含有4個(gè)雙通道的FBDIMM(fully buffered DIMM)內(nèi)存控制器,含有兩個(gè)網(wǎng)絡(luò)端口,1個(gè)PCI-E x8的端口,其信號(hào)管腳為711個(gè),管腳的總數(shù)為1831。與國(guó)外微處理器設(shè)計(jì)廠家不斷合并相對(duì)應(yīng)的是國(guó)內(nèi)微處理器設(shè)計(jì)能力在“十五”期間的快速增長(zhǎng)。在過(guò)去的五年中,國(guó)內(nèi)微處理器設(shè)計(jì)主要包括以下特點(diǎn):(1)在通用處理器和嵌入式處理器的研發(fā)方面都蓬勃展開;(2)產(chǎn)業(yè)化剛開始起步,還需要較長(zhǎng)時(shí)間形成規(guī)模產(chǎn)業(yè)化;(3)主要集中在單處理器核的設(shè)計(jì)方面,部分研究單位在單處理器的研發(fā)方面已經(jīng)達(dá)到很高的水平,可望在“十一五”期間展開多核處理器的研發(fā)。在國(guó)家863計(jì)劃和中國(guó)科學(xué)院知識(shí)創(chuàng)新工程資助下,中科院計(jì)算所從事龍芯系列高性能通用處理器的研制,先后完成32位的龍芯1號(hào)、64位的龍芯2號(hào)和龍芯2號(hào)增強(qiáng)型處理器(簡(jiǎn)稱龍芯2E)的研制。龍芯2E兼容MIPS III指令系統(tǒng),采用四發(fā)射的動(dòng)態(tài)超標(biāo)量超流水線結(jié)構(gòu),實(shí)現(xiàn)了先進(jìn)的轉(zhuǎn)移猜測(cè)、寄存器重命名、動(dòng)態(tài)調(diào)度等亂序執(zhí)行技術(shù),以及非阻塞的Cache訪問(wèn)、取數(shù)猜測(cè)(Load Speculation)、存數(shù)合并緩存(Store Fill Buffer)等動(dòng)態(tài)存儲(chǔ)訪問(wèn)機(jī)制。龍芯2E的浮點(diǎn)部件能夠支持SIMD結(jié)構(gòu)的媒體運(yùn)算以及雙單精度(Paired-Single)的浮點(diǎn)運(yùn)算。龍芯2E片內(nèi)含64KB一級(jí)指令高速緩存、64KB一級(jí)數(shù)據(jù)高速緩存、以及512KB二級(jí)高速緩存,片內(nèi)集成了DDR內(nèi)存控制器。龍芯2E采用意法半導(dǎo)體(ST)90nm工藝設(shè)計(jì),主頻達(dá)到1GHz,具有低功耗(58瓦 )、高安全性特點(diǎn),SPEC CPU2000的定點(diǎn)/浮點(diǎn)實(shí)測(cè)分值均達(dá)到500分,性能與中檔的Intel P4處理器相當(dāng)?;邶埿?E的Linux-PC系統(tǒng)可以滿足絕大多數(shù)的桌面應(yīng)用,包括運(yùn)行瀏覽器、辦公套件、播放多媒體視頻等。龍芯2E于2006年9月通過(guò)中科院組織的鑒定,鑒定專家組一致認(rèn)為:“龍芯2E高性能通用CPU芯片在單處理器設(shè)計(jì)方面已達(dá)到國(guó)際先進(jìn)水平,居國(guó)內(nèi)通用CPU研制領(lǐng)先水平”?;邶埿?E的低成本龍夢(mèng)電腦、龍芯筆記本等樣機(jī)已經(jīng)研制出來(lái),正進(jìn)入試點(diǎn)階段,產(chǎn)業(yè)化前景良好1,2。目前,計(jì)算所正進(jìn)行龍芯3號(hào)多核處理器的研制。龍芯3號(hào)將采用可擴(kuò)展設(shè)計(jì),處理器核數(shù)目很容易從幾個(gè)擴(kuò)展到幾十個(gè);將采用超級(jí)虛擬機(jī)技術(shù),使得多種指令集(包括MIPS、Sun Sparc、X86)應(yīng)用能夠同時(shí)運(yùn)行。此外,對(duì)于傳統(tǒng)的如何利用多處理器核加速單線程問(wèn)題,龍芯3號(hào)也將會(huì)采用軟硬件結(jié)合的并行虛擬機(jī)方式加以解決。根據(jù)龍芯發(fā)展路線圖,龍芯3號(hào)的第一個(gè)原型芯片將于2007年底推出。2003年,國(guó)防科技大學(xué)承擔(dān)了863計(jì)劃高性能通用CPU芯片重大研究課題(YHFT64-I),2005年國(guó)防科大又承擔(dān)了該項(xiàng)目的滾動(dòng)支持項(xiàng)目。YHFT64-I采用目前EPIC技術(shù),利用軟硬件方法實(shí)現(xiàn)Intel 指令集兼容,能夠并發(fā)執(zhí)行8條指令。芯片設(shè)計(jì)采用了大量先進(jìn)的微體系結(jié)構(gòu)技術(shù),如:多級(jí)分支預(yù)測(cè)技術(shù)、寄存器堆棧技術(shù)、控制前瞻/數(shù)據(jù)前瞻、謂詞執(zhí)行技術(shù)以及低功耗技術(shù)等,能夠有效開發(fā)指令集并行性,極大提高處理器性能。YHFT64-1支持通用操作系統(tǒng),支持多處理器結(jié)構(gòu),支持?jǐn)?shù)據(jù)庫(kù)、WEB等服務(wù)器應(yīng)用。該芯片所有設(shè)計(jì)已經(jīng)完成,采用Chartered 0.13m Nominal 1P8M工藝,核心邏輯規(guī)模5800萬(wàn)晶體管,采用HPBGA封裝,功耗12瓦,面積10X10mm2,引腿696個(gè),工作頻率300MHz,在2005年上半年完成投片。此外,中芯微電子和北京大學(xué)、清華大學(xué)、同濟(jì)大學(xué)等單位也已研制成功嵌入式CPU以及有關(guān)的SOC。3 高性能微處理器發(fā)展前沿3.1 研究中的幾種新型體系結(jié)構(gòu)的處理芯片下面簡(jiǎn)單介紹國(guó)外研究中的幾種新型體系結(jié)構(gòu)的處理芯片。(1) IBM開發(fā)中的千萬(wàn)億次(PetaFLOPS)計(jì)算機(jī)藍(lán)色基因(Blue Gene)中的核心處理芯片是探索新型高性能CPU體系結(jié)構(gòu)的重要一步。該芯片中含32個(gè)簡(jiǎn)單的PowerPC處理器及內(nèi)嵌的DRAM,峰值性能可達(dá)到32GFLOPS。將DRAM集成在片內(nèi),使處理器到存儲(chǔ)器的訪問(wèn)延遲大為縮短,訪問(wèn)帶寬大大提高,也很大程度上減少了能量的消耗。為了通過(guò)精簡(jiǎn)設(shè)計(jì)提高運(yùn)算速度和極大地降低功耗,每個(gè)處理器能執(zhí)行的指令的數(shù)量都大大地減少了,但每個(gè)處理器仍可支持8個(gè)同時(shí)執(zhí)行的線程以提高處理器利用率。片上還集成了6個(gè)2GB/s帶寬的通道以實(shí)現(xiàn)與系統(tǒng)中其它同類芯片的通信。另外,考慮到構(gòu)建超大規(guī)模計(jì)算系統(tǒng)時(shí)不可避免地會(huì)碰到因某個(gè)(些)結(jié)點(diǎn)失效而影響整體系統(tǒng)可用性的情況,它嘗試采用自穩(wěn)定和自修復(fù)的技術(shù),即自動(dòng)地從個(gè)別處理器或線程的失效中恢復(fù)過(guò)來(lái)。為此,在硬件上,處理器和通信鏈路上都采用了大量的冗余設(shè)計(jì),在軟件上,也需要特別增加分布式控制和恢復(fù)的機(jī)制。(2) MIT研究的可重構(gòu)RAW處理芯片采用了另一種思路27。RAW在單個(gè)芯片上將幾百個(gè)非常簡(jiǎn)單的處理單元,用可重構(gòu)邏輯連接起來(lái),實(shí)現(xiàn)高度并行的體系結(jié)構(gòu)。RAW允許編譯器(或其它相當(dāng)?shù)能浖ぞ撸┲匦聵?gòu)建硬件體系結(jié)構(gòu)的低層細(xì)節(jié),對(duì)每個(gè)要加速的應(yīng)用實(shí)現(xiàn)最佳的資源分配。這種結(jié)構(gòu)設(shè)計(jì)簡(jiǎn)單,單元內(nèi)部和單元之間的互連線短,能充分地支持流水線并行性,特別適于未來(lái)線寬變窄的半導(dǎo)體制造工藝。RAW的研究者認(rèn)為,開始時(shí),RAW體系結(jié)構(gòu)還只適于流式的信號(hào)處理計(jì)算,但RAW方法未來(lái)將發(fā)展成為普適的解決方案。圖1給出了RAW中一個(gè)處理器的框圖。其中下半部分就是一個(gè)普通的RISC流水線處理器(其復(fù)雜度跟龍芯1號(hào)差不多)。其特殊之處在于在執(zhí)行部件前的旁路部分,除了常規(guī)從寄存器中取出的操作數(shù)和從功能部件剛算出的操作數(shù)外,還有通過(guò)通信網(wǎng)絡(luò)從別的處理器那里送過(guò)來(lái)的操作數(shù)。在靈活的互連網(wǎng)絡(luò)的配合下,這個(gè)機(jī)制巧妙地把多個(gè)處理器的功能部件耦合在一起,構(gòu)成功能復(fù)雜、動(dòng)態(tài)重構(gòu)的并行處理系統(tǒng)。(3) 在2005年國(guó)際固態(tài)電路會(huì)議(ISSCC)上,IBM、Sony和Toshiba首次公開介紹了設(shè)計(jì)中的Cell高性能處理芯片30。這三個(gè)企業(yè)聯(lián)合設(shè)計(jì)Cell芯片的工作始于2001年3月。Cell的一個(gè)主要用途是Sony的第三代Playstation游戲機(jī)PS3,但I(xiàn)BM同時(shí)也宣稱,Cell將是片上超級(jí)計(jì)算機(jī)(supercomputer-on-a- chip)。從ISSCC2005上披露的第一款Cell芯片的情況來(lái)看,它確實(shí)能同時(shí)滿足前述兩個(gè)方面的應(yīng)用要求。Cell處理芯片可在4GHz頻率下工作,其宣稱的峰值浮點(diǎn)運(yùn)算速度為256GFLOPS,可惜這只是單精度且不符合IEEE 754標(biāo)準(zhǔn)的浮點(diǎn)運(yùn)算(如果針對(duì)游戲應(yīng)用,這是合適的,因?yàn)樗俣缺染雀匾?。Cell同時(shí)也支持完全符合IEEE 754標(biāo)準(zhǔn)的雙精度浮點(diǎn)運(yùn)算,但速度約是單精度的十分之一,估計(jì)為25-30GFLOPS。即使這個(gè)速度,也達(dá)到了當(dāng)前主流高性能微處理芯片的5-10倍。因此,基于Cell處理芯片,在一個(gè)機(jī)柜里就可以實(shí)現(xiàn)足以躋身TOP500排行榜前列的超級(jí)計(jì)算機(jī)。Cell采用了與主流高性能處理芯片全然不同的片內(nèi)分布式體系結(jié)構(gòu)(圖2)??傮w上看,它由一個(gè)相對(duì)比較簡(jiǎn)單的支持同時(shí)雙線程并行的雙發(fā)射64位PowerPC內(nèi)核(稱為PPE)和8個(gè)SIMD型向量協(xié)處理器(稱為SPE)構(gòu)成。片內(nèi)有一個(gè)高帶寬的環(huán)狀高速總線(EIB)把PPE、SPE及RAMBUS內(nèi)存接口控制器(MIC)、FlexI/O外部總線接口控制器(BIC)連接起來(lái)。PPE主要負(fù)責(zé)控制并執(zhí)行操作系統(tǒng),SPE完成主要的計(jì)算任務(wù)。SPE的SIMD執(zhí)行部件是128位寬的,從而可在一個(gè)時(shí)鐘周期里完成4個(gè)32位的定點(diǎn)或浮點(diǎn)乘加運(yùn)算。SPE里內(nèi)置了256KB的SRAM作為局部存儲(chǔ)器(它的編址獨(dú)立于片外的DRAM)。不采用自動(dòng)調(diào)配數(shù)據(jù)的cache機(jī)制,使SPE更像一個(gè)向量處理器,從而也更多地依賴程序員或編譯器的作用來(lái)發(fā)揮性能。同樣,SPE里沒(méi)有動(dòng)態(tài)分支預(yù)測(cè)機(jī)制。所以,SPE配備了較大的寄存器堆(128個(gè)128位的寄存器)來(lái)盡量減少對(duì)存儲(chǔ)器的訪問(wèn),并盡可能地展開循環(huán)、減少分支。Cell雖然實(shí)現(xiàn)了很高的性能,但也存在一些問(wèn)題。例如,如果要往游戲或多媒體以外的應(yīng)用發(fā)展,編程模型和軟件開發(fā)問(wèn)題還沒(méi)有很好解決。又如,前面提到的芯片設(shè)計(jì)的復(fù)雜度和功耗問(wèn)題也沒(méi)有很好地解決。Cell的第一款芯片用 90納米SOI工藝全定制實(shí)現(xiàn),8層銅連線,芯片面積為221mm2,含2.34億晶體管。這個(gè)復(fù)雜度已經(jīng)超過(guò)了Intel的安騰二代,如果想用在家用游戲機(jī)里,成本是個(gè)大問(wèn)題(據(jù)說(shuō)Sony計(jì)劃在PS3里采用只包括4個(gè)SPE的Cell版本)。Cell芯片采用42.5mm42.5mm尺寸的BGA封裝,共1236個(gè)接觸點(diǎn),其中506個(gè)是信號(hào)。據(jù)估計(jì)在1.1V供電4GHz運(yùn)行時(shí),芯片功耗約50-80瓦(據(jù)說(shuō)1.4V供電時(shí)可運(yùn)行到5.6GHz,功耗180瓦)。(4) IBM和德克薩斯州立大學(xué)聯(lián)合開發(fā)中的TRIPS(Tera-Op Reliable Intelligently adaptive processing System)芯片是設(shè)計(jì)具有每秒萬(wàn)億次運(yùn)算能力芯片的第一個(gè)嘗試28,29。TRIPS結(jié)構(gòu)采用粗粒度的處理器內(nèi)核,以便在有較高指令級(jí)并行性的單線程應(yīng)用上實(shí)現(xiàn)更高的性能;并在同一芯片上重復(fù)設(shè)置許多這樣的內(nèi)核,便于擴(kuò)充。片上還集成了存儲(chǔ)部件和通信部件,并允許軟件調(diào)度程序?qū)λ鼈冹`活配置,以獲得最佳性能。圖3給出了TRIPS結(jié)構(gòu)的一個(gè)大略框圖。左邊是其總體框圖,包括八個(gè)網(wǎng)格處理器(黑色大方塊)、若干可配置的存儲(chǔ)體(灰色小方塊)和一些連接片外存儲(chǔ)器(DRAM陣列)的接口通道(黑點(diǎn))。右邊是網(wǎng)格處理器的具體結(jié)構(gòu),其中圓點(diǎn)是處理單元,外圍的一圈長(zhǎng)方塊里有共享的寄存器堆、高速緩存、分支預(yù)測(cè)器等。圖3 TRIPS處理器結(jié)構(gòu)圖TRIPS的目標(biāo)是在35納米的工藝條件下,達(dá)到5TFLOPS的峰值浮點(diǎn)運(yùn)算性能。TRIPS同時(shí)還兼顧桌面應(yīng)用和服務(wù)器應(yīng)用,希望到2010年,能把桌面PC、高性能計(jì)算、數(shù)字信號(hào)處理、服務(wù)器應(yīng)用等都統(tǒng)一到同一類型的CPU芯片上。(5) AMD正在逐步公布其技術(shù)路線圖,尤其是四核處理器的計(jì)算技術(shù)。該四核處理器采用65納米技術(shù),其具有2MB三級(jí)緩存、512KB二級(jí)緩存和64KB一級(jí)緩存。該設(shè)計(jì)的四個(gè)核共享硅底板和隔熱層,與現(xiàn)有的Socket F(1207)兼容。 這樣,用戶就能輕松實(shí)現(xiàn)性能升級(jí),而無(wú)須擔(dān)心圖像管理問(wèn)題。該技術(shù)突出之處在于65納米SOI處理技術(shù)、經(jīng)過(guò)改進(jìn)的Power Now!性能、集成的存儲(chǔ)器控制器和直接互連架構(gòu)。AMD四核處理器技術(shù)還將包括:改進(jìn)的分支預(yù)測(cè)、亂序Load執(zhí)行、雙128位SSE數(shù)據(jù)流、位級(jí)控制擴(kuò)展和SSE擴(kuò)展。另外,還包括8GB/秒的HyperTransport連接、改進(jìn)的Crossbar、DDR2支持技術(shù)。(6) Intel開發(fā)萬(wàn)億級(jí)研究芯片。2006年9月26日,在Intel開發(fā)者論壇中,Intel公司的首席技術(shù)官Justin Rattner首次介紹了Intel的“萬(wàn)億級(jí)”研究原型芯片及其三個(gè)主要的技術(shù)突破。“萬(wàn)億級(jí)”研究原型芯片是世界上第一個(gè)達(dá)到每秒1萬(wàn)億次浮點(diǎn)運(yùn)算(one trillion floating-point operations-per-second,TeraFLOP)的處理器,包括80個(gè)處理器核,頻率為3.1 GHz。該研究原型芯片綜合了Intel公司近來(lái)在硅光子學(xué)方面的技術(shù)突破,達(dá)到了萬(wàn)億次級(jí)計(jì)算操作的三個(gè)主要要求:即TeraOPS的性能、每秒萬(wàn)億字節(jié)的訪存帶寬以及每秒萬(wàn)億比特的I/O速度。盡管這些技術(shù)的商業(yè)應(yīng)用可能在未來(lái)數(shù)年才能實(shí)現(xiàn),不過(guò)這畢竟是在計(jì)算機(jī)和服務(wù)器中進(jìn)行萬(wàn)億次級(jí)操作方面跨出的激動(dòng)人心的第一步。第一個(gè)創(chuàng)新點(diǎn)是:與其他現(xiàn)有芯片的晶體管排列方式不同,“萬(wàn)億級(jí)”芯片包括了80個(gè)瓦片(tile),排成810的行列結(jié)構(gòu)。每一個(gè)瓦片都包括一個(gè)帶簡(jiǎn)單指令設(shè)置的小型核心,用于處理浮點(diǎn)數(shù)據(jù),但是與Intel的結(jié)構(gòu)不兼容。第二個(gè)創(chuàng)新點(diǎn)是:有一個(gè)20兆字節(jié)的SRAM內(nèi)存芯片,其被重疊綁定在處理器模上。與處理器模的疊放使數(shù)百個(gè)芯片互連成為可能,并且可在內(nèi)存和核心之間提供超過(guò)每秒萬(wàn)億字節(jié)的帶寬。第三個(gè)創(chuàng)新點(diǎn)是采用混合硅激光芯片,該技術(shù)可以形成每秒萬(wàn)億比特的2. 擬選擇的留學(xué)國(guó)別、留學(xué)單位及選擇原因(應(yīng)簡(jiǎn)單評(píng)述對(duì)方國(guó)家及留學(xué)單位在申請(qǐng)人所從事學(xué)科、專業(yè)領(lǐng)域的水平、優(yōu)勢(shì),申請(qǐng)人及所在單位與對(duì)方有無(wú)合作基礎(chǔ)及業(yè)務(wù)聯(lián)系);本人擬到法國(guó)的國(guó)家信息與自動(dòng)化研究所INRIA留學(xué)。選擇原因如下:1) INRIA”是法國(guó)國(guó)家信息與自動(dòng)化研究所(或稱法國(guó)國(guó)立計(jì)算機(jī)及自動(dòng)化研究院)的簡(jiǎn)稱,法文為 Institut national de recherche en informatique et en automatique (簡(jiǎn)稱INRIA),其重點(diǎn)研究領(lǐng)域?yàn)橛?jì)算機(jī)科學(xué),控制理論及應(yīng)用數(shù)學(xué)。該研究院于1967年在巴黎附近的羅克庫(kù)爾創(chuàng)立,為法國(guó)國(guó)家科研機(jī)構(gòu),直屬于法國(guó)研究部和法國(guó)經(jīng)濟(jì)財(cái)政工業(yè)部。INRIA 是世界著名的科研機(jī)構(gòu),其計(jì)算機(jī)學(xué)科在世界科研機(jī)構(gòu)學(xué)科競(jìng)爭(zhēng)力排行榜中排名全球第七。2) 在計(jì)算機(jī)體系結(jié)構(gòu)研究方面,INRIA在法國(guó)巴黎和雷恩的研究所分別有兩個(gè)研究小組在微處理器體系結(jié)構(gòu)方面進(jìn)行著相關(guān)研究,其成果在歐洲和世界上處于領(lǐng)先地位。尤其是雷恩研究所的Andre Seznec和巴黎研究所的Olivi
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 8.2+重力勢(shì)能+課件+-2024-2025學(xué)年高一下學(xué)期物理人教版(2019)必修第二冊(cè)
- Photoshop平面設(shè)計(jì)基礎(chǔ) 課件 任務(wù)1.2 繪制橘子
- 企業(yè)團(tuán)隊(duì)精神課件
- 礦業(yè)權(quán)轉(zhuǎn)讓與礦業(yè)權(quán)抵押貸款服務(wù)合同范本
- 循環(huán)經(jīng)濟(jì)示范項(xiàng)目廠房廢品處理押金合同范本
- 廠房租賃合同糾紛調(diào)解與仲裁代理服務(wù)合同樣本
- 磚頭接縫加固方案
- 電梯故障維修處理方案
- 徐州土建方案報(bào)審表
- 產(chǎn)業(yè)園區(qū)財(cái)政借款合同規(guī)范
- 安保人員考試題目及答案
- 供水生產(chǎn)培訓(xùn)
- 2025年山西省中考英語(yǔ)試卷真題(含答案詳解)
- GB/T 20468-2006臨床實(shí)驗(yàn)室定量測(cè)定室內(nèi)質(zhì)量控制指南
- 2022最新小學(xué)英語(yǔ)課堂作業(yè)規(guī)范指導(dǎo)準(zhǔn)則
- 高標(biāo)準(zhǔn)基本農(nóng)田土地整治項(xiàng)目工程施工費(fèi)預(yù)算表
- GB∕T 41112-2021 鎂及鎂合金焊絲
- 模切設(shè)備日常點(diǎn)檢表
- DIN76ISO公制螺紋的螺紋尾扣螺紋退刀槽中文資料
- 10kV配電變壓器缺相運(yùn)行分析
- 《天窗》課內(nèi)閱讀及答案
評(píng)論
0/150
提交評(píng)論