計算機(jī)系統(tǒng)結(jié)構(gòu)計算題_第1頁
計算機(jī)系統(tǒng)結(jié)構(gòu)計算題_第2頁
計算機(jī)系統(tǒng)結(jié)構(gòu)計算題_第3頁
計算機(jī)系統(tǒng)結(jié)構(gòu)計算題_第4頁
計算機(jī)系統(tǒng)結(jié)構(gòu)計算題_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余2頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、計算題用一條4段浮點加法器流水線求 8個浮點數(shù)的和:Z= A+ B+ C+計E+ F+ G+ H解:Z= (A + B) + (C+ D) + (E +F) + (G+ H)結(jié)果A+B C+D E+F g+H A+B+C+D ZE+F+G+H用一條4段浮點加法器流水線求8個數(shù)之和的流水線時空圖1 0 47 - t7個浮點加法共用了流水線的吞吐率為:15個時鐘周期。TP 口Tk 15 t一 一c T047 t流水線的加速比為: S 1 87Tk 15 tT 04 7 t流水線的效率為: E 0 47k Tk 4 15 t例設(shè)在下圖所示的靜態(tài)流水線上計算:流水線的輸出可以直接返回輸入端或暫存于相應(yīng)

2、的流水寄存器中,試計算其吞吐率、加 速比和效率。力口減法0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 時間輸 AiA2A3A4A CAXB入 Bi B2 B3 B4B DC XD(3)計算性能在18個At時間中,給出了 7個結(jié)果。吞吐率為: Tp 7187則產(chǎn)生上述 加速比為不用流水線,由于一次求和需6A t, 一次求積需4At ,,36:27 個結(jié)果共需(4X 6+3X4) At = 36 At流水線的效率4 6 3 4E 0.258 18例 有一條動態(tài)多功能流水線由5段組成,加法用1、3、4、5段,乘法用1、2、5段,第2段的時間為241 ,

3、其余各段時間均為 t ,而且流水線的輸出可以直接返回輸入端或暫存于相應(yīng)的流水寄存器中。若在該流水線上計算:試計算其吞吐率、加速比和效率。加法(1)選擇適合于流水線工作的算法應(yīng)先計算 A1XB1、A2XB2、A3XB3 和 A4XB4;再計算(A1X B1) +(A2X B2)(A3XB3)+(A4X B4);然后求總的累加結(jié)果。(2) 畫出時空圖計算性能段54321輸入D A + B C+D A + B + C+ DA=A 1 * biB=A2>< B2C=A3* B3D=A4*B40 123 45 678 9 1011 12 13 14 1516 17 18AiA2 A3 A4A

4、CA+BBi B2B3B4 BDC+DS 284 1564 4 3 4 E0.315 18非線性流水線例:一條4功能段的非線性流水線,每個功能段的延遲時間都相等,它的預(yù)約表如下:(1)寫出流水線的禁止向量和初始沖突向量。(2)畫出調(diào)度流水線的狀態(tài)圖。(3)求最小啟動循環(huán)和最小平均啟動距離。解:(1)禁止向量為:(2, 4, 6)初始沖突向量:S = 101010(2)構(gòu)造狀態(tài)圖S 邏輯右移2、4、6位時,不作任何處理,邏輯右移1、3、5和大于等于7時:S 右移 1 位之后:010101V101010 = 111111 ,S 右移 3 位之后:000101 V101010 = 101111 ,S

5、 右移 5 位之后:000001 V101010 = 101011 ,S右移7位或大于7位后:還原到它本身。101111 右移 5 位之后:000001 V 101010= 101011,101011 右移 3 位之后:000101 V 101010 =101111,101011 右移 5 位之后:000001 V 101010= 101011o/ 7*非線性流水線的狀態(tài)圖簡單循環(huán):狀態(tài)圖中各種沖突向量只經(jīng)過一次的啟動循環(huán)。(3)最小的啟動循環(huán)為 (1, 7)和(3, 5),平均啟動距離為4。(4)啟動距離最小的恒定循環(huán)為(5)簡單循環(huán)平均啟動距離(1 , 7)4(3,7)5(5,7)6(3,

6、5,7)5(5, 3, 7)5(3 , 5 )4(5)5(7)7向量鏈接練習(xí)題加法需6拍,相乘需7拍,從存儲器讀數(shù)需 6拍,求倒數(shù)近似值需14拍,打入寄存器及啟動功能部件(包括寄存器)各需 1拍。解:(1) V0 -存儲器V1V2+V3V4- V5*V6三條指令可并行執(zhí)行,所需時間為執(zhí)行時間最長的指令的執(zhí)行時間:(1+7+1) + (32-1) = 40(2) V2 - V0+V1V3-存儲器V4- V2*V3指令1、指令2并行執(zhí)行并與指令 3鏈接,所需時間為(1+6+1) + (1+7+1) + (32-1) = 48(3) V0 -存儲器V 3 V1+V2V 4- V0*V3V 6 V4+

7、V5指令1、指令2并行執(zhí)行并與指令3鏈接,指令4與指令2存在功能部件沖突,需等待前一流水鏈完成之后執(zhí)行,所需時間為(1+6+1) + (1+7+1) + (32-1) + (1+6+1) + (32-1) = 87(4) V0 -存儲器V 11/V0V 3 V1+V2V 5- V3*V44 條指令相鏈接,所需時間為(1+6+1) + (1+14+1) + (1+6+1) + (1+7+1) + (32-1) = 72(5) V0 -存儲器V1V2+V3V4- V5*V6s0s1+s2前3條指令并行執(zhí)行,最后一條與指令2存在功能部件沖突,所需時間為 (1+7+1) + (32-1)+ (1+6+

8、1) = 48(6) V3 -存儲器V2 V0+V1s0s2+s3V3- V1*V4前 2 條指令并行執(zhí)行,后 2 條指令并行執(zhí)行,所需時間為(1+6+1) + (32-1) + (1+7+1) +(32-1)= 79(7) V3 -存儲器V2 V0+V1V4- V2*V3存儲器- V4前 2 條指令執(zhí)行,再與第3 條相鏈接,此流水鏈與第4 條指令存在功能部件沖突,所需時間為 (1+6+1) + (1+7+1) + (32-1) + (1+6+1) + (32-1) = 87(8) V0 -存儲器V 2 V0+V1V 3- V2*V1V 5- V3*V4前 2 條指令相鏈接,此流水鏈與第3 條指令存在寄存器沖突,第 3 條指令與第4 條指令存在功能部件沖突,所需時間為(1+6+1) + (1+6+1) + (32-1) + (1+7+1) + (32-1) + (1+7+1) +(32-1) = 127在 Cray 1 機(jī)上,按鏈接方式執(zhí)行下面4 條向量指令(括號中給出相應(yīng)功能部件時間),如果向量寄存器和功能部件之間的數(shù)據(jù)傳輸需要1 拍,試求此鏈接流水線的流過時間為多少拍?如果向量長度為64,則需要多少拍能得到全部結(jié)果。Vk存儲器(存儲器取數(shù):7拍)NX V0+V1 (向

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論