《計(jì)算機(jī)原理》PPT課件

資源ID：20455493 資源大小：725.31KB 全文頁(yè)數(shù)：37頁(yè)
資源格式： PPT 下載積分：9.9積分

快捷下載

會(huì)員登錄下載

微信登錄下載

三方登錄下載：

微信掃一掃登錄

下載資源需要9.9積分

郵箱/手機(jī)：
溫馨提示：	用戶名和密碼都是您填寫的郵箱或者手機(jī)號(hào)，方便查詢和重復(fù)下載（系統(tǒng)自動(dòng)生成）
支付方式：
驗(yàn)證碼：	換一換

賬號(hào)：
密碼：
驗(yàn)證碼：	換一換
當(dāng)日自動(dòng)登錄忘記密碼？

友情提示

1、下載資料失敗解決辦法

2、PDF文件下載后，可能會(huì)被瀏覽器默認(rèn)打開，此種情況可以點(diǎn)擊瀏覽器菜單，保存網(wǎng)頁(yè)到桌面，就可以正常下載了。

3、本站不支持迅雷下載，請(qǐng)使用電腦自帶的IE瀏覽器，或者360瀏覽器、谷歌瀏覽器下載即可。

4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮，下載后原文更清晰。

5、試題試卷類文檔，如果標(biāo)題沒有明確說(shuō)明有答案則都視為沒有答案，請(qǐng)知曉。

網(wǎng)站客服

侵權(quán)投訴

《計(jì)算機(jī)原理》PPT課件

計(jì)算機(jī)原理第四章評(píng)估和理解計(jì)算機(jī)性能 2 本講簡(jiǎn)要說(shuō)明目的與要求：掌握計(jì)算機(jī)中的性能評(píng)價(jià) 授課重點(diǎn)：計(jì)算機(jī)性能指標(biāo) 授課難點(diǎn)：如何合理評(píng)價(jià)計(jì)算機(jī)的性能閱讀章節(jié)： Computer Organization and Design 第 4章，計(jì)算機(jī)原理和設(shè)計(jì) 第 1 章第 4節(jié) 作業(yè)安排： Computer Organization and Design P272 4.1、 4.2、 4. 3 (選做 ) 、 4.10 、 4.11和 4.14 (選做 )題 3 制造成本（ manufacturing cost）衡量計(jì)算機(jī)性能的基本指標(biāo) 響應(yīng)時(shí)間（ Response Time）執(zhí)行時(shí)間（ Execution Time）、等待時(shí)間（ Latency）吞吐量（ Throughput ）帶寬（ Bandwidth）指令執(zhí)行速度（ MIPS、 MFLOPS）計(jì)算機(jī)性能評(píng)估 CPU Time=cycle time CPI Instructions / program 基準(zhǔn)程序（ Benchmark）主要內(nèi)容 4 單晶硅錠圓形薄片 / 硅拋光片（ 6/8/12寸 ,厚度不足 1mm） IC小片 / 芯片不合格的用磁漿點(diǎn)上記號(hào) 封裝：將芯片固定在塑膠或陶瓷基座上，把芯片上蝕刻出來(lái) 的引線與基座底部伸出的引腳連接，蓋上蓋板并封焊成芯片約需 400多道工序！ “晶圓” / 大芯片 Integrated Circuits Costs manufacturing process 在考察性能前，先考察成本！ 5 Integrated Circuits Costs 公式 Die cost = Dies per wafer = Die Yield = 每個(gè)圓晶片上的小片數(shù)、集成電路成本都與芯片面積有關(guān)！ a r e aD ie a r e aw a f e r _ _ Y ie ldw a f e rp e rD ie w a f t e rp e rC o s t _ _ 小片合格率與芯片成本有關(guān)的因素圓晶價(jià)格圓晶所含小片數(shù) 小片合格率 2 ) _ _ _ ( 1 ( 1 area Die area per Defect x + 6 IC cost = Die cost + Testing cost + Packaging cost Final test yield 封裝成本（ Packaging cost） : 取決于引腳數(shù)、散熱性等 Other Costs Chip Die Package Test 序列 2 有 6條 . 序列 1 需 2 1+1 2+2 3=10 cycles; 序列 2 需 4 1+1 2+1 3=9 cycles 序列 1 的 CPI=10/5=2; 序列 2 的 CPI=9/6=1.5 雖然序列 2的指令條數(shù) 更多，但速度更快！ 26 Marketing Metrics （產(chǎn)品宣稱指標(biāo)） MIPS = Instruction Count / Execution Time 106 = Clock Rate / CPI 106 一種用來(lái)代替執(zhí)行時(shí)間的指標(biāo) Million Instructions Per Seconds 因?yàn)槊織l指令執(zhí)行時(shí)間不同，所以 MIPS是一個(gè)平均值不同機(jī)器的指令集不同程序由不同的指令混合而成指令使用的頻度動(dòng)態(tài)變化 Peak MIPS（不實(shí)用） MIPS數(shù)不能說(shuō)明性能的好壞？ MFLOPS = FP Operations / Execution Time 106 Million Floating-point Operations Per Second 與機(jī)器相關(guān)性大并不是程序中花時(shí)間的部分用 MIPS數(shù)表示性能有沒有局限 ? 用 MFLOPS數(shù)表示性能也有局限！ 27 Example: MIPS數(shù)不可靠！ Consider the computer with three instruction classes and CPI measurements from the example 4. Now suppose we measure the code for the same program from two different compilers and obtain the following data: Assume that the computers clock rate is 4GHz. Which code sequence will execute faster according to MIPS? According to execution time? CPU clock cycles 1 = (5 1+1 2+1 3) 109 = 10 109 CPU clock cycles 2 = (10 1+1 2+1 3) 109 = 15 109 Execution time 1 = 10 109 / 4 109 = 2.5 seconds Execution time 2 = 15 109 / 4 109 = 3.75 seconds MIPS 1 = (5+1+1) 109 / 2.5 106 = 2800 MIPS 2 = (10+1+1) 109 / 3.75 106 = 3200 結(jié)論：來(lái)自 compiler2 產(chǎn)生代碼的 MIPS高，而來(lái)自 compiler1產(chǎn)生的代碼的執(zhí)行時(shí)間快。 28 選擇性能評(píng)價(jià)程序（ Benchmarks）用基準(zhǔn)程序來(lái)評(píng)測(cè)計(jì)算機(jī)的性能基準(zhǔn)測(cè)試程序是專門用來(lái)進(jìn)行性能評(píng)價(jià)的一組程序不同用戶使用的計(jì)算機(jī)用不同的基準(zhǔn)程序基準(zhǔn)程序通過(guò)運(yùn)行實(shí)際負(fù)載來(lái)反映計(jì)算機(jī)的性能最好的基準(zhǔn)程序是用戶實(shí)際使用的程序或典型的簡(jiǎn)單程序基準(zhǔn)程序的缺陷現(xiàn)象：基準(zhǔn)程序的性能與某段短代碼密切相關(guān)時(shí)，會(huì)被利用以得到不當(dāng)?shù)男阅茉u(píng)測(cè)結(jié)果手段：硬件系統(tǒng)設(shè)計(jì)人員或編譯器開發(fā)者針對(duì)這些代碼片段進(jìn)行特殊的優(yōu)化，使得執(zhí)行這段代碼的速度非常快例 1： Intel Pentium處理器運(yùn)行 SPECint時(shí)用了公司內(nèi)部使用的特殊編譯器，使其性能極高例 2：矩陣乘法程序 SPECmatrix300有 99%的時(shí)間運(yùn)行在一行語(yǔ)句上，有些廠商用特殊編譯器優(yōu)化該語(yǔ)句，使性能達(dá) VAX11/780的 729.8倍！ 29 用于性能評(píng)估的程序 (Toy) Benchmarks（短小基準(zhǔn)程序）程序短小容易編譯，便于仿真或手工編譯，因而可用于對(duì)新開發(fā)的機(jī)器進(jìn)行性能評(píng)測(cè) . （因?yàn)樾聶C(jī)器往往沒有配編譯器）大?。?10-100 line 例： sieve, puzzle, quicksort 缺陷：不是實(shí)際使用的程序，只用于新開發(fā)的計(jì)算機(jī)。 Synthetic Benchmarks（綜合基準(zhǔn)程序）目的：試圖用一個(gè)基準(zhǔn)程序去涵蓋一系列基準(zhǔn)程序的特征做法：使各種語(yǔ)句的執(zhí)行頻度與一系列基準(zhǔn)程序中的頻度一致例： Whetstone(Algol 60Fortran), Dhrystone(AdaC) 缺陷：不是實(shí)際用的程序，可特殊優(yōu)化使評(píng)測(cè)結(jié)果優(yōu)，但實(shí) 際并不如此 Kernels（核心程序段）實(shí)際程序中的耗時(shí)較多的關(guān)鍵片斷通常用在科學(xué)計(jì)算領(lǐng)域測(cè)試某個(gè)特殊功能的性能例： Livermore loops(21 loops), Linpack(linear algebra) Real programs（頻繁使用的實(shí)際程序） e.g., gcc, spice 30 Successful Benchmark: SPEC 1988年， 5家公司（ Sun, MIPS, HP, Apollo, DEC ）聯(lián)合提出 Systems Performance Evaluation Committee (SPEC) SPEC給出一組標(biāo)準(zhǔn)的測(cè)試程序、標(biāo)準(zhǔn)輸入和測(cè)試報(bào)告。它們是一些實(shí)際的程序，包括 OS calls、 I/O等版本 89： 10 programs = 4 for integer + 6 for FP, 用每個(gè)程序的執(zhí)行時(shí)間求出一個(gè)綜合性能指標(biāo) 版本 92： SPECInt92 (6 integer programs) and SPECfp92 (14 floating point programs) 整數(shù)和浮點(diǎn)數(shù)單獨(dú)提供衡量指標(biāo)： SPECInt92和 SPECfp92 增加 SPECbase: 禁止使用任何與程序有關(guān)的編譯優(yōu)化開關(guān) 版本 95： 8 int + 10fp 較新版本： include SPEC HPC96, SPEC JVM98, SPEC WEB99, SPEC OMP2001. SPEC CPU2000 http:/www.spec.org for more details benchmarks useful for 3 years Base machine is changed from VAX-11/780 to Sun SPARC 10/40 31 如何給出綜合評(píng)價(jià)結(jié)果 ? Program 1: 1 sec on machine A, 10 sec on machine B Program 2: 1000 sec on A， 100 sec on B What are your conclusions? A is 10 times faster than B for program1. B is 10 times faster than A for Program2. 一種簡(jiǎn)單的綜合評(píng)價(jià)指標(biāo) Total execution time B is 1001/110=9.1 times faster than A 實(shí)際上，須考慮每個(gè)程序在作業(yè)中的使用頻度，即加權(quán)平均問(wèn)題：如果用一組基準(zhǔn)程序在不同的機(jī)器上測(cè)出了運(yùn)行時(shí)間，那么如何綜合評(píng)價(jià)機(jī)器的性能呢？例：無(wú)法比較 A和 B的好壞，須用一個(gè) 綜合的值來(lái)表示 32 綜合性能評(píng)價(jià)的方法可用兩種平均值來(lái)評(píng)價(jià)性能 Arithmetic mean(算術(shù)平均 )：求和后除 n Geometric mean(幾何平均 )：求積后開根號(hào) n 根據(jù)算術(shù)平均執(zhí)行時(shí)間能得到程序總平均執(zhí)行時(shí)間根據(jù)幾何平均執(zhí)行時(shí)間不能得到程序總的執(zhí)行時(shí)間執(zhí)行時(shí)間的規(guī)格化 (測(cè)試機(jī)器相對(duì)于參考機(jī)器的性能 ) time on reference machine time on measured machine 平均規(guī)格化執(zhí)行時(shí)間不能用算術(shù)平均來(lái)計(jì)算，而應(yīng) 該用幾何平均 program A going from 2 seconds to 1 second as important as program B going from 2000 seconds to 1000 seconds. （算術(shù)平均值不能反映這一點(diǎn)！）算術(shù)平均和幾何平均各有長(zhǎng)處，可靈活使用！ 33 Impact of Means on SPECmark89 for IBM 550 Ratio to VAX: Time: Weighted Time: Program Before After Before After Before After gcc 30 29 49 51 8.91 9.22 espresso 35 34 65 67 7.64 7.86 spice 47 47 510 510 5.69 5.69 doduc 46 49 41 38 5.81 5.45 nasa7 78 144 258 140 3.43 1.86 li 34 34 183 183 7.86 7.86 eqntott 40 40 28 28 6.68 6.68 matrix300 78 730 58 6 3.43 0.37 fpppp 90 87 34 35 2.97 3.07 tomcatv 133 138 20 19 2.01 1.94 Mean 54 72 124 108 54.42 49.9 Geometric Arithmetic Weighted Arith. Ratio 1.33 Ratio 1.16 Ratio 1.09 注： “ After 表示加了特殊編譯開關(guān)后的結(jié)果。好的評(píng) 價(jià)標(biāo)準(zhǔn) 應(yīng)該對(duì) 特殊處理不敏感！該表反映了不同的均值計(jì)算法得到的結(jié)論可能不同。 34 性能、功耗及能量效率功耗：能耗 =C V2 f 功耗逐漸成為處理器性能的主要限制電源的消耗通常是與性能及價(jià)格同樣重要的因素 CMOS電路可以通過(guò)降低頻率來(lái)降低電能消耗最大時(shí)鐘頻率可調(diào)時(shí)鐘頻率相對(duì)性能相對(duì)效率 35 計(jì)算機(jī)某方面改進(jìn)，系統(tǒng)的性能能成比例提高嗎？例：假設(shè)某個(gè)程序在某臺(tái)計(jì)算機(jī)上運(yùn)行時(shí)所需的時(shí)間是 100秒，其中 80秒是用來(lái)執(zhí)行乘法操作。若希望使該程序的速度提高到原來(lái)的 5倍，乘法部件的速度應(yīng)該是原來(lái)的多少倍呢？若其中 90秒用來(lái)執(zhí)行乘法操作，結(jié)果又會(huì)如何？受改進(jìn)影響部分的執(zhí)行時(shí)間改進(jìn)后程序的執(zhí)行時(shí)間 = （ Amdahl定律）改進(jìn)部分性能提高的倍數(shù) + 未受改進(jìn)影響部分的執(zhí)行時(shí)間因?yàn)橄到y(tǒng)性能提高到原來(lái)的 5倍，故新的執(zhí)行時(shí)間應(yīng)該是 20秒 20秒 = 80秒 /n +(100-80)秒， 0 = 80秒 /n 說(shuō)明如果乘法只是占到總計(jì)算量的 80%的話，無(wú)論對(duì)乘法部件做何種改進(jìn)，系統(tǒng)性能都不可能提高到原來(lái)的 5倍。硬件設(shè)計(jì)的基本策略：使最常用的部分變得更快 36 小結(jié) 性能的定義：一般用程序的響應(yīng)時(shí)間或系統(tǒng)的吞吐率表示機(jī) 器或系統(tǒng)整體性能 CPU性能的測(cè)量（用戶程序的 CPU執(zhí)行時(shí)間）一般把程序的響應(yīng)時(shí)間劃分成 CPU時(shí)間和等待時(shí)間， CPU時(shí)間又分成用戶 CPU時(shí)間和系統(tǒng) CPU時(shí)間因?yàn)椴僮飨到y(tǒng)對(duì)自己所花費(fèi)的時(shí)間進(jìn)行測(cè)量時(shí)，不十分準(zhǔn)確，所以，對(duì) CPU性能的測(cè)算一般通過(guò)測(cè)算用戶 CPU時(shí)間來(lái)進(jìn)行各種性能指標(biāo)之間的關(guān)系 CPU執(zhí)行時(shí)間 =CPU時(shí)鐘周期數(shù) x 時(shí)鐘周期時(shí)鐘周期和時(shí)鐘頻率互為倒數(shù) CPU時(shí)鐘周期數(shù) = 程序指令數(shù) x 每條指令的平均時(shí)鐘周期數(shù) CPI MIPS數(shù)在有些情況下不能說(shuō)明問(wèn)題，不具有可比性！性能評(píng)價(jià)程序的選擇采用一組基準(zhǔn)測(cè)試程序進(jìn)行綜合 (算術(shù) (加權(quán) )平均 /幾何平均 )評(píng)測(cè) 有些制造商會(huì)針對(duì)評(píng)測(cè)程序中頻繁出現(xiàn)的語(yǔ)句采用專門編譯器，使評(píng) 測(cè)程序運(yùn)行效率大幅提高。因此有時(shí)基準(zhǔn)評(píng)測(cè)程序也不能說(shuō)明問(wèn)題對(duì)某種特定指令集體系結(jié)構(gòu)，提高計(jì)算機(jī)性能的主要途徑有提高時(shí)鐘頻率（第七章流水線）優(yōu)化處理器中數(shù)據(jù)通路結(jié)構(gòu)以降低 CPI(第六章處理器 ) 用編譯優(yōu)化措施來(lái)減少指令條數(shù)或降低指令復(fù)雜度 (第二章指令系統(tǒng) ) 37 謝謝！

注意事項(xiàng)

本文（《計(jì)算機(jī)原理》PPT課件）為本站會(huì)員（san****019）主動(dòng)上傳，裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)上載內(nèi)容本身不做任何修改或編輯。若此文所含內(nèi)容侵犯了您的版權(quán)或隱私，請(qǐng)立即通知裝配圖網(wǎng)（點(diǎn)擊聯(lián)系客服），我們立即給予刪除！

溫馨提示：如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載，重復(fù)下載不扣分。