计算机系统结构

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章

例1.1 将计算机系统中某一功能的处理速度提高到原来的20倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此提高性能的方法后,能使整个系统的性能提高多少? 解 由题可知,可改进比例 = 40% = 0.4, 部件加速比 = 20 根据Amdahl 定律可知:

采用此提高性能的方法后,能使整个系统的性能提高到原来的1.613倍。

例1.2 某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,试计算该程序中浮点操作所占的比例。 解 由题可知,部件加速比 = 20,系统加速比 = 5 根据Amdahl 定律可知

()2011

5可改进比例

可改进比例+

-=

由此可得:可改进比例 = 84.2% 即程序中浮点操作所占的比例为84.2%。

例 1.3 A common transformation required in graphics processors is square root. Implementations of floating-point (FP) square root vary significantly in performance, especially among processors designed for graphics. Suppose FP square root (FPSQR) is responsible for 20% of the execution time of a critical graphics benchmark. One proposal

is to enhance the FPSQR hardware and speed up this operation by a factor of 10. The

other alternative is just to try to make all FP instructions in the graphics processor run faster by a factor of 1.6; FP instructions are responsible for half of the execution time for the application. The design team believes that they can make all FP instructions run 1.6 times faster with the same effort as required for the fast square root. Compare these two design alternatives.

例1.4Suppose we have made the following measurements:

Frequency of FP operations = 25%

Average CPI of FP operations = 4.0

Average CPI of other instructions = 1.33

Frequency of FPSQR= 2%

CPI of FPSQR = 20

Assume that the two design alternatives are to decrease the CPI of FPSQR to 2 or to decrease the average CPI of all FP operations to 2.5. Compare these two design alternatives using the processor performance equation.

解首先可求出两种情况下原始的CPI值:

CPI原始=(4×25%)+(1.33 × 75%)= 2.0

可以通过改进FPSQR部件缩减的时钟周期计算,改进后的CPI采用FPSQR技术CPI采用FPSQR技术=CPI原始–2%*(CPIFPSQR –CPI仅采用FPSQR )= 2- 2% (20-2)=1.64

而采用新的FP指令所需要的CPI采用FP值

CPI采用FP =(75% × 1.33)+(25% × 2.5)= 1.625

第二章

例题:某应用程序,简单的基本指令占80%,而复杂指令占20%,在传统CISC计算机上运行,简单指令的CPI=4,复杂指令的CPI=8,而在RISC计算机上运行只有简单指令,其CPI=1,复杂指令用简单指令合成实现。假设平均每条复杂指令需14条基本指令组合,请比较两个计算机系统运行该应用程序的性能。

解:设CISC计算机的时钟周期为TCISC,RISC计算机的时钟周期为TRISC,则:CISC 计算机的平均CPI=0.8×4+0.2×8=4.8

RISC计算机的指令数增加为

IRISC=0.8*ICISC+0.2*ICISC×14=3.6ICISC

因CPUtime=I×CPI×T

故CPUtime-CISC=ICISC ×4.8×TCISC

CPUtime-RISC=3.6ICISC×1×TRISC

所以计算机性能比=CPUtime-CISC/CPUtime-RISC=1.333

第三章

例如:一条4段的流水线中,S1,S2,S4各段的

时间都是Δt,唯有S3的时间是3Δt。

入 出

△t △t 3△t △t

最大吞吐率为

例如:对前面的4段流水线

把瓶颈段S 3细分为3个子流水线段:S 3a ,S 3b ,S 3c

入 出

改进后的流水线的吞吐率 :

例3.1 设在下图所示的静态流水线上计算:

)

(4

1

i i i

B A

+∏=

流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中,试计算其吞吐率、加速比

相关文档
最新文档