计算机系统结构复习题分析

合集下载

计算机体系结构(系统结构)考试例题--大题

例1.1 将计算机系统中某一功能的处理速度加快15倍，但该功能的处理时间仅占整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少？解由题可知： F e = 40% = 0.4 S e = 15根据Amdahl 定律可知：采用此增强功能方法后，能使整个系统的性能提高到原来的1.6倍。

例1.2 某计算机系统采用浮点运算部件后，使浮点运算速度提高到原来的25倍，而系统运行某一程序的整体性能提高到原来的4倍，试计算该程序中浮点操作所占的比例。

解由题可知： S e = 25 S n = 4 根据Amdahl 定律可知：6.1154.0)4.01(1)1(1≈+-=+-=SeFeFe Sn()25114FeFe +-=由此可得：Fe = 78.1%即程序中浮点操作所占的比例为78.1%。

例1.3 假设FP 指令的比例为25%，其中，FPSQR 占全部指令的比例为2%，FP 操作的CPI 为4，FPSQR 操作的CPI 为20 ，其他指令的平均CPI 为1.33。

现有两种改进方案，第一种是把FPSQR 操作的CPI 减至2，第二种是把所有的FP 操作的CPI减至2，试比较两种方案对系统性能的提高程度。

解没有改进之前，每条指令的平均时钟周期CPI 为：（1）采用第一种方案FPSQR 操作的CPI 由CPI FPSQR ＝20减至CPI’FPSQR ＝2，则整个系统的指令平均时钟周期数为：()()2%7533.1%2541=⨯+⨯=⎪⎭⎫ ⎝⎛⨯=∑=ni i i IC IC CPI CPICPI1＝CPI―（CPIFPSQR―CPI’FPSQR）×2%＝2―(20―2) ×2%＝1.64（2）采用第二种方案所有FP操作的CPI由CPIFP ＝4减至CPI’FP＝2，则整个系统的指令平均时钟周期数为：CPI2＝CPI―（CPIFP―CPI’FP）×25%＝2―(4―2) ×25%＝1.5从降低整个系统的指令平均时钟周期数的程度来看，第二种方案优于第一种方案。

计算机系统结构复习题（含答案）

计算机系统结构复习题（含答案）计算机系统结构复习题1、虚拟机的概念虚拟机（Virtual Machine）指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。

2、指令系统的设计方法、概念、主要原因、对象、总线的仲裁算法主要原因：因为指令系统是软件设计人员与硬件设计人员之间的一个主要分界面，也是他们之间互相沟通的一座桥梁。

对象：概念：又称指令集（instruction set）是计算机体系结构设计的核心，是计算机软、硬件接口,是指机器所具有的全部指令的集合。

它反映了计算机所拥有的基本功能。

它是机器语言程序员所看到的机器的主要属性之一。

设计方法：①、首先考虑所应实现的基本功能，确定哪些基本功能应该由硬件实现，哪些功能由软件实现比较合适。

包括指令的功能设计和指令格式的设计；②、在确定哪些基本功能用硬件来实现时，主要考虑3个因素：速度、成本、灵活性；硬件实现的特点：速度快、成本高、灵活性差软件实现的特点：速度慢、价格便宜、灵活性好③、对指令系统的基本要求完整性、规整性、正交性、高效率、兼容性。

总线仲裁算法有：静态优先级算法、固定时间片算法、（动态优先级）算法和（先来先服务）算法3、要实现两条指令在世间上重叠解释步骤是什么？为了实现两条指令在时间上重叠解释：首先需要付出空间代价，如增加数据总线、控制总线、指令缓冲器、地址加法器、相关专用通路，将指令分析部件和指令执行部件功能分开、单独设置，主存采用多体交叉存取，等等。

其次要处理好指令之间可能存在的关联，如转移的处理，指令相关，主存空间数的相关、通用寄存器组的数相关和基址值相关等的处理。

此外，还应合理调配好机器指令的微操作，使“分析”和“执行”的时间尽可能相等，以提高重叠的效率。

4、互连网络的交换方式有（线路交换）、（包交换）和（线路/包交换）5、SIMD互连网络采用（线路）交换，多处理机常采用（包）交换6、与重叠机器一样，流水机器在遇到（转移指令）指令，尤其是（条件转移指令）指令时，效率也会显著下降7、按指令与数据流的多倍性将数据流分为（SISD）、（SIMD）、（MISD）、（MIMD）四类。

计算机系统结构复习试题及答案（非计算）

计算机系统结构复习试题及答案（⾮计算）⼀．名词解释计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。

在计算机技术中，把这种本来存在的事物或属性，但从某种⾓度看⼜好像不存在的概念称为透明性。

系列机：由同⼀⼚家⽣产的具有相同系统结构、但具有不同组成和实现的⼀系列不同型号的计算机。

同构型多处理机系统：由多个同类型或⾄少担负同等功能的处理机组成，它们同时处理同⼀作业中能并⾏执⾏的多个任务。

堆栈型机器：CPU 中存储操作数的单元是堆栈的机器。

累加器型机器：CPU 中存储操作数的单元是累加器的机器。

通⽤寄存器型机器：CPU 中存储操作数的单元是通⽤寄存器的机器。

数据相关：考虑两条指令i 和j，i 在j 的前⾯，如果下述条件之⼀成⽴，则称指令j 与指令 i 数据相关：（1）指令j 使⽤指令i 产⽣的结果；（2）指令j 与指令k 数据相关，⽽指令k ⼜与指令i 数据相关。

定向：⽤来解决写后读冲突的。

在发⽣写后读相关的情况下，在计算结果尚未出来之前，后⾯等待使⽤该结果的指令并不见得是马上就要⽤该结果。

如果能够将该计算结果从其产⽣的地⽅直接送到其它指令需要它的地⽅，那么就可以避免停顿。

向量处理机：指令级并⾏：简称ILP。

是指指令之间存在的⼀种并⾏性，利⽤它，计算机可以并⾏执⾏两条或两条以上的指令。

指令的动态调度：是指在保持数据流和异常⾏为的情况下，通过硬件对指令执⾏顺序进⾏重新安排，以提⾼流⽔线的利⽤率且减少停顿现象。

是由硬件在程序实际运⾏时实施的。

指令的静态调度：是指依靠编译器对代码进⾏静态调度，以减少相关和冲突。

它不是在程序执⾏的过程中、⽽是在编译期间进⾏代码调度和优化的。

失效率：CPU 访存时，在⼀级存储器中找不到所需信息的概率。

失效开销：CPU 向⼆级存储器发出访问请求到把这个数据调⼊⼀级存储器所需的时间。

强制性失效：当第⼀次访问⼀个块时，该块不在Cache 中，需要从下⼀级存储器中调⼊Cache，这就是强制性失效。

(完整版)计算机系统结构复习题(附答案)范文

计算机系统结构复习题和重点（附答案）一、单项选择题1．实现汇编语言源程序变换成机器语言目标程序是由（）A．编译程序解释B．编译程序翻译C．汇编程序解释D．汇编程序翻译2．系列机软件必须保证（）A．向前兼容，并向上兼容B．向前兼容，并向下兼容C．向后兼容，力争向上兼容D．向后兼容，力争向下兼容3．浮点数尾数基值r m=8，尾数数值部分长6位，可表示规格化正尾数的个数是（）A．56个B．63个C．64个D．84个4．在IBM370系统中，支持操作系统实现多进程共用公用区管理最有效的指令是（）A．“执行”指令B．“程序调用”指令C．“比较与交换”指令D．“测试与置定”指令5．关于非专用总线三种控制方式中，下列叙述错误．．的是（）A．集中式定时查询，所有部件共用同一条“总线忙”线B．集中式定时查询，所有部件都用同一条“总线请求”线C．集中式独立请求，所有部件都用同一条“总线请求”线D．集中式串行链接，所有部件都用同一条“总线请求”线6．磁盘外部设备适合于连接到（）A．字节多路通道B．数组多路通道或选择通道C．选择通道或字节多路通道D．数组多路通道或字节多路通道7．在Cache存储器中常用的地址映象方式是（）A．全相联映象B．页表法映象C．组相联映象D．段页表映象8．在指令级高度并行的超级处理机中，下列叙述正确的是（）A．超标量处理机利用资源重复，要求高速时钟机制B．超流水线处理机利用资源重复，要求高速时钟机制C．超标量处理着重开发时间并行性，要求高速时钟机制D．超流水线处理机着重开发时间并行性，要求高速时钟机制9．间接二进制n方体网络是一种（）A．多级立方体网络B．多级全排列网络C．单级立方体网络D．多级混洗交换网络10．多端口存储器适合于连接A．紧耦合多处理机B．松耦合多处理机C．机数很多的处理机D．机数可变的多处理机二、填空题11．多处理机实现的是___________、___________间的并行。

计算机系统结构复习资料

1.6某台主频为400MHz 的计算机执行标准测试程序，程序中指令类型、执解：（1）CPI ＝(45000×1＋75000×2＋8000×4＋1500×2) / 129500＝1.776 （2）MIPS 速率＝f/ CPI ＝400/1.776 ＝225.225MIPS（3）程序执行时间= (45000×1＋75000×2＋8000×4＋1500×2)／400=575s1.7 将计算机系统中某一功能的处理速度加快10倍，但该功能的处理时间仅为整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少？解由题可知：可改进比例 = 40% = 0.4 部件加速比 = 10根据Amdahl 定律可知：()5625.1104.04.011=+-=系统加速比采用此增强功能方法后，能使整个系统的性能提高到原来的1.5625倍。

1.8 计算机系统中有三个部件可以改进，这三个部件的部件加速比为：部件加速比1=30；部件加速比2=20；部件加速比3=10（1）如果部件1和部件2的可改进比例均为30%，那么当部件3的可改进比例为多少时，系统加速比才可以达到10？（2）如果三个部件的可改进比例分别为30%、30%和20%，三个部件同时改进，那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少？解：（1）在多个部件可改进情况下，Amdahl 定理的扩展：∑∑+-=iii n S F F S )1(1已知S 1＝30，S 2＝20，S 3＝10，S n ＝10，F 1＝0.3，F 2＝0.3，得：）（）（10/20/0.330/0.30.30.3-111033F F +++++=得F 3＝0.36，即部件3的可改进比例为36%。

（2）设系统改进前的执行时间为T ，则3个部件改进前的执行时间为：（0.3+0.3+0.2）T = 0.8T ，不可改进部分的执行时间为0.2T 。

计算机系统结构习题解答

1. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段;每一段的时间分别是△t 、2△t 和3△t..在下列各种情况下;分别写出连续执行n 条指令所需要的时间表达式.. ⑴ 顺序执行方式..⑵ 仅“取指令”和“执行”重叠.. ⑶ “取指令”、“分析”和“执行”重叠.. 答：⑴ 顺序执行方式12......12 12T ＝∑=++n1i i i i )t t t (执行分析取址＝n △t ＋2△t ＋3△t ＝6n △t⑵ 仅“取指令”和“执行”重叠12......12 12T ＝6△t ＋∑=+1-n 1i i i )t t (执行分析＝6△t ＋n-12△t ＋3△t ＝5n ＋1△t⑶ “取指令”、“分析”和“执行”重叠△2△t3△t△2△t3△t1 2 34......1 234 1234T ＝6△t ＋∑=1-n 1i i )t (执行＝6△t ＋n-13△t ＝3n ＋3△t2. 一条线性流水线有4个功能段组成;每个功能段的延迟时间都相等;都为△t..开始5个任务;每间隔一个△t 向流水线输入一个任务;然后停顿2个△t;如此重复..求流水线的实际吞吐率、加速比和效率.. 答：1 2 3 4 5 6 7 8 9 10 11 12 13 14 15...1 2 3 4 56 7 8 9 1011 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 151 2 3 4 56 7 8 9 1011 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23我们可以看出;在7n+1Δt 的时间内;可以输出5n 个结果;如果指令的序列足够长n →∞;并且指令间不存在相关;那么;吞吐率可以认为满足：加速比为：从上面的时空图很容易看出;效率为：3. 用一条5个功能段的浮点加法器流水线计算∑==101i i A F ..每个功能段的延迟时间均相等;流水线的输出端与输入端之间有直接数据通路;而且设置有足够的缓冲寄存器..要求用尽可能短的时间完成计算;画出流水线时空图;计算流水线的实际吞吐率、加速比和效率..答：首先需要考虑的是“10个数的和最少需要做几次加法”;我们可以发现;加法的次数是不能减少的：9次；于是我们要尽可能快的完成任务;就只有考虑如何让流水线尽可能充满;这需要消除前后指令之间的相关..由于加法满足交换律和结合律;我们可以调整运算次序如以下的指令序列;我们把中间结果寄存器称为R;源操作数寄存器称为A;最后结果寄存器称为F;并假设源操作数已经在寄存器中;则指令如下：I1：R1←A1+A2I2：R2←A3+A4I3：R3←A5+A6I4：R4←A7+A8I5：R5←A9+A10I6：R6←R1+R2I7：R7←R3+R4I8：R8←R5+R6I9：F←R7+R8这并不是唯一可能的计算方法..假设功能段的延迟为Δt..时空图如下图中的数字是指令号：1234567891234567891234567891234567891 2 3 4 5 6 7891 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21整个计算过程需要21Δt;所以吞吐率为：加速比为：效率为：4. 一条线性静态多功能流水线由6个功能段组成;加法操作使用其中的1、2、3、6功能段;乘法操作使用其中的1、4、5、6功能段;每个功能段的延迟时间均相等..流水线的输出端与输入端之间有直接数据通路;而且设置有足够的缓冲寄存器..用这条流水线计算向量点积i 60i i b a B A ⨯=⨯∑=;画出流水线时空图;计算流水线的实际吞吐率、加速比和效率.. 答：我们安排运算次序如下：把中间结果寄存器称为R;源操作数寄存器称为A 、B;最后结果寄存器称为F;并假设源操作数已经在寄存器中;则指令如下：I1： R0←A0B0 I8： R7←R0+R1 I2： R1←A1B1 I9：R8←R2+R3I3： R2←A2B2 I10： R9←R4+R5 I4： R3←A3B3 I11： R10←R6+R7 I5： R4←A4B4 I12： R11←R8+R9 I6： R5←A5B5I13： F ←R10+R11I7： R6←A6B6假设功能段的延迟为Δt..时空图如下图中的数字是指令号：1 2 3 4 5 6 7 8 9 101112131 2 3 4 5 6 71 2 3 4 5 6 78 9 10 11 12138 9 1011 12131 2 3 4 5 6 78 9 10 11 12131 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 整个计算过程需要24Δt;所以吞吐率为：加速比为：效率为：5. 一条有三个功能段的流水线如下图..每个功能段的延迟时间均相等;都为△t..其中功能段S 2的输出要返回到它自己的输入端循环一次..⑴ 如果每间隔一个△t 向流水线的输入端连续输入新任务;问这条流水线会发生什么情况⑵ 求这条流水线能够正常工作的最大吞吐率、加速比和效率.. ⑶ 有什么办法能够提高这条流水线的吞吐率;画出新的流水线.. 答：△t △t △t⑴如果每间隔一个△t向流水线的输入端连续输入新任务;流水线S2功能段存在资源冲突..见下表：⑵每间隔两个△t向流水线的输入端连续输入新任务如见下表所示可获得最佳性能..我们可以看出：在2n+2Δt的时间内;可以输出n个结果;如果指令的序列足够长n→∞;并且指令间不存在相关;那么;吞吐率为：加速比为：效率为：⑶如要提高这条流水线的吞吐率;可采用：将功能段S2重复设置一次;见下图：6. 一条有4个功能段的非线性流水线;每个功能段的延迟时间都相等;都为20ns;它的预约表如下：⑴ 写出流水线的禁止向量和初始冲突向量.. ⑵ 画出调度流水线的状态图..⑶ 求流水线的最小启动循环和最小平均启动距离.. ⑷ 求平均启动距离最小的恒定循环.. ⑸ 求流水线的最大吞吐率..⑹ 按照最小启动循环连续输入10个任务;求流水线的实际吞吐率.. ⑺ 画出该流水线各功能段之间的连接图.. 答： ⑴禁止向量F=6;4;2；冲突向量C=101010..输入△t⑵⑶∴流水线的最小启动循环为：1;7或3;5或5;3;最小平均启动距离为4..⑷由上表可知：平均启动距离最小的恒定循环为5..⑸采用最小平均启动距离为4的最小启动循环可获得流水线的最大吞吐率;以1;7为例：其他类似;最大吞吐率皆相同当任务数为偶数2n 时：当任务数为奇数2n+1时： ∴ 流水线的最大吞吐率为：)s /(M 5.12ns2041t 41任务=⨯=∆ ⑹10个任务的实际吞吐率：利用上式可得偶数个任务TP 10=1/4△t=12.5M 任务/s.. ⑺该流水线的连接图为：7.一条由4个功能段组成的非线性流水线的预约表如下;每个功能段的延迟时间都为10ns..47⑴ 写出流水线的禁止向量和初始冲突向量.. ⑵ 画出调度流水线的状态图..⑶ 求流水线的最小启动循环和最小平均启动距离..⑷ 在流水线中插入一个非计算延迟功能段后;求该流水线的最佳启动循环及其最小平均启动距离..⑸ 画出插入一个非计算延迟功能段后的流水线预约表5行8列.. ⑹ 画出插入一个非计算延迟功能段后的流水线状态变换图.. ⑺ 分别计算在插入一个非计算延迟功能段前、后的最大吞吐率.. ⑻ 如果连续输入10个任务;分别计算在插入一个非计算延迟功能段前、后的实际吞吐率.. 答： ⑴禁止向量F=5;2;1；冲突向量C=10011..⑵⑶i=466最小启动循环为3;最小平均启动距离为3..⑷插入一个非计算延迟功能段后;最小平均启动距离为2因为预约表中每行至多2个×;相应地可改进最小启动循环为2..⑸⑹流水线的禁止向量为1;3;7;流水线的冲突向量为1000101;流水线的状态图如下：6C0-C065C0-C2-C255;4C0-C2 4.55;6C0-C2 5.5流水线的最小启动循环为2;最小平均启动距离为2..⑺插入前：插入后：⑻连续输入10个任务;插入前的实际吞吐率为：连续输入10个任务;插入后的实际吞吐率为：8. 在流水线处理机中;有独立的加法操作部件和乘法操作部件各一个;加法操作部件为4段流水线;乘法操作部件6段流水线;都在第一段从通用寄存器读操作数;在最后一段把运算结果写到通用寄存器中..每段的时间长度都相等;都是一个时钟周期..每个时钟周期发出一条指令..问可能发生哪几种数据相关写出发生相关的指令序列;分析相关发生的原因;并给出解决相关的具体办法..答：可能的数据相关性有：⑴“先写后读”RAW相关Read After 加法写..原因：还没有写好就已经读取寄存器中的数据了..DADD R1;R2;R3 ；R2＋R3→R1DSUB R4;R1;R5 ；R1－R5→R4Read After 乘法写..原因：还没有写好已经读取寄存器中的数据了..DMUL R1;R2;R3 ；R2×R3→R1DSUB R4;R1;R5 ；R1－R5→R4本相关在流水线顺序执行和乱序执行时都可能发生..解决的方法是：利用编译程序调整指令的次序方法；延迟执行是避免数据相关最简单的方法；建立寄存器之间的专用路径..⑵“写—写”WAW相关Write After 乘法写..原因：后写的反而早执行乘法所化的时间长;后面一个写任务反而先完成;使最后写入的内容不正确..DMUL R1;R2;R3 ；R2×R3→R1DSUB R1;R4;R5 ；R4－R5→R1本相关只有在流水线乱序执行时才可能发生..解决的方法是：寄存器换名..⑶“先读后写”WAR相关Write After 任何读..原因：前面的读操作因为某种原因被推迟;要读的内容被后面的写操作修改了..DSUB R4;R1;R5 ；R1－R5→R4DADD R1;R2;R3 ；R2＋R3→R1本相关只有在流水线乱序执行时才可能发生..解决的方法是：寄存器换名..9. 在下列不同结构的处理机上运行8×8的矩阵乘法C=A×B;计算所需要的最短时间..只计算乘法指令和加法指令的执行时间;不计算取操作数、数据传送和程序控制等指令的执行时间..加法部件和乘法部件的延迟时间都是3个时钟周期;另外;加法指令和乘法指令还要经过一个“取指令”和“指令译码”的时钟周期;每个时钟周期为20ns;C 的初始值为“0”..各操作部件的输出端有直接数据通路连接到有关操作部件的输入端;在操作部件的输出端设置有足够容量的缓冲寄存器..⑴处理机内只有一个通用操作部件;采用顺序方式执行指令..⑵单流水线标量处理机;有一条两个功能的静态流水线;流水线每个功能段的延迟时间均为一个时钟周期;加法操作和乘法操作各经过3个功能段..⑶多操作部件处理机;处理机内有独立的乘法部件和加法部件;两个操作部件可以并行工作..只有一个指令流水线;操作部件不采用流水线结构..⑷单流水线标量处理机;处理机内有两条独立的操作流水线;流水线每个功能段的延迟时间均为一个时钟周期..⑸超标量处理机;每个时钟周期同时发射一条乘法指令和一条加法指令;处理机内有两条独立的操作流水线;流水线的每个功能段的延迟时间均为一个时钟周期..⑹超流水线处理机;把一个时钟周期分为两个流水级;加法部件和乘法部件的延迟时间都为6个流水级;每个时钟周期能够分时发射两条指令;即每个流水级能够发射一条指令..⑺超标量超流水线处理机;把一个时钟周期分为两个流水级;加法部件和乘法部件延迟时间都为6个流水级;每个流水级能够同时发射一条乘法指令和一条加法指令..答：要完成上面的矩阵乘法;需要完成的乘法数目为8×8×8=512次；需要完成的加法数目为8×8×7=448次；下面分析处理机的结构会给性能带来什么样的影响..⑴通用操作部件采用顺序方式执行顺序执行时;每个乘法和加法指令都需要5个时钟周期取指令、指令分析、指令执行；所以所需要的时间为：⑵单流水线标量处理机;有一条两个功能的静态流水线因为有足够的缓冲寄存器;所以我们可以首先把所有的乘法计算完;并通过调度使加法流水线不出现停顿;所以所需要的时间为：123456785135145155165175189639649659661=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑶多操作部件处理机;只有一条指令流水线由于只有一条指令流水线;所以只能一个时钟周期发射一条指令；由于操作部件不采用流水线;对于结果C矩阵的第一个元素;首先执行2次乘法;然后乘法和加法并行执行7次;此时C矩阵的第一个元素出来了;然后加法运算停顿3个时钟周期;再开始与乘法并行执行运算7次;如此下去;直到C的64个元素都出来..故执行时间为：⑷单流水线标量处理机;处理机内有两条独立的操作流水线由于只有一条指令流水线;所以只能一个时钟周期发射一条指令；对于乘法运算不存在数据相关;对于加法运算有数据相关;由于存在足够的缓冲寄存器;我们可以通过合适的调度消除加法的数据相关..因此;最佳情况下的执行时间为：12345678910111213141516171819202122 1=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑸超标量处理机同一时钟周期可以有一条乘法指令和一条加法指令同时发射;对于乘法运算不存在数据相关性;对于加法运算有数据相关性;由于存在足够的缓冲寄存器;当运算完所有的乘法运算后;还要做一次加法运算..因此执行时间为：12345678910111213141516171819202122 1=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑹超流水线处理机每个时钟周期发射两条指令;加法部件和乘法部件都为6个流水级..事实上相当于将时钟周期变成了10ns;而加法和乘法流水线变成了6级..因此执行时间为：⑺超标量超流水线处理机一个时钟周期分为两个流水级;加法部件和乘法部件都为6个流水级;每个流水级能同时发射一条加法和一条乘法指令..综合⑸和⑹的分析;我们可以知道;执行时间为：。

计算机系统结构复习题(附答案) (1)

计算机系统结构习题答案(李学干)

计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机，可以按照功能划分成4级。

每一级为了执行一条指令需要下一级的N条指令解释。

若执行第1级的一条指令需K纳秒时间，那么执行第2、3、4级的一条指令个需要多少时间？解：①分析：计算机按功能分级时，最底层的为第1级。

向上一次是第2 、3、4级。

解释执行是在低级机器级上，用它的一串指令或语句来解释执行高一级上的一条指令的功能。

是逐条解释的。

②解答：执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。

1.3操作系统机器级的某些指令就用传统机器级的指令，这些指令可以用微程序直接实现，而不由操作系统自己来实现。

根据你对习题1.2的回答，你认为这样做有哪两个好处？答：可以加快操作系统操作命令解释的速度。

同时也节省了存放解释操作命令这部分解释程序所占用的空间。

简化了操作系统机器级的设计。

也有利于减少传统机器级的指令条数。

1.5硬件和软件在什么意义上是等效的？在什么意义上是不等效的？试举例说明。

答：硬件和软件在逻辑意义上是等效的。

在物理意义上是不等效的。

①在原理上，用硬件或固件实现的功能完全可以用软件来完成。

用软件实现的功能也可以用硬件或固件来完成。

功能一样。

②只是反映在速度、价格、实现的难易程度上，这两者是不同的。

性能不同。

③例如，浮点运算在80386以前一直是用软件实现的。

到了80486，将浮点运算器集成到了CPU中，可以直接通过浮点运算指令用硬件实现。

但速度却高的多。

1.9下列哪些对系统程序员是透明的？哪些对应用程序员是透明的？系列机各档不同的数据通路宽度；虚拟存储器；Cache存储器；程序状态字；“启动I/O”指令；“执行”指令；指令缓冲器。

答：①对系统程序员和应用程序员均透明的：是全用硬件实现的计算机组成所包含的方面。

有：数据通路宽度、Cache存储器、指令缓冲器。

②仅对应用程序员透明的：是一些软硬件结合实现的功能。

有：虚拟存储器、程序状态字、“启动I/O”指令。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

计算机系统结构复习1从使用语言角度，可将系统按功能划分为多层次机器级结构，层次结构分别是：应用语 _________ 言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微程序序机器级。

2、各机器级的实现主要靠翻译和解释或两者结合进行。

翻译是先用转_________ 级上的程序整个地变换成低一级机器级上等效的程序，然后再在低一级机器级上实现的技__________ 术。

解释则是在低级机器上用它的一串语句或指令来仿真高级机器上的一条语句或指令的功—能，是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。

3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。

4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定，提供机器语言、汇编语言程序设计或编译程序生成系统为使其设计或生成的程序能在机器上正确运行应看到的遵循的计算机属性。

5、计算机系统结构的属性包括：数据_________ 组织、中断机构、系统机器级的管态和用户态的定义和切换、机器级的I/O结构、系统各部分的信息保护方式和保护机构等属性。

6、机器透明性：指相对于每一机器级设计人员，都客观存在的功能或属性看不到的现象，称相对于此级设计人员来说，这此功能或属性是具有透明性，即透明的。

7、计算机组成指的是计算机系统结构的逻辑实现，包括机器级内部的数据流和控制流的组成以及逻辑设计等。

它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各部件间的联系。

8计算机组成设计要解决的问题是在所______________________________________________________ 各种设备各部件组织成计算机，来实现所确定的系统结构。

9、当前，计算机组成设计主要是围绕_________ 功能的分散和设置专用功能部件来进行的。

10、计算机组成设计要确定的方面一般应包括：数据通路宽路、专用部件的设置、各种操作对部件的共享程度、功能部件的并行度、控制机构的组成方式、缓冲和排队技术、预估预判技术、可靠性技术等。

11、计算机实现指计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，器件、模块、插件、底板的划分与连接，专用器件的设计，微组装技术，信号传输，电源、冷却及整机装配技术等。

它着眼于器件技术和微组装技术，其中，器件技术在实现技术中起着主导作用。

12、计算机系统结构设计的任务是进行软、硬件的功能分配，确定传统机器级的软、硬件界面。

13、软、硬件取舍的三个基本原则是：第一个基本原则是应考虑在现有硬、器件（主要是逻辑器件和存储器）条件，系统要有高的性能价格比，主要从实现费用、速度和其他性能要求来综合考虑。

第二个基本原则是要考虑到准备采用和可能采用的组成技术，使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。

第三个基本原则是从"软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提供更多更好的硬件支持放在首位。

14、程序运行的时间应该是衡量机器时间（速度）性能最可靠的标准。

15、计算机性能诵常用峰值性能及持续性能来评价。

峰值性能是指在理想情况下计算机系统可获得的最高理论性能值，它不能反映出系统的实际性能。

16、持续性能的表示有算术性能平均值、调和性能平均值和几何性能平均值三种。

17、算术性能平均是通常对系统执行时间评价；调和性能平均值反映运行全部程序所需的时间成反比，比较准确地衡量计算机的时间（速度）性能；几何性能平均值是对不同机器进行性能比较时，可以对性能采取归一化，即可以以某台机器性能作为参考标准，让其他机器的性能与参考标准去比，不论哪台机器作参考机，几何性能平均值均能正确地反映出结果的一致性。

18、计算CPU的程序执行时间Tcpu有3个因素，即程序执行的总指令条数IC、平均每条指令的时钟周期数CPI、主时钟频率fc。

19、MIPS是指每秒执行多少百万条指令数。

它与时钟周期数CPI有关，CPI越少，MIPS就越高，一定程度上反映机器的性能越好。

MIPS很大程度依赖于机器的指令系统，用它很难准确衡量指令系统不同的机器之间的性能。

因此MIPS只能用于比较相同机器指令系统的计算机之间的性能。

即使是同一台机器，程序不同，其CPI也不同，其性能的差异会很大。

其次MIPS还与机器硬件有关，如浮点运算部件的机器，虽MIPS很低，但浮点运算速度会很高，而在软件实现浮点运算机器上，MIPS虽然很高，但浮点运算速度可能很低。

MFLOPS只能反映机器执行浮点操作的性能，并不能反映机器的整体性能。

20、简述Amdahl定理？答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

Told :没有采用改进措施前执行某任务的时间Tnew ：采用改进措施后执行某任务的时间Sp :加速比Fe:计算机执行某个任务的总时间中可被改进部分的时间所占比例。

r new :改进部分采用改进措施后比没有采用改进措施的性能提高倍数。

（部件加速比）21、程序访问的局部性包括时间上和空间上的两个局部性。

22、什么是时间上的局部性？指最近将来要用到的信息很可能就是现在正在使用的信息，这是因为程序存在着循环。

23、什么是空间上的局部性？指最近将来要用到的信息很可能与现在正在使用的信息在程序位置上是邻近的，这是因为指令通常是顺序存放、顺序执行的，数据也通常是以向量、阵列、树、表等形式簇聚地存放在一起。

24、系统结构的差异决定软件的移植工作量，要实现软件移植工量小，常采用三种方法来实现：统一高级语言、采用系列机、模拟和仿真。

25、模拟是指？仿真是指？B机器的每条机器指令用A机器一段机器语言程序解释，如同A机器上也有B机器的指令系统一样，这种用机器语言程序解释实现软件移植的方法称为模拟•进行模拟的A机器称为宿主机，被模拟的B机器称为虚拟机.用微程序直接解释另一种机器指令系统的方法就称为仿真。

进行仿真的机器称为宿主机，被仿真的B机器称为目标机。

为仿真所写的解释程序称为仿真微程序。

26、多级存储体系的采用是依据局部性原理原理建立，且存储速度提高，但存储体价格下降。

27、B机上的每条指令都由A机上的一段微程序解释执行称为仿—28、计算机系统结构设计的任务是进行软、硬件的功能分配，确定传统机器级的软、硬件界面。

29、衡量浮点操作的指标是MFLOPS ，衡量指令执行速度的指标是MIPS ___ 。

30、指令系统设计的两大典型风格是CISC 和RISC ________________ 。

31、克服流水中的瓶颈段的两种方法是：瓶颈流水段的细分和瓶颈流_______32、流水线中出现的3种相关是：结构相关，数据相关，控制相关。

33、系统结构的差异决定软件的移植工作量，避免软件移植瓶颈，常采用三种方法来解决，三种方法是统一高级语言、采用系列机、模拟和仿真。

34、向量的处理三种方式有：(1)横向处理方法；(2)纵向处理方法；(3)纵横向处理方法。

35、处理器间采用单向环网时的互连函数是：PM2o或PM2。

36、以硬件为基础实现多Cache 一致性方法有：写作废法、写更新法、目录表法。

37、编址方式常分为三种,它们是_隐含编址,独立编址—和统一编址。

38、阵列处理机的基本结构分为两种：(1)分布式存储器的阵列机；(2)共享存储器的阵列机。

39、程序并行性相关性有三种，即数据相关、数据反相关、数据输出相关。

40、有两台机器，它们对条件转移指令的处理采用不同的设计方案：(1)CPUA采用一条比较指令来设置相应的条件码，由紧随其后的一条转移指令对此条件码进行测试，以确定是否进行转移。

因此实现一次条件转移要执行比较和测试两条指令。

(2)CPUB采用比较和测试两种能合在一条指令的方法，这样实现条件转移只需一条指令。

假设在这两台机器的指令系统中，执行条件转移指令需2个时钟周期，而其他指令只需1个时钟周期。

又假设CPUA中，条件转移指令占总执行指令条数20%。

由于每条转移指令都需要一条比较指令，所以比较指令也将占20%。

由于CPUB在转移指令中含了比较功能，因此它的时钟周期就比CPUA要慢25%。

问CPUA和CPUB哪个工作速度要快些？41、假设FPSQR操作占整个测试程序执行时间的20%改进的一种方法是采用FPSQF硬件，使FPSQF操作的速度加快到10倍。

另一种方法是使FP指令的速度提高到2倍，FP指令占整个执行时间的50%比较两个设计方案。

42、假设要将某一执行部件改进后速度提高10倍,改进后被改进部件执行时间占系统总运行时间的50%•问改进后，获得的加速比Sp是多少？43、假设Cache的工作速度是主存的5倍，且Cache被访问命中的概率为90%.问：采用Cache 后,能使整个存储系统获得多高的加速比？44、为提高某计算机运算速度，决定增加向量处理部件.此时处理向量的速度比其通常的运算速度要快20倍.现定义向量处理部件运算的时间占总时间的百分比称为可向量化百分比.(1) 求出加速比和可向量化百分比之间的关系(2) 若要得到加速比为2.5,可向量化百分比是多少？45、某计算机Cache能存放2000条指令.假设10%勺指令承担了90%寸间的指令访问，且知这10%旨令中每条指令的执行时间相同.如果要执行的某程序共50000条指令，且已知其中的10%是频繁使用的.问:当计算机执行该程序时，在Cache中能访问到的指令会占多少百分比？46、数据表示指的是能由机器硬件直接识别和引用的数据类型。

47、自定义数据表示包括标志符数据表示和数据描述符两类；48、在指令系统设计、发展和改进上，RISC采用：通过减少指令种数和简化指令功能来降低硬件设计的复杂度，提高指令的执行速度。

49、在指令系统设计、发展和改进上，CISC采用：进一步增强原有指令的功能以及设置更为复杂的新指令取代原先由软件子程序完成的功能，实现软件功能的硬化。

50、经统计，某机器14 条指令的使用频度分别为：0.01,0.15,0.12,0.03,0.02,0.04,0.02,0.04,0.01,0.13,0.15,0.14,0.11,0.03 。

分别求出用等长码、啥夫曼码、只有两种码长的扩展操作码等3种编方式的操作码平均码长？51、流水线的表示法有三种：连接图法、时空图法、预约表法。

52、定向技术法的基本思想：如果后续指令要使用前面指令的运算果值，则通过硬件专门电路将该运算结果提前传送到有关缓冲寄存器，使后续指令得以不停顿地进入流水线。

_________53、衡量流水线性能的主要指标有：吞吐率、加速比和效率。

54、简述软、硬件取舍的三个基本原则？答:第一个基本原则是应考虑在现有硬、器件(主要是逻辑器件和存储器)条件，系统要有高的性能价格比，主要从实现费用、速度和其他性能要求来综合考虑。