北理工计算机体系结构习题解答

合集下载

北理工计算机体系结构习题解答共141页

北理工计算机体系结构习题解答共141页

北理工计算机体系结构习题解答
1、合法而稳定的权力在使用得当时很 少遇到 抵抗。 ——塞 ·约翰 逊 2、权力会使人渐渐失去温厚善良的美 德。— —伯克
3、最大限度地行使权力总是令人反感 ;权力 不易确 定之处 始终存 在着危 险。— —塞·约翰逊 4、权力会奴化一切。——塔西佗
5、虽然权力是一头固执的熊,可是金 子可以 拉着它 的鼻子ห้องสมุดไป่ตู้走。— —莎士 比
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利

计算机系统结构习题解答

计算机系统结构习题解答

1. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段;每一段的时间分别是△t 、2△t 和3△t..在下列各种情况下;分别写出连续执行n 条指令所需要的时间表达式.. ⑴ 顺序执行方式..⑵ 仅“取指令”和“执行”重叠.. ⑶ “取指令”、“分析”和“执行”重叠.. 答:⑴ 顺序执行方式12......12 12T =∑=++n1i i i i )t t t (执行分析取址=n △t +2△t +3△t =6n △t⑵ 仅“取指令”和“执行”重叠12......12 12T =6△t +∑=+1-n 1i i i )t t (执行分析=6△t +n-12△t +3△t =5n +1△t⑶ “取指令”、“分析”和“执行”重叠△2△t3△t△2△t3△t1 2 34......1 234 1234T =6△t +∑=1-n 1i i )t (执行=6△t +n-13△t =3n +3△t2. 一条线性流水线有4个功能段组成;每个功能段的延迟时间都相等;都为△t..开始5个任务;每间隔一个△t 向流水线输入一个任务;然后停顿2个△t;如此重复..求流水线的实际吞吐率、加速比和效率.. 答:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15...1 2 3 4 56 7 8 9 1011 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 151 2 3 4 56 7 8 9 1011 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23我们可以看出;在7n+1Δt 的时间内;可以输出5n 个结果;如果指令的序列足够长n →∞;并且指令间不存在相关;那么;吞吐率可以认为满足:加速比为:从上面的时空图很容易看出;效率为:3. 用一条5个功能段的浮点加法器流水线计算∑==101i i A F ..每个功能段的延迟时间均相等;流水线的输出端与输入端之间有直接数据通路;而且设置有足够的缓冲寄存器..要求用尽可能短的时间完成计算;画出流水线时空图;计算流水线的实际吞吐率、加速比和效率..答:首先需要考虑的是“10个数的和最少需要做几次加法”;我们可以发现;加法的次数是不能减少的:9次;于是我们要尽可能快的完成任务;就只有考虑如何让流水线尽可能充满;这需要消除前后指令之间的相关..由于加法满足交换律和结合律;我们可以调整运算次序如以下的指令序列;我们把中间结果寄存器称为R;源操作数寄存器称为A;最后结果寄存器称为F;并假设源操作数已经在寄存器中;则指令如下:I1:R1←A1+A2I2:R2←A3+A4I3:R3←A5+A6I4:R4←A7+A8I5:R5←A9+A10I6:R6←R1+R2I7:R7←R3+R4I8:R8←R5+R6I9:F←R7+R8这并不是唯一可能的计算方法..假设功能段的延迟为Δt..时空图如下图中的数字是指令号:1234567891234567891234567891234567891 2 3 4 5 6 7891 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21整个计算过程需要21Δt;所以吞吐率为: 加速比为: 效率为:4. 一条线性静态多功能流水线由6个功能段组成;加法操作使用其中的1、2、3、6功能段;乘法操作使用其中的1、4、5、6功能段;每个功能段的延迟时间均相等..流水线的输出端与输入端之间有直接数据通路;而且设置有足够的缓冲寄存器..用这条流水线计算向量点积i 60i i b a B A ⨯=⨯∑=;画出流水线时空图;计算流水线的实际吞吐率、加速比和效率.. 答:我们安排运算次序如下:把中间结果寄存器称为R;源操作数寄存器称为A 、B;最后结果寄存器称为F;并假设源操作数已经在寄存器中;则指令如下:I1: R0←A0B0 I8: R7←R0+R1 I2: R1←A1B1 I9:R8←R2+R3I3: R2←A2B2 I10: R9←R4+R5 I4: R3←A3B3 I11: R10←R6+R7 I5: R4←A4B4 I12: R11←R8+R9 I6: R5←A5B5I13: F ←R10+R11I7: R6←A6B6假设功能段的延迟为Δt..时空图如下图中的数字是指令号:1 2 3 4 5 6 7 8 9 101112131 2 3 4 5 6 71 2 3 4 5 6 78 9 10 11 12138 9 1011 12131 2 3 4 5 6 78 9 10 11 12131 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 整个计算过程需要24Δt;所以吞吐率为: 加速比为: 效率为:5. 一条有三个功能段的流水线如下图..每个功能段的延迟时间均相等;都为△t..其中功能段S 2的输出要返回到它自己的输入端循环一次..⑴ 如果每间隔一个△t 向流水线的输入端连续输入新任务;问这条流水线会发生什么情况⑵ 求这条流水线能够正常工作的最大吞吐率、加速比和效率.. ⑶ 有什么办法能够提高这条流水线的吞吐率;画出新的流水线.. 答:△t △t △t⑴如果每间隔一个△t向流水线的输入端连续输入新任务;流水线S2功能段存在资源冲突..见下表:⑵每间隔两个△t向流水线的输入端连续输入新任务如见下表所示可获得最佳性能..我们可以看出:在2n+2Δt的时间内;可以输出n个结果;如果指令的序列足够长n→∞;并且指令间不存在相关;那么;吞吐率为:加速比为:效率为:⑶如要提高这条流水线的吞吐率;可采用:将功能段S2重复设置一次;见下图:6. 一条有4个功能段的非线性流水线;每个功能段的延迟时间都相等;都为20ns;它的预约表如下:⑴ 写出流水线的禁止向量和初始冲突向量.. ⑵ 画出调度流水线的状态图..⑶ 求流水线的最小启动循环和最小平均启动距离.. ⑷ 求平均启动距离最小的恒定循环.. ⑸ 求流水线的最大吞吐率..⑹ 按照最小启动循环连续输入10个任务;求流水线的实际吞吐率.. ⑺ 画出该流水线各功能段之间的连接图.. 答: ⑴禁止向量F=6;4;2;冲突向量C=101010..输入△t⑵⑶∴流水线的最小启动循环为:1;7或3;5或5;3;最小平均启动距离为4..⑷由上表可知:平均启动距离最小的恒定循环为5..⑸采用最小平均启动距离为4的最小启动循环可获得流水线的最大吞吐率;以1;7为例:其他类似;最大吞吐率皆相同当任务数为偶数2n 时: 当任务数为奇数2n+1时: ∴ 流水线的最大吞吐率为:)s /(M 5.12ns2041t 41任务=⨯=∆ ⑹10个任务的实际吞吐率:利用上式可得偶数个任务TP 10=1/4△t=12.5M 任务/s.. ⑺该流水线的连接图为:7.一条由4个功能段组成的非线性流水线的预约表如下;每个功能段的延迟时间都为10ns..47⑴ 写出流水线的禁止向量和初始冲突向量.. ⑵ 画出调度流水线的状态图..⑶ 求流水线的最小启动循环和最小平均启动距离..⑷ 在流水线中插入一个非计算延迟功能段后;求该流水线的最佳启动循环及其最小平均启动距离..⑸ 画出插入一个非计算延迟功能段后的流水线预约表5行8列.. ⑹ 画出插入一个非计算延迟功能段后的流水线状态变换图.. ⑺ 分别计算在插入一个非计算延迟功能段前、后的最大吞吐率.. ⑻ 如果连续输入10个任务;分别计算在插入一个非计算延迟功能段前、后的实际吞吐率.. 答: ⑴禁止向量F=5;2;1;冲突向量C=10011..⑵⑶i=466最小启动循环为3;最小平均启动距离为3..⑷插入一个非计算延迟功能段后;最小平均启动距离为2因为预约表中每行至多2个×;相应地可改进最小启动循环为2..⑸⑹流水线的禁止向量为1;3;7;流水线的冲突向量为1000101;流水线的状态图如下:6C0-C065C0-C2-C255;4C0-C2 4.55;6C0-C2 5.5流水线的最小启动循环为2;最小平均启动距离为2..⑺插入前:插入后:⑻连续输入10个任务;插入前的实际吞吐率为:连续输入10个任务;插入后的实际吞吐率为:8. 在流水线处理机中;有独立的加法操作部件和乘法操作部件各一个;加法操作部件为4段流水线;乘法操作部件6段流水线;都在第一段从通用寄存器读操作数;在最后一段把运算结果写到通用寄存器中..每段的时间长度都相等;都是一个时钟周期..每个时钟周期发出一条指令..问可能发生哪几种数据相关写出发生相关的指令序列;分析相关发生的原因;并给出解决相关的具体办法..答:可能的数据相关性有:⑴“先写后读”RAW相关Read After 加法写..原因:还没有写好就已经读取寄存器中的数据了..DADD R1;R2;R3 ;R2+R3→R1DSUB R4;R1;R5 ;R1-R5→R4Read After 乘法写..原因:还没有写好已经读取寄存器中的数据了..DMUL R1;R2;R3 ;R2×R3→R1DSUB R4;R1;R5 ;R1-R5→R4本相关在流水线顺序执行和乱序执行时都可能发生..解决的方法是:利用编译程序调整指令的次序方法;延迟执行是避免数据相关最简单的方法;建立寄存器之间的专用路径..⑵“写—写”WAW相关Write After 乘法写..原因:后写的反而早执行乘法所化的时间长;后面一个写任务反而先完成;使最后写入的内容不正确..DMUL R1;R2;R3 ;R2×R3→R1DSUB R1;R4;R5 ;R4-R5→R1本相关只有在流水线乱序执行时才可能发生..解决的方法是:寄存器换名..⑶“先读后写”WAR相关Write After 任何读..原因:前面的读操作因为某种原因被推迟;要读的内容被后面的写操作修改了..DSUB R4;R1;R5 ;R1-R5→R4DADD R1;R2;R3 ;R2+R3→R1本相关只有在流水线乱序执行时才可能发生..解决的方法是:寄存器换名..9. 在下列不同结构的处理机上运行8×8的矩阵乘法C=A×B;计算所需要的最短时间..只计算乘法指令和加法指令的执行时间;不计算取操作数、数据传送和程序控制等指令的执行时间..加法部件和乘法部件的延迟时间都是3个时钟周期;另外;加法指令和乘法指令还要经过一个“取指令”和“指令译码”的时钟周期;每个时钟周期为20ns;C 的初始值为“0”..各操作部件的输出端有直接数据通路连接到有关操作部件的输入端;在操作部件的输出端设置有足够容量的缓冲寄存器..⑴处理机内只有一个通用操作部件;采用顺序方式执行指令..⑵单流水线标量处理机;有一条两个功能的静态流水线;流水线每个功能段的延迟时间均为一个时钟周期;加法操作和乘法操作各经过3个功能段..⑶多操作部件处理机;处理机内有独立的乘法部件和加法部件;两个操作部件可以并行工作..只有一个指令流水线;操作部件不采用流水线结构..⑷单流水线标量处理机;处理机内有两条独立的操作流水线;流水线每个功能段的延迟时间均为一个时钟周期..⑸超标量处理机;每个时钟周期同时发射一条乘法指令和一条加法指令;处理机内有两条独立的操作流水线;流水线的每个功能段的延迟时间均为一个时钟周期..⑹超流水线处理机;把一个时钟周期分为两个流水级;加法部件和乘法部件的延迟时间都为6个流水级;每个时钟周期能够分时发射两条指令;即每个流水级能够发射一条指令..⑺超标量超流水线处理机;把一个时钟周期分为两个流水级;加法部件和乘法部件延迟时间都为6个流水级;每个流水级能够同时发射一条乘法指令和一条加法指令..答:要完成上面的矩阵乘法;需要完成的乘法数目为8×8×8=512次;需要完成的加法数目为8×8×7=448次;下面分析处理机的结构会给性能带来什么样的影响..⑴通用操作部件采用顺序方式执行顺序执行时;每个乘法和加法指令都需要5个时钟周期取指令、指令分析、指令执行;所以所需要的时间为:⑵单流水线标量处理机;有一条两个功能的静态流水线因为有足够的缓冲寄存器;所以我们可以首先把所有的乘法计算完;并通过调度使加法流水线不出现停顿;所以所需要的时间为:123456785135145155165175189639649659661=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑶多操作部件处理机;只有一条指令流水线由于只有一条指令流水线;所以只能一个时钟周期发射一条指令;由于操作部件不采用流水线;对于结果C矩阵的第一个元素;首先执行2次乘法;然后乘法和加法并行执行7次;此时C矩阵的第一个元素出来了;然后加法运算停顿3个时钟周期;再开始与乘法并行执行运算7次;如此下去;直到C的64个元素都出来..故执行时间为:⑷单流水线标量处理机;处理机内有两条独立的操作流水线由于只有一条指令流水线;所以只能一个时钟周期发射一条指令;对于乘法运算不存在数据相关;对于加法运算有数据相关;由于存在足够的缓冲寄存器;我们可以通过合适的调度消除加法的数据相关..因此;最佳情况下的执行时间为:12345678910111213141516171819202122 1=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑸超标量处理机同一时钟周期可以有一条乘法指令和一条加法指令同时发射;对于乘法运算不存在数据相关性;对于加法运算有数据相关性;由于存在足够的缓冲寄存器;当运算完所有的乘法运算后;还要做一次加法运算..因此执行时间为:12345678910111213141516171819202122 1=①+②、2=1+③、3=2+④、4=3+⑤、5=4+⑥、6=5+⑦、7=6+⑧⑹超流水线处理机每个时钟周期发射两条指令;加法部件和乘法部件都为6个流水级..事实上相当于将时钟周期变成了10ns;而加法和乘法流水线变成了6级..因此执行时间为:⑺超标量超流水线处理机一个时钟周期分为两个流水级;加法部件和乘法部件都为6个流水级;每个流水级能同时发射一条加法和一条乘法指令..综合⑸和⑹的分析;我们可以知道;执行时间为:。

北京理工大学数据结构试题与答案

北京理工大学数据结构试题与答案

return false; // 查找失败
else {
if (item==BST->data){
item=BST->data;// 查找成功
return ___________;} else if(item<BST->data)
return Find(______________,item);
else return Find(_______________,item);
(B) 3, 2, 5, 8,6
(C) 3,2, 5, 6, 8
(D) 2 ,3, 6, 5, 8
二、填空题 (24 分)
1. 为了能有效地应用 HASH 查找技术,必须解决的两个问题是 __________________________ 。
____________________ 和
2. 下面程序段的功能实现数据 x 进栈,要求在下划线处填上正确的语句。
}
3. 中序遍历二叉排序树所得到的序列是 ___________序列(填有序或无序) 。
4. 快速排序的最坏时间复杂度为 ___________,平均时间复杂度为 __________ 。 5. 设某棵二叉树中度数为 0 的结点数为 N 0,度数为 1 的结点数为 N 1,则该二叉树中度数
为 2 的结点数为 _________;若采用二叉链表作为该二叉树的存储结构,则该二叉树中
9. 假定一个线性表为 (12,23,74,55,63,40,) 若按 Key % 4 条件进行划分,使得同一余数的元
素 成 为 一 个 子 表 , 则 得 到 的 四 个 子 表 分 别 为 ____________________________ 、 ___________________ 、_______________________ 和 __________________________ 。

计算机体系结构课后答案

计算机体系结构课后答案

计算机体系结构课后答案【篇一:计算机体系结构习题(含答案)】1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。

对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。

(1)最大尾数(8)最小正数(2)最小正尾数(9)最大负数(3)最小尾数(10)最小负数(4)最大负尾数(11)浮点零(5)最大阶码(12)表数精度(6)最小阶码(13)表数效率(7)最大正数(14)能表示的规格化浮点数个数2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。

尾数用原码、纯小数表示,阶码用移码、整数表示。

(1) 设计这种浮点数的格式(2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。

3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。

b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。

如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。

(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。

6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字段的长度均为6位。

北理工计算机体系结构习题解答

北理工计算机体系结构习题解答

第1章 基础知识
• 并行性
–指可以同时进行运算或操作的特 性,它有两重含义:
• 同时性:同一时刻发生 • 并发性:同一时间间隔内发生
8
圈中人保险资料库收集整理制作,未经授权请勿转载
第1章 基础知识
• 系列机
– 同一厂家生产的具有相同系统结构、但有不同 组成和实现的一系列不同型号的机器
13
圈中人保险资料库收集整理制作,未经授权请勿转载
第1章 基础知识
(2)不可以。中断的分级和中断的响应次序 等中断机构都属于计算机系统结构的内容。 中断分级由原来的4级增加到5级应当还是 允许的,关键是重新调整了中断响应的优 先次序,这就使原有程序的中断响应次序 发生了改变,会影响原有程序工作的正确 性。
10
圈中人保险资料库收集整理制作,未经授权请勿转载
第1章 基础知识
• 1-1
第4级 N3/M3 *K秒
第3级 N2/M2 *K秒 (同理)
第2级
N/M*K秒 (X/M * N*1/X*K=N/M*K秒)
第1级

K秒(设为X条,每条需要 1/X*K秒)
11
圈中人保险资料库收集整理制作,未经授权请勿转载
1-9 如果某一计算任务用向量方式求解比 用标量方式求解要快20倍,称可用向量 方式求解部分所花费时间占总的百分比 为可向量化百分比。请写出加速比与可 向量化比例两者的关系曲线。
解:
S
1
20
(1 F) F / 20 20 19 F
18
圈中人保险资料库收集整理制作,未经授权请勿转载
出发,计算机系统结构指层次结构中传
统机器级的系统结构,研究的是软、硬件之间 的功能分配,以及对传统机器级界面的定义

北理工计算机体系结构习题解答

北理工计算机体系结构习题解答

*1
32000 *
2
15000
*
2
8000
*
2)
*
(
40
1 *106
)
3.875*103秒
21
1-11 假设在一台40MHz处理机上运营200,000条指令旳目旳代码,程序主要
由四种指令构成。根据程序跟踪试验成果,已知指令混合比和每种指令所 需旳指令数如下:
指令类型
CPI
指令混合比
算术和逻辑
1
6
第1章 基础知识
仿真
用一种机器(A)旳微程序直接解 释 实 现 另 一 种 机 器 ( B) 旳 指 令 系 统,从而实现软件移植旳措施
被仿真旳机器称为目旳机,进行 仿真旳机器称为宿主机,解释微 程序机器称为仿真微程序
7
第1章 基础知识
并行性
指能够同步进行运算或操作旳特 征,它有两重含义:
40
第2章
(1)最优Huffman H=- ∑Pi×log2Pi
=0.25×2+0.20×2.322+0.15×2.737+ ……
=2.96
41
I10
I9
I8
I7
I6
I5
I4
I3
I2
0.02
0.03
0.04
0.05
0.08
0.08
0.10
0.15
0.20
1
1 0
0
0.05
0.09
1
0
1
0
0.17
原来存在旳事物或属性,从某个角 度看却好象不存在
软件兼容
程序能够不加修改地运营在各档机 器上,区别仅在于运营时间不同

计算机系统结构 第四章(习题解答)

计算机系统结构 第四章(习题解答)

1. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段,每一段的时间分别是△t 、2△t 和3△t 。

在下列各种情况下,分别写出连续执行n 条指令所需要的时间表达式。

⑴ 顺序执行方式。

⑵ 仅“取指令”和“执行”重叠。

⑶ “取指令”、“分析”和“执行”重叠。

答:⑴ 顺序执行方式12 ......1 2 12T =∑=++n1i i i i )t t t (执行分析取址=n(△t +2△t +3△t)=6n △t⑵ 仅“取指令”和“执行”重叠12 ......1 212T =6△t +∑=+1-n 1i i i )t t (执行分析=6△t +(n-1)(2△t +3△t)=(5n +1)△t⑶ “取指令”、“分析”和“执行”重叠12 34 ......1 2 3 41234△t2△t3△t△t2△t3△t△t2△t3△tT =6△t +∑=1-n 1i i )t (执行=6△t +(n-1)(3△t)=(3n +3)△t2. 一条线性流水线有4个功能段组成,每个功能段的延迟时间都相等,都为△t 。

开始5个任务,每间隔一个△t 向流水线输入一个任务,然后停顿2个△t ,如此重复。

求流水线的实际吞吐率、加速比和效率。

答:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15...1 2 3 4 5 6 7 8 9 10 11 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 2 3 4 56 7 8 9 10 11 12 13 14 151 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23我们可以看出,在(7n+1)Δt 的时间内,可以输出5n 个结果,如果指令的序列足够长(n →∞),并且指令间不存在相关,那么,吞吐率可以认为满足:)n (t75t )n /17(5t )1n 7(n 5TP ∞→∆=∆+=∆+=加速比为:)n (720n /17201n 7n 20t )1n 7(t 4n 5S ∞→=+=+=∆+∆⨯=从上面的时空图很容易看出,效率为:)n (75n /1751n 7n 5t )1n 7(4t 4n 5E ∞→=+=+=∆+⨯∆⨯=3. 用一条5个功能段的浮点加法器流水线计算∑==101i i A F 。

计算机系统结构-第三章(习题解答)

计算机系统结构-第三章(习题解答)

计算机系统结构-第三章(习题解答)1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。

⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。

试以r 和命中率h 来表示访问效率e 。

⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?⑸ 对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到0.96。

现在采用一种缓冲技术来解决这个问题。

当访问M 1不命中时,把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。

请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。

答:⑴ 整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++⨯=+⨯+⨯=不难看出:当s1/s2非常小的时候,上式的值约等于c2。

即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。

⑵ 存储系统的等效存取时间t a 为:2t )h 1(1t h t a ⨯-+⨯=⑶r)h 1(h 1t )h 1(t h t t t e 211a 1⨯-+=⨯-+⨯==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。

假设对存储器的访问次数为5,缓冲块的大小为m 。

那么,不命中率减小到原来的1/5m ,列出等式有:m596.0119995.0--= 解这个方程得:m=16,即要达到⑷中的访问效率,缓冲的深度应该至少是16(个数据单位)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

111000 111001 111010 111011 111100 111101 111110
0.04 0.03 0.03 0.02 0.02 0.01 0.01
35
第2章
指令系统
平均码长为 ∑Pi*Li = (0.15+0.15+0.14+0.13 + 0.12+0.11+0.04)×3 + (0.04+0.03+0.03+0.02 + 0.02+0.01+0.01)×6 =3.48
引入时间概念,让多个处理过程轮流使
用同一套硬件设备的各部分,基本上不 需要重复设置硬件设备
10
第1章
1-1
基础知识
第4级 N3/M3 *K秒 第3级 N2/M2 *K秒 (同理) N/M*K秒 (X/M * 第2级 N*1/X*K=N/M*K秒) K秒(设为X条,每条需要 第1级 1/X*K秒)
15
第1章
基础知识
(5)不可以。指令的操作码、字段 格式、寻址方式等都是计算机系统 结构的内容。如果将它们改变,就 会直接影响以前编写的程序不能正 确运行。 (6)可以。数据通路宽度是计算机 组成的内容。
16
第1章
基础知识
(7)可以。单总线改为多总线是计算机 组成的内容。 (8)不可以。通用寄存器的使用是属于 计算机系统结构的内容。0号通用寄存 器改为堆栈指示器,将使原先程序中0 号寄存器中的内容改变直接影响到堆 栈指针的位置发生变化,造成程序无 法正常工作。
11
第1章
1-6 透明的是: 指令缓冲器 时标发生器 乘法器 主存地址寄存器 先行进位链 移位器

基础知识
12
第1章
1-8
基础知识
(1)可以。因为它虽然是属于计算 机系统结构的内容。新增加的数据 类型和指令,不会影响到已有指令 所写的程序正确运行,只是现在用 新增加的指令来写程序,会使计算 机的性能和效率变得更好。
基础知识
本来存在的事物或属性,从某个角
度看却好象不存在
软件兼容
程序可以不加修改地运行在各档机
器上,区别仅在于运行时间不同 它分为向上兼容和向下兼容,以及 向前兼容和向后兼容
5
第1章
模拟
基础知识
用一种机器 (A) 的机器语言解释
实现另一种机器 (B) 的指令系统, 使 A 具有 B 的指令系统,从而实 现软件移植的方法。被模拟的机 器称为虚拟机,模拟用的机器称 为宿主机,解释程序称为模拟程 序
36
3-5位操作码编码如下:
编码 指令 使用 频度 编码 指令使用频度
000 001 010 011 100 101
0.15 0.15 0.14 0.13 0.12 0.11
11000 11001 11010 11011 11100 11101 11110 11111
0.04 0.04 0.03 0.03 0.02 0.02 0.01 0.01
0
0.05
0.09 1 1 0.13 1 0.23 0 0
0.17
1 0 0.32 1 1 0.43 1 0 0 0.57 0
0
1.00
42
(2) 采用最小概率合并法 H’=∑Pi×Li =0.25×2+0.20×2+0.15×3+0.10×3+ 0.08×4+0.08×4+0.05×5+0.04×5+ 0.03×5+0.02×5 =2.99 信息冗余=1-2.96/2.99=1%
39
(1)计算这10条的操作码最短平均长度。 (2)采用Huffman编码法编写这10条指令的 操作码,并计算操作码的平均长度和信息冗 余量。 (3)采用2/8扩展编码法编写这10条指令的 操作码,并计算操作码的平均长度和信息冗 余量。 (4)采用3/7扩展编码法编写这10条指令的 操作码,并计算操作码的平均长度和信息冗 余量。
17
1-9 如果某一计算任务用向量方式求解比
用标量方式求解要快 20 倍,称可用向量
方式求解部分所花费时间占总的百分比
为可向量化百分比。请写出加速比与可
向量化比例两者的关系曲线。
解:
1 20 S (1 F ) F / 20 20 19 F
18
在习题1-9中,为达到加速比2,可向
31
第2章
0.43
指令系统
1.00 0.57
0.19
0.08 0.04
0.11 3
0.24
0.12 0.05
0.02 5 0.03 5
0.27
0.13 3 0.07 0.04 5 0.14 3
0.3
0.15 3 0.15 3
0.12 3
0.04 4 0.02 5 0.01 6
0.02
0.01 6
0.03 5
3
第1章
基础知识
计算机系统结构
程序员所看到的计算机的属性,即
程序员为编写出能在机器上正确运 行的程序所必须了解到的机器的概 念性结构和功能特性。从层次结构 出发,计算机系统结构指层次结构 中传统机器级的系统结构,研究的 是软、硬件之间的功能分配,以及 对传统机器级界面的定义
4
第1章
透明性
29
第2章

指令系统


数据结构是通过软件映像成机器所具 有的各种数据表示实现的 数据表示是数据结构的组成元素 数据表示为数据结构提供不同程度的 支持,反映在效率和方便程度的不同 因此,数据结构与数据表示是软、硬 交界面
30
第2章
指令系统
习题2-4 1、等长二进制编码 平均码长为 [log214] + 1 = 4 2、Huffman编码 首先构造Huffman树
13
第1章
基础知识
(2)不可以。中断的分级和中断的 响应次序等中断机构都属于计算机 系统结构的内容。中断分级由原来 的4级增加到5级应当还是允许的, 关键是重新调整了中断响应的优先 次序,这就使原有程序的中断响应 次序发生了改变,会影响原有程序 工作的正确性。
14
第1章
基础知识
(3)可以。Cache存储器属于计算机组 成,它不会改变原有的系统程序和应 用程序,不会影响到它们的正确性。 只是有了它之后,系统的性能会显著 的提高。 (4)可以。浮点数尾数的下溢处理不属 于计算机系统结构,而是计算机组成 设计所需要考虑的内容。
动态再定位
动态再定位采用基址寻址方法。当把程
序装入主存时,对程序不做任何修改 (变换),直接装入主存,同时将程序 在主存中的起始地址a存入对应该道程序 的基址寄存器。在执行指令时,通过地 址加法器将逻辑地址加上基址寄存器的 内容(程序基点地址),形成物理地址, 然后访存
25
第2章

指令系统
功能型指令
6
第1章
仿真
基础知识
用一种机器 (A) 的微程序直接解
释实现另一种机器 (B) 的指令系 统,从而实现软件移植的方法 被仿真的机器称为目标机,进行 仿真的机器称为宿主机,解释微 程序机器称为仿真微程序
7
第1章
并行性
基础知识
指可以同时进行运算或操作的特
性,它有两重含义:
同时性:同一时刻发生 并发性:同一时间间隔内发生
37
第2章
指令系统
平均码长为 ∑Pi*Li = (0.15+0.15+0.14+0.13 + 0.12+0.11)×3 + (0.04+0.04 +0.03+0.03+0.02 + 0.02+0.01+0.01)×5 =3.40
38
2-5 一个处理机共有10条指令,各指令在程序中出 现的概率如下: 指令 概率 Huffman 2/8扩展 3/7扩展 I1 0.25 I2 0.20 I3 0.15 I4 0.10 I5 0.08 I6 0.08 I7 0.05 I8 0.04 I9 0.03 I10 0.02
20
[解答] CPI=
n
i) ( CPI * i IC i 1 =(45000*1+32000*2+15000*2+8000*2)/
I
(45000+32000+15000+8000) = 1.55周期/指令
6 6 6
速率MIPS f /(CPI *10 ) 40 *10 /(1.55*10 ) 25.81
32
第2章
指令系统
平均码长为 ∑Pi*Li = (0.01+0.01)×6 + (0.02+0.02+0.03+0.03+0.04)×5 + 0.04×4 + (0.11 + 0.12 + 0.13 + 0.14 + 0.15+0.15)×3 =3.38
33
第2章
指令系统
3 、只有两种码长的扩展操作码编
40
第2章
(1)最优Huffman H=- ∑Pi×log2Pi
=0.25×2+0.20×2.322+0.15×2.737+ …… =2.96
41
I10 0.02 1
I9 0.03
I8.08
I4 0.10
I3 0.15
I2 0.20
I1 0.25
27
第2章
RISC
指令系统
减少指令总数,简化指令功能,以
降低硬件设计的复杂度,提高指令 的执行速度。按这种途径和方向发 展,会使机器的指令系统精炼简单, 因此称采用这种途径设计而成的 CPU的计算机为精简指令集计算机 RISC
相关文档
最新文档