计算机系统结构 ( 第3次 )
计算机系统结构(第3版)教学课件第1章 计算机系统结构的概念

解释:每当一条N+1级指令被译码后,就直接去执行 一串等效的N级指令,然后再去取下一条N+1级的指令,
依此重复进行。
解释执行比编译后再执行所花的时间多,但占用的 存储空间较少。
▲
9/79
1.2 计算机系统结构的概念
1.2.2 计算机系统结构的定义
1. 计算机系统结构的经典定义 程序员所看到的计算机属性,即概念性结构与功能 特性。
部件加速比
=
[
(1
-可改进比例)
可改进比例 + 部件加速比
]
×总执行时间改进前
▲
24/79
1.3 定量分析技术
系统加速比为改进前与改进后总执行时间之比
加速比 = 总执行时间改进前 总执行时间改进后
=
1
可改进比例
(1-可改进比例)+ 部件加速比
▲
25/79
1.3 定量分析技术
例1.1 将计算机系统中某一功能的处理速度提高到原来的 20倍,但该功能的处理时间仅占整个系统运行时间的40%,则采 用此提高性能的方法后,能使整个系统的性能提高多少? 解 由题可知,可改进比例 = 40% = 0.4,
部件加速比 = 20 根据Amdahl定律可知:
1
总加速比
=
0.6
+
0.4 20
= 1.613
采用此提高性能的方法后,能使整个系统的性能提高到原 来的1.613倍。
▲
26/79
1.3 定量分析技术
例1.2 某计算机系统采用浮点运算部件后,使浮点运算速 度提高到原来的20倍,而系统运行某一程序的整体性能提高到 原来的5倍,试计算该程序中浮点操作所占的比例。 解 由题可知,部件加速比 = 20,系统加速比 = 5
第三章 计算机系统分层结构

PF
CF
奇偶(偶/奇)
进位(是/否)
PE
CY
PO
NC
3.总线
所谓总线是一组能为多个部件分时共享的公共信息传送线路, 它分时接收各部件送来的信息,并发送信息到有关部件。
由于多个部件连接在一组公共总线上,可能会出现多个部件争 用总线,因此需设置总线控制逻辑以解决总线控制权的有关问题。
总线分类:
CPU内部总线用来连接CPU内的各寄存器与ALU ; 系统总线用来连接CPU、主存储器与I/O接口,它通常包括 三组:数据总线、地址总线和控制总线。 按总线传送的方向可将总线分为单向总线和双向总线。
CPU是计算机的核心组成部分
3.1.1
CPU的组成
• 由算术逻辑部件ALU 、控制器、各种寄存器(寄 存器群)和CPU内部总线(连接部件) • 另:Cache
•
1.ALU部件
ALU的功能是实现数据的算术与逻辑运算 两个输入端口,参加运算的两个操作数,通常 来自CPU中的通用寄存器或ALU总线。 控制信号:ADD,SUB,OR,AND等 输出:运算结果
时序控制方式就是指微操作与时序信号之间采取何种关系,
它不仅直接决定时序信号的产生,也影响到控制器及其他部件的组 成,以及指令的执行速度。
1.同步控制方式
同步控制方式是指各项操作由统一的时序信号进行同步控制。 同步控制的基本特征是将操作时间分为若干长度相同的时钟 周期(也称为节拍),要求在一个或几个时钟周期内完成各个微 操作。在CPU内部通常是采用同步控制方式 。 同步控制方式的优点是时序关系简单,结构上易于集中,相应 的设计和实现比较方便。
计算机系统结构
系统的层次结构
★★
5层
翻译(编译器)
(完整版)计算机系统结构课后习题答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。
这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。
虚拟机:用软件实现的机器。
翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。
解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。
执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。
计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。
Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。
程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。
包括时间局部性和空间局部性。
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。
其基本点是指令驱动。
程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。
计算机系统结构课后答案unit3

第3章总线、中断与输入输出系统3.1.简要举出集中式串行链接,定时查询和独立请求3种总线控制方式的优缺点。
同时分析硬件产生故障时通讯的可靠性。
答:集中式串行链连接方式。
其过程为:①所有部件都经公共的“总线请求”线向总线控制器发使用总线申请。
②当“总线忙”信号未建立时,“总线请求”才被总线控制器响应,送出“总线可用”信号,它串行地通过每个部件。
③如果某部件未发过“总线请求”,则它将“总线可用”信号往下一部件转,如果某部件发过“总线请求”,则停止“总线可用”信号的传送。
④该部件建立“总线忙”,并除去“总线请求”,此时该部件获得总线使用权,准备传送数据。
⑤数据传送期间,“总线忙”维持“总线可用”的建立。
⑥传送完成后,该部件去除“总线忙”信号和“总线可用”信号。
⑦当“总线请求”再次建立时,就开始新的总线分配过程。
优点:①选择算法简单;②控制总线数少;③可扩充性好;④可靠性高。
缺点:①对“总线可用”线及其有关电路失效敏感,②不灵活;③总线中信号传送速度慢。
集中式定时查询方式,过程:①总线上每个部件通过“总线请求”发请求。
②若“总线忙”信号未建立,则计数器开始计数,定时查询个部件,以确定是谁发的请求。
③当查询线上的计数值与发出请求的部件号一致时,该部件建立“总线忙”,计数停止,查询也停止。
除去“总线请求”,该部件获得总线使用权。
④“总线忙”维持到数据传送完毕。
⑤数据传送完,去除“总线忙”。
⑥当“总线请求”线上有新的请求,就开始下一个总线分配过程。
优点:①优先次序灵活性强;②可靠性高。
缺点:①控制线数较多;②扩展性较差;③控制较为复杂;④总线分配受限于计数信号,不能很高。
集中式独立请求方式,过程:①每个部件有一对“总线请求”和“总线准许”线。
②每个部件使用“总线请求”发中请,当“总线已分配”无信号时,总线控制器根据某种算法对同时送来的多个请求进行仲裁,以确定哪个部件使用总线,信号从“总线准许”送回该部件,去除该部件的“总线请求”,建立总线已分配”。
计算机系统结构(第三版)张晨曦 课后答案

fi Si
−1
式中,fi 为可加速部件 i 在未优化系统中所占的比例;Si 是部件 i 的加速比。
⎧ f ⎫ f f S = ⎨[1 − ( f1 + f 2 + f 3 )] + 1 + 2 + 3 ⎬ S S S 1 2 3⎭ ⎩
0.3 0.3 f 3 ⎫ ⎧ 10 = ⎨[1 − (0.3 + 0.3 + f 3 )] + + + ⎬ 30 20 30 ⎭ ⎩
课
45000 × 1 + 75000 × 2 + 8000 × 4 + 1500 × 2 = 1.776 129500
答
案 网
计算机体系结构 • 第一章 • 第4页
⎡ f ⎤ Te = To ⎢(1 − f e ) + e ⎥ S e⎦ ⎣
S=
1 (1 − f e ) +
fe Se
S=
i
1 (1 − ∑ f i ) + ∑
对于第三级而言,为了完成 IC 条指令的功能,第三级指令的条数为: 执行第三级
IC 。为了 M2
IC IC 条指令,需要执行 N 条第二级的指令对其进行解释。那么对第二级 2 M M2 IC IC + 2N 2 M M
而言,总的指令条数为:
N⎤ ⎡ = ⎢1 + ⎥ K ⎣ M⎦ N⎤ ⎡ T4 = ⎢1 + ⎥ K ⎣ M⎦
1.5 计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件加速比 1=30; 部件加速比 2=20; 部件加速比 3=10; (1) 如果部件 1 和部件 2 的可改进比例为 30%,那么当部件 3 的可改进比例为多少时, 系统的加速比才可以达到 10? (2) 如果三个部件的可改进比例为 30%、30%和 20%,三个部件同时改进,那么系统 中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:在多个部件可改进情况下 Amdahl 定理的扩展:
第3章--计算机体系结构

1.则中断级屏蔽位如何设置? 2.假设在用户程序执行过程中同时出现1,2,3, 4四个中断请求,请画出程序运行过程示意图?
第3章作业2
假设系统有4个中断级,则中断响应次序是 1 2 3 4,如果中断处理次序是4 2 3 1
1.则中断级屏蔽位如何设置? 2.假设在用户程序执行过程中同时出现1,2,3, 4四个中断请求,请画出程序运行过程示意图?
0
习题3-5
(1)当中断响应次序为1 2 3 4时,其中断处 理次序是?
(2)如果所有的中断处理都各需3个单位时间,中断 响应和中断返回时间相对中断处理时间少得多。 当机器正在运行用户程序时,同时发生第2、3级 中断请求,过两个单位时间后,又同时发生第1、 4级中断请求,请画出程序运行过程示意图?
中断级屏蔽位的设置
中断 处理 程序 级别 第1级 第2级 第3级 第4级 第5级 中断级屏蔽位
1级 1
0 0 0 0
2级 1
1 0 1 1
3级 1
1 1 1 1
4级 1
0 0 1 0
5级 1
0 0 1 1
具体执行 过程如图:
第3章作业1
假设系统有4个中断级,则中断响应次序是 1 2 3 4,如果中断处理次序是1 4 2 3
中断的响应次序和处理次序
中断的响应次序
中断的响应次序是同时发生多个不同中断类的中断 请求时,中断响应硬件中排队器所决定的响应次序 中断响应的次序是用硬件---排队器---来实现的。
排队器重的次序是由高到低固定死的。
中断处理次序:
中断的处理要由中断处理程序来完成,而中断处理 程序在执行前或执行中是可以被中断的,这样,中 断处理完的次序(简称中断处理次序)就可以不同 于中断响应次序。
吉林大学计算机系统结构题库第三章
第三章流水线技术知识点汇总先行控制、流水线、单功能流水线、多功能流水线、静态流水线、动态流水线、部件级流水线、处理机级流水线、处理机间流水线、线性流水线、非线性流水线、顺序流水线、乱序流水线、时空图、流水线性能评价(吞吐率、加速比、效率)、解决流水线瓶颈问题方法、相关(数据相关、名相关、控制相关)、换名技术、流水线冲突(结构冲突、数据冲突、控制冲突)、流水线互锁机制、定向技术、指令调度、预测分支失败、预测分支成功、延迟分支(从前调度、从失败处调度、从成功处调度)、流水寄存器、3种向量处理方式(横向、纵向、纵横)、链接技术。
简答题1.流水技术有哪些特点?(答出4个即可)(知识点:流水线)答:1.将处理过程分解为若干子过程,由专门的功能部件来实现,2各段的时间尽可能相等,3各部件间都有一个缓冲寄存器,4适用于大量重复的时序过程,5需要通过时间和排空时间。
2.什么是静态流水线?什么是动态流水线?(知识点:静态流水线、动态流水线)答:同一时间段内,多功能流水线中的各段只能按同一种功能的连接方式工作;同一时间段内,多功能流水线中的各段可以按照不同的方式连接同时执行多种功能。
3.什么是单功能流水线?什么是多功能流水线?(知识点:单功能流水线、多功能流水线)答:只能完成一种固定功能的流水线。
流水线的各段可以进行不同的连接,以实现不同的功能。
4.什么是线性流水线?什么是非线性流水线?(知识点:线性流水线、非线性流水线)答:流水线的各段串行连接,没有反馈回路。
流水线中除了有串行的连接外,还有反馈回路。
5.列举3种相关。
(知识点:相关)答:数据相关,名相关,控制相关。
6.流水线中有哪三种冲突?各是什么原因造成的?(知识点:流水线冲突)答:结构冲突,硬件资源满足不了指令重叠执行的要求;数据冲突,指令在流水线中重叠执行时需要用到前面指令的执行结果;控制冲突,流水线遇到分支指令和其他会改变PC值的指令。
7.选择至少2种解决流水线结构冲突的方法简述。
计算机网络第三的名词解释
计算机网络第三的名词解释计算机网络第三层的名词解释引言:计算机网络是当今信息技术领域的重要组成部分,它架起了全球通信的桥梁。
网络是由一系列不同层次组成的,每一层都有其特定的功能和任务。
本文将重点解释计算机网络中第三层的相关名词和概念。
一、第三层简介在计算机网络中,第三层通常又被称为网络层。
它位于OSI(开放式系统互联)模型和TCP/IP(传输控制协议/互联网协议)模型中的中间层次。
网络层主要负责控制数据在不同网络之间的传输和路由。
二、IP协议IP(互联网协议)是网络层中最重要的协议之一。
它给予每个连接到网络的设备一个独特的IP地址,类似于一个房子的门牌号码,使其能够在全球范围内与其他设备进行通信。
IP协议为数据包提供了寻址和传输的主要机制,并且负责将数据包从源节点传送到目的节点。
三、IP地址IP地址是网络层中非常重要的一个概念。
它由32位二进制数字组成,通常用点分十进制表示法来表示。
IP地址的作用是唯一标识网络上的每个设备,使得数据能够准确地被发送和接收。
IP地址分为IPv4和IPv6两种格式,目前IPv4是最常用的,但IPv6由于提供了更大的地址空间,正在逐渐普及。
四、路由协议路由协议是网络层中用于确定数据包传输路径的重要工具。
当一个数据包从源节点发送到目的节点时,它需要经过多个中间节点,而每个节点通过路由协议来决定下一跳节点的路径。
常见的路由协议包括RIP(路由信息协议)、OSPF(开放式最短路径优先)和BGP(边界网关协议)等。
不同的路由协议有不同的工作原理和适用场景。
五、路由器路由器是网络层中常用的设备类型。
它是一种能够根据IP地址和路由表决定数据包的路径的网络设备。
路由器通常连接多个网络和子网络,并根据网络层的信息将数据包传送到正确的目的地。
路由器在互联网中扮演着重要的角色,是全球网络通信的关键组成部分。
六、IP数据包IP数据包是网络层中传输的基本单位。
它包含了源IP地址、目的IP地址以及其他与网络层相关的控制信息和数据内容。
计算机系统结构习题答案(李学干)
计算机系统结构习题解答第一章习题一1.2一台经解释实现的计算机,可以按照功能划分成4级。
每一级为了执行一条指令需要下一级的N条指令解释。
若执行第1级的一条指令需K纳秒时间,那么执行第2、3、4级的一条指令个需要多少时间?解:①分析:计算机按功能分级时,最底层的为第1级。
向上一次是第2 、3、4级。
解释执行是在低级机器级上,用它的一串指令或语句来解释执行高一级上的一条指令的功能。
是逐条解释的。
②解答:执行第2、3、4级的一条指令各需KNns,KN2ns,KN3ns的时间。
1.3操作系统机器级的某些指令就用传统机器级的指令,这些指令可以用微程序直接实现,而不由操作系统自己来实现。
根据你对习题1.2的回答,你认为这样做有哪两个好处?答:可以加快操作系统操作命令解释的速度。
同时也节省了存放解释操作命令这部分解释程序所占用的空间。
简化了操作系统机器级的设计。
也有利于减少传统机器级的指令条数。
1.5硬件和软件在什么意义上是等效的?在什么意义上是不等效的?试举例说明。
答:硬件和软件在逻辑意义上是等效的。
在物理意义上是不等效的。
①在原理上,用硬件或固件实现的功能完全可以用软件来完成。
用软件实现的功能也可以用硬件或固件来完成。
功能一样。
②只是反映在速度、价格、实现的难易程度上,这两者是不同的。
性能不同。
③例如,浮点运算在80386以前一直是用软件实现的。
到了80486,将浮点运算器集成到了CPU中,可以直接通过浮点运算指令用硬件实现。
但速度却高的多。
1.9下列哪些对系统程序员是透明的?哪些对应用程序员是透明的?系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲器。
答:①对系统程序员和应用程序员均透明的:是全用硬件实现的计算机组成所包含的方面。
有:数据通路宽度、Cache存储器、指令缓冲器。
②仅对应用程序员透明的:是一些软硬件结合实现的功能。
有:虚拟存储器、程序状态字、“启动I/O”指令。
计算机系统结构第三章(习题解答)
1. 什么是存储系统?对于一个由两个存储器M 1和M 2构成的存储系统,假设M1的命中率为h ,两个存储器的存储容量分别为s 1和s 2,存取时间分别为t 1和t 2,每千字节的成本分别为c 1和c 2。
⑴ 在什么条件下,整个存储系统的每千字节平均成本会接近于c 2? ⑵ 该存储系统的等效存取时间t a 是多少?是多少?⑶ 假设两层存储器的速度比r=t 2/t 1,并令e=t 1/t a 为存储系统的访问效率。
试以r 和命中率h 来表示访问效率e 。
⑷ 如果r=100,为使访问效率e>0.95,要求命中率h 是多少?是多少?⑸ 对于⑷中的命中率实际上很难达到,对于⑷中的命中率实际上很难达到,假设实际的命中率只能达到假设实际的命中率只能达到0.96。
现在采用一种缓冲技术来解决这个问题。
采用一种缓冲技术来解决这个问题。
当访问当访问M 1不命中时,不命中时,把包括被访问数把包括被访问数据在内的一个数据块都从M 2取到M 1中,并假设被取到M 1中的每个数据平均可以被重复访问5次。
请设计缓冲深度(即每次从M 2取到M 1中的数据块的大小)。
答:答:⑴ 整个存储系统的每千字节平均成本为:整个存储系统的每千字节平均成本为:12s 1s 2c 2s 1s 1c 2s 1s 2s 2c 1s 1c c ++´=+´+´=不难看出:当s1/s2非常小的时候,上式的值约等于c2。
即:s2>>s1时,整个存储器系统的每千字节平均成本会接近于c2。
⑵ 存储系统的等效存取时间t a 为:为:2t )h 1(1t hta´-+´=⑶r)h 1(h 1t )h 1(t h t t t e 211a1´-+=´-+´==⑷ 将数值代入上式可以算得:h>99.95% ⑸通过缓冲的方法,我们需要将命中率从0.96提高到0.9995。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3次作业
一、填空题(本大题共20分,共 5 小题,每小题 4 分)
1. 流水机器处理中断处理有两种方式: ______ 和 ______ 。
2. ILLIAC IV中的一个PU为处理部件由 ______ 、 ______ 、 ______ 构成。
3. PM2I网络能实现与j号处理单元直接相连的是号为 ______ 的处理单元。
4. 在虚拟存储系统中,两级存储器的速度相差特别悬殊T
2=106T
1。
如果要使访
问效率e=0.95,命中率为 ______ 。
5. 浮点数0.01|10…0在|处溢出,按截断法,舍入法和恒置1法进行溢出处理,其结果分别为 ______ 、 ______ 、 ______ 。
二、基本应用题(本大题共30分,共 2 小题,每小题 15 分)
1. 主存容量位4MB,虚存容量位1GB,虚拟地址和物理地址各是多少?若页面大小为4KB,页表长度是多少?
2. 某计算机cache采用全相联映像,已知cache容量为16kB,主存容量位
2MB,每个字块有8个字,每个字32位。
问主存和cache地址多少位,如何划分?
三、问答题(本大题共30分,共 5 小题,每小题 6 分)
1. 浮点数设计的要点是什么?
2. 简述多端口存储器的基本结构和工作原理。
3. 减少指令中地址码位数的主要方法是什么?
4. 为什么说软件为基础解决cache一致适合处理机较多的场合?
5. 为什么当处理机有自己的cache时,需要按二维方式构造存储器?
四、简答题(本大题共20分,共 5 小题,每小题 4 分)
1. 简述脉动阵列机的结构特点。
2. 简述并行性开发的途径和相关例子。
3. 简述数据表示发展。
4. 简述操作码优化的目的和基本方法。
5. 比较浮点数尾数溢出后的截断法和舍入法的特点。
答案:
一、填空题(20分,共 5 题,每小题 4 分)
1.
参考答案:
不精确断点法、精确断点法
解题方案:
评分标准:
2.
参考答案:
一个64 位的算术处理单元PE、局部存贮器PEM、存贮器逻辑部件MLU
解题方案:
评分标准:
3.
参考答案:
j±2i
解题方案:
评分标准:
4.
参考答案:
由公式:
\\10.52.27.1\ResourceFile\ProblemPool\152\StudentFiles\ExamBatch_21\2 0022a\cq142cengx\3250可知,0.95=1/H+(1-H)106,得H=0.9999999。
解题方案:
评分标准:
5.
参考答案:
0.01、0.10、0.01
解题方案:
评分标准:
二、基本应用题(30分,共 2 题,每小题 15 分)
1.
参考答案:
每页4KB,则页内地址12位。
主存4MB,则主存共1K页,页号10位。
虚存1GB,则虚存共256K页,虚页号18位,页内地址12位,共30位。
页表长度256K行。
解题方案:
评分标准:
2.
参考答案:
cache每个块8个字,每个字32位(4个字节),则每块32个字节,
Cache16KB可分为2KB块。
Cache共14位地址,其地址划分为:
块号 11位
块内地址3位
块内字节2位
主存2MB共21位地址,可分为64KB块,其地址划分为:
块号16位
块内地址3位
块内字节2位
解题方案:
评分标准:
三、问答题(30分,共 5 题,每小题 6 分)
1.
参考答案:
在表数范围和表数精度给定的情况下,如何确定最短的尾数字长p和阶码字长q。
解题方案:
评分标准:
2.
参考答案:
多端口存储器形式中,每个存储器模块有多个访问端口。
实际上是将交叉开关矩阵中的控制、转换和优先级仲裁逻辑分别移到相应存储器模块的接口中,构成多端口存储器结构。
每个存储器模块的相应端口连接在一起,每个端口负责处理一个处理机P或
I/O通道的访存请求。
每个存储器模块按照对其各个端口指定的优先级来分解访问冲突。
解题方案:
评分标准:
3.
参考答案:
可采用基址、变址、相对寻址、分段、寄存器寻址、寄存器间接寻址等多种寻址方式减少地址码位数。
解题方案:
评分标准:
4.
参考答案:
当处理机数量较多时,监视cache协议就不管用了。
而目录表法中,全映像目录表会因而处理机数量较多,使得目录表太大;而有限目录表法中,限制了一个数据块在各cache中存放副本的数量;链式目录表法中,处理机数量增加后会引起通过指针查找这一过程时间太长。
并且,以硬件为基础的解决方法将增大网络通信量。
软件解决法因为将数据分为写入cache和不写入cache两种,可减少引起多cache一致性问题的机会。
同时也避免了硬件法的相关问题,适合处理机数量较多的场合。
解题方案:
评分标准:
5.
参考答案:
当处理机拥有自己的cache时,主存的低位交叉编址可能使cache中每块信息被分散到不同的存储器模块中,增加了数据传输时间。
当采用二维方式构造存储器后,由于cache按块进行存取。
因而cache的一块可直接存入二维结构中的一列,这样在进行信息块传送时,只需要访问一列中的存储器即可。
由于该列中各个存储器可并行访问,因而可加快信息的访问速度。
解题方案:
评分标准:
四、简答题(20分,共 5 题,每小题 4 分)
1.
其主要特点为:
•结构简单、规整,模块化强;
•数据流和控制流的设计简单规整;
•具有极高的计算并行性;
•脉动阵列结构的构形与特定计算任务和算法密切相关。
解题方案:
评分标准:
2.
参考答案:
主要有三种途径:
1、时间重叠
多个处理过程在时间上相互错开,轮流重迭地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。
如流水线是典型的时间重叠的例子。
2、资源重复
通过重复设置硬件资源来提高可靠性或性能。
早期的资源重复以提高可靠性为主,现在则被大量用于提高系统的速度性能。
多处理机是典型的资源重复例子。
3、资源共享
利用软件方法让多个用户按一定时间顺序轮流使用同一资源,以提高利用率,因而提高整个系统的性能。
资源共享包括硬件、软件、信息资源的共享。
多道程序分时系统是资源共享的例子。
解题方案:
评分标准:
3.
数据表示方法在不断发展、扩大,用软件和硬件相结合的方法实现新的数据表示。
设计变址寄存器和变址加法器实现变址操作,实现对向量、阵列数据结构的支持。
硬件提供按位编址、按位运算能力,设置相应的位串指令,实现对串数据的操作。
提供向量指令实现多条简单指令构成的指令序列功能。
解题方案:
评分标准:
4.
参考答案:
操作码优化的目的是缩短指令字长度,减少程序总位数,增加指令字所能表示的操作信息和地址信息。
其基本方法有:定长编码、Huffman编码和扩展操作码编码。
解题方案:
评分标准:
5.
参考答案:
1、截断法
(1)最大误差,整数时接近1(xt-1),分数时接近2-m。
(xt-1)
(2)对正数总是产生负误差,误差的概率分布均匀。
(3)处理过程简单,不增加硬件和处理时间,但误差较大,很少使用。
2、舍入法
(1)最大误差,整数时为5,分数时接近2(m+1)。
(2)对正数误差有正有负,平均误差接近0且无法调节(xt-5)。
(3)实现简单,增加硬件少,最大误差小。
处理速度慢,可能发生级联进位而产生的尾数上溢而进行右规。
(4)中低速或精度损失尽可能小的场合使用。
解题方案:
评分标准:。