计算机组成和原理-课堂例题(附答案)
计算机组成原理习题及答案

简答题1.什么是存储程序原理?按此原理,电脑应具有哪几大功能?1.答:存储程序原理是用户事先编号的程序先存入主存中,然后CPU在从主存中取出指令、运行指令。
按此原理,电脑应具有输入输出设备,即能把程序和数据通过输入输出设备送入主存中;还应具有存储设备,即内存能存储程序和数据;最后应具有控制器和运算器,即CPU能从主存中取出程序和数据,并按顺序一条一条取出、执行。
2.存储器与CPU连接时,应考虑哪些问题?2.答:应考虑〔1〕合理选择存储芯片,要考虑芯片的类型和数量尽量使连线简单方便;〔2〕地址线的连接,将CPU地址线的低位与存储芯片的地址线相连,以选择芯片中的某一单元,儿高位则在扩充存储芯片时用,用来选择存储芯片;〔3〕数据线的连接,CPU的数据线与存储芯片的数据线不一定相等,相等时可直接连接,不相等时要对存储芯片进行扩位,使其相等连接;〔4〕读/写控制线的连接,高电平为读,低电平为写;〔5〕片选线的连接,CPU的高位地址来产生片选信号。
3.什么叫地址重叠区,什么情况下会产生地址重叠区?3.答:存储系统中的某些存储单元有多个地址,这种现象叫地址重叠区。
原因是,存储系统是由多个芯片组成的,在产生片选信号时,如果只用部分高位地址来产生片选信号,则有一部分高位地址线没用,这样这部分地址线的值就不确定,可以为0也可以为1,所以存储芯片的地址空间也不确定了,出现了重复值,产生了地址重叠区。
4.什么叫“对准字”和“未对准字”,CPU对二者的访问有何不同?4.答:CPU访问的数据类型有字节,半字,字和双字。
假设字长为32位,则字节8位,半字16位,字32位,双字64位。
对准字就是存储这四种数据类型时,字节的起始地址任意,半字的起始地址为2的倍数,字的起始地址为4的倍数,双字的起始地址为8的倍数。
未对准字就是四种数据类型在存储时都任意,无论从哪个存储单元开始都可以。
CPU访问对准字只要一个存储周期就行了,因为对准字都在同一行,能同时选中;访问未对准字需要多个存取周期,引文他们对应的存储单元可能不在同一行。
计算机组成原理课后习题-参考答案

习题参考答案
5-2:计算机为什么要设置时序部件? 周期、节拍、脉冲三级时序关系如何 表示?
一条指令运行的各种操作控制信号在时间上有严格 的定时关系, 的定时关系,时序部件用以控制时序以保证指令 的正确执行。 的正确执行。 将指令周期划分为几个不同的阶段, 将指令周期划分为几个不同的阶段,每个阶段称为 一个机器周期。 一个机器周期。 一个机器周期又分为若干个相等的时间段, 一个机器周期又分为若干个相等的时间段,每个时 时间段称为一个时钟周期(节拍)。 时间段称为一个时钟周期(节拍)。 在一个时钟周期(节拍)内可设置几个工作脉冲, 在一个时钟周期(节拍)内可设置几个工作脉冲, 用于寄存器的清除、接收数据等工作。 用于寄存器的清除、接收数据等工作。
9
习题什么特点?
依据控制器中的时序控制部件和微操作控制信号形 成部件的具体组成与运行原理不同,通常把控制 成部件的具体组成与运行原理不同, 器区分为微程序控制器和硬布线控制器两大类。 器区分为微程序控制器和硬布线控制器两大类。 微程序控制方式是用一个ROM做为控制信号产生 微程序控制方式是用一个 做为控制信号产生 的载体, 中存储着一系列的微程序, 的载体,ROM中存储着一系列的微程序,组成微 中存储着一系列的微程序 程序的微指令代码产生相应的操作控制信号, 程序的微指令代码产生相应的操作控制信号,这 是一种存储逻辑型的控制器。方便修改和扩充, 是一种存储逻辑型的控制器。方便修改和扩充, 但指令执行速度较慢。 但指令执行速度较慢。 硬布线控制方式采用组合逻辑电路实现各种控制功 在制造完成后, 能,在制造完成后,其逻辑电路之间的连接关系 就固定下来,不易改动。其运行速度快, 就固定下来,不易改动。其运行速度快,但构成 复杂。 复杂。
13
习题参考答案
计算机组成原理习题含参考答案

计算机组成原理习题含参考答案一、单选题(共90题,每题1分,共90分)1、在下列寻址中,()寻址方式需要先运算再访问主存。
A、间接B、直接C、变址D、立即正确答案:C2、在链式查询方式下,若有N个设备,则()oA、只需一条总线请求线B、需要N条总线请求线C、视情况而定,可能一条,也可能N条总线请求线D、以上说法都不对正确答案:A3、以下有关I/O端口的叙述中,错误的是()oA、I/O接口中有命令端口、状态端口、数据端口B、I/O接口中命令端口和状态端口不能共用同一个C、I/O接口中程序可访问的寄存器被称为I/O端口D、I/O端口可以和主存统一编号,也可以单独编号正确答案:B4、用移码表示浮点数的阶码,其好处是()。
A、便于求阶差B、便于用比较电路比较阶的大小C、提高运算精度D、便于判别溢出正确答案:B5、在取指操作结束后,程序计数器中存放的是()。
A、程序中指令的数量B、当前指令的地址C、已经执行指令的计数值D、下一条指令的地址正确答案:D6、微指令格式分为水平型和垂直型,水平型微指令的位数(),用它编写的微程序()。
A、较短,较少B、较长,较短C、较多,较长D、较少,较短正确答案:B7、用二地址指令来完成算术运算时,其结果一般存放在()。
A、其中一个地址码提供的地址中B、栈顶C、累加器(ACC)中D、以上都不对正确答案:A8、为了缩短指令中某个地址段(或地址码)的位数,有效的方法是采取()。
A、变址寻址B、间接寻址C、立即寻址D、寄存器寻址正确答案:D9、从计算机系统结构上讲,机器语言程序员所看到的机器属性是()oA、编程要用到的硬件组织B、计算机硬件的全部组织C、计算机软件所要完成的功能D、计算机各部件的硬件实现正确答案:A10、用于笔记本电脑的大容量存储器是()oA、U盘B、软磁盘C、固态盘D、磁带正确答案:C11、D/A转换是()。
A、把数字量转换为模拟量,把转化结果输出计算机B、把计算机输出的模拟量转化为数字量C、把模拟量转化为数字量,把数字量输入到计算机D、把计算机输出的模拟量转为数字量正确答案:A12、程序P在机器M上的执行时间是20秒,编译优化后,P执行的指令数减少到原来的70%,而CP1增加到原来的1.2倍,则P在M上的执行时间是()oA、16.8秒B、8.4秒C、117秒D、14秒正确答案:A13、以下说法错误的是()oA、计算机的机器字长是指数据存储与运算的基本单位B、寄存器由触发器构成C、计算机中一个字的长度都是32位D、磁盘可以永久性存放数据和程序正确答案:C14、主设备通常指()oA、掌握总线权的设备B、发送信息的设备C、主要的设备D、接收信息的设备正确答案:A15、字长12位,用定点补码规格化小数表示时,所能表示的正数范围是()OA、1/2-(1-2-11)B、(1/2+2-11)-(1-2-11)C、2-11-(1-2-11)D、2-12-(1-2-12)正确答案:A16、ASCI1码是对()进行编码的一种方案。
计算机组成原理(附答案)

计算机组成原理课后习题及答案(完整版)

精选2021版课件
7
• 3. 什么是摩尔定律?该定律是否永远生效 ?为什么?
• 答:P23,否,P36
精选2021版课件
8
系统总线
第三章
精选2021版课件
9
1. 什么是总线?总线传输有何特点? 为了减轻总线的负载,总线上的部件都应 具备什么特点?
解:总线是多个部件共享的传输部件; 总线传输的特点是:某一时刻只能有 一路信息在总线上传输,即分时使用; 为了减轻总线负载,总线上的部件应 通过三态驱动缓冲电路与总线连通。
解: 总线标准——可理解为系统与模块、 模块与模块之间的互连的标准界面。 总线标准的设置主要解决不同厂家各 类模块化产品的兼容问题; 目前流行的总线标准有:ISA、EISA、 PCI等; 即插即用——指任何扩展卡插入系统 便可工作。EISA、PCI等具有此功能。
精选2021版课件
16
11. 画一个具有双向传输功能的总线逻
12
总线的主设备(主模块)——指一次总
线传输期间,拥有总线控制权的设备(模块); 总线的从设备(从模块)——指一次总
线传输期间,配合主设备完成传输的设备(模 块),它只能被动接受主设备发来的命令;
总线的传输周期——总线完成一次完整 而可靠的传输所需时间;
总线的通信控制——指总线传送过程中 双方的时间配合方式。
精选2021版课件
10
4. 为什么要设置总线判优控制?常见的集 中式总线控制有几种?各有何特点?哪种方式响 应时间最快?哪种方式对电路故障最敏感?
解:总线判优控制解决多个部件同时申请总 线时的使用权分配问题;
常见的集中式总线控制有三种: 链式查询、计数器查询、独立请求;
特点:链式查询方式连线简单,易于扩充,
计算机组成原理 课堂练习-第四章

一、单项选择题1.下列叙述中( )是正确的。
A.主存可由RAM和ROM组成B主存只能由ROM组成C.主存只能由RAM组成D以上答案都不正确2.和辅存相比,主存的特点是( )。
A.容量小:速度快、成本高B.容量小、速度快、成本低C、容量大、速度快、成本高D容量大、速度快、成本低3.一个16 K×32位的存储器,其地址线和数据线的总和是( )。
A.48 B.46 C.38 D.444.一台计算机有64 MB的主存,字长为4字节,那么在存储器中对单个字寻址需要( )位地址。
A.23 B 24 C 25 D.265.某存储器容量为32 K×16位,则( )A、地址线l6根,数据线32根B、地址线32根,数据线16根C、地址线15根,数据线16根D、地址线16根,数据线16根6.某存储器容量为32K×16位,则( )A.其地址线是16根 B 其地址线数与16无关C.其地址线数与16有关 D 无法确定其地址线与16的关系8.DRAM地扯分两次输入(行选通RAS、列选通CAS)的目的是( )。
A.提高速度B.减少芯片引出线C.刷新D电平需要9.在磁盘存储器中,以下正确的描述是( )。
A.各磁道的位密度相等B.内圈磁道的位密度较大C.外圈磁道的位密度较大D.内外圈磁道的位密度相等位密度是磁道单位长度上的记录的二进制代码的位数,由于每个磁道记录的信息量是相等的,而内圈的长度较短,所以内圈磁道的位密度较大。
10.活动头磁盘存储器的寻道时间通常是指( )。
A.最大寻道时间B.最小寻道时间C.最大寻道时间和最小寻道时间的平均值D.最大寻道时间和最小寻道时间之和11.多体交叉存储器主要解决的问题是( )。
A 扩充主存储器的容量B 提高主存储器数据传输率C.减少主存储器芯片数量 D 简化线路结构12.一个四体并行低位交叉存储器,每个模块的容量是64 K×32位,存取周期为200 ns,在下列说法中( )是正确的。
(完整版)计算机组成原理第3章习题参考答案

第3章习题参考答案1、设有一个具有20位地址和32位字长的存储器,问(1) 该存储器能存储多少字节的信息?(2) 如果存储器由512K ×8位SRAM 芯片组成,需要多少片?(3) 需要多少位地址作芯片选择?解:(1) 该存储器能存储:字节4M 832220=⨯(2) 需要片8823228512322192020=⨯⨯=⨯⨯K (3) 用512K ⨯8位的芯片构成字长为32位的存储器,则需要每4片为一组进行字长的位数扩展,然后再由2组进行存储器容量的扩展。
所以只需一位最高位地址进行芯片选择。
2、已知某64位机主存采用半导体存储器,其地址码为26位,若使用4M ×8位的DRAM 芯片组成该机所允许的最大主存空间,并选用内存条结构形式,问;(1) 若每个内存条为16M ×64位,共需几个内存条?(2) 每个内存条内共有多少DRAM 芯片?(3) 主存共需多少DRAM 芯片? CPU 如何选择各内存条?解:(1) 共需内存条条4641664226=⨯⨯M (2) 每个内存条内共有个芯片32846416=⨯⨯M M (3) 主存共需多少个RAM 芯片, 共有4个内存条,1288464648464226=⨯⨯=⨯⨯M M M 故CPU 选择内存条用最高两位地址A 24和A 25通过2:4译码器实现;其余的24根地址线用于内存条内部单元的选择。
3、用16K ×8位的DRAM 芯片构成64K ×32位存储器,要求:(1) 画出该存储器的组成逻辑框图。
(2) 设存储器读/写周期为0.5μS ,CPU 在1μS 内至少要访问一次。
试问采用哪种刷新方式比较合理?两次刷新的最大时间间隔是多少?对全部存储单元刷新一遍所需的实际刷新时间是多少?解:(1) 用16K ×8位的DRAM 芯片构成64K ×32位存储器,需要用个芯片,其中每4片为一组构成16K ×32位——进行字长位16448163264=⨯=⨯⨯K K数扩展(一组内的4个芯片只有数据信号线不互连——分别接D0~D 7、D 8~D 15、D 16~D 23和D 24~D 31,其余同名引脚互连),需要低14位地址(A 0~A 13)作为模块内各个芯片的内部单元地址——分成行、列地址两次由A 0~A 6引脚输入;然后再由4组进行存储器容量扩展,用高两位地址A 14、A 15通过2:4译码器实现4组中选择一组。
计算机组成原理试题库(含答案)--

计算机组成原理试题一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号写在题干前面的括号内。
)1.为了缩短指令中某个地址段的位数,有效的方法是采取(C)。
A、立即寻址B、变址寻址C、间接寻址D、寄存器寻址2.某计算机字长是16位它的存储容量是64,按字编址,它们寻址范围是(C )。
A.64K B.32C.32K D.163.某一芯片其容量为512*8位,除电源和接地端外该芯片引线的最少数目是(C )。
A.21B.17C.19D.204.指令系统中采用不同寻址方式的目的主要是( C)。
A.实现存储程序和程序控制B.可以直接访问外存C.缩短指令长度,扩大寻址空间,提高编程灵活性D.提供扩展操作码的可能并降低指令译码难度5.寄存器间接寻址方式中,操作数处在( B )。
A.通用寄存器B.贮存单元C.程序计数器D.堆栈6是(A)的简称。
A.精简指令系统计算机B.大规模集成电路C.复杂指令计算机D.超大规模集成电路7.响应中断的时间是_ C 。
A.中断源提出请求;B.取指周期结束;C.执行周期结束;D.间址周期结束。
8.常用的虚拟存储器寻址系统由两级存储器组成。
A.主存-辅存;B.-主存;C.-辅存;D.主存—硬盘。
9.访问主存时,让处于等待状态,等的一批数据访问结束后,再恢复工作,这种情况称作。
A.停止访问主存;B.周期挪用;C.与交替访问;D.。
10.浮点数的表示范围和精度取决于。
A.阶码的位数和尾数的机器数形式;B.阶码的机器数形式和尾数的位数;C.阶码的位数和尾数的位数;D.阶码的机器数形式和尾数的机器数形式。
11.中断向量可提供。
A.被选中设备的地址;B.传送数据的起始地址;C.中断服务程序入口地址;D.主程序的断点地址。
12.加法器采用先行进位的目的是。
A.优化加法器的结构;B.节省器材;C.加速传递进位信号;D.增强加法器结构。
13.在独立请求方式下,若有N个设备,则。
A.有一个总线请求信号和一个总线响应信号;B.有N个总线请求信号和N个总线响应信号;C.有一个总线请求信号和N个总线响应信号;D.有N个总线请求信号和一个总线响应信号。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1a)题1:简单说明冯.诺依曼计算机体系的特点.—计算机由运算器、控制器、存储器、输入设备和输出设备五部分组成。
—采用存储程序的方式。
—数据以2进制表示。
题2:什么是摩尔定律?—摩尔定律一般表述为“集成电路的集成度每18个月翻一番”。
题3:给出IEEE、ACM的中英文名称—IEEE (Institute of Electrical and Electronics Engineers,电气电子工程师协会)— ACM(Association for Computing Machinery,美国计算机学会)(1b) 题1:将计算机系统中某一功能的处理速度提高到原来的20倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此提高性能的方法后,能使整个系统的性能提高多少?解由题可知,可改进比例= 40% = 0.4,部件加速比= 20根据Amdahl定律可知:采用此提高性能的方法后,能使整个系统的性能提高到原来的1.613倍。
题2:某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,试计算该程序中浮点操作所占的比例。
解:由题可知,部件加速比= 20,系统加速比= 5根据Amdahl定律可知由此可得:可改进比例= 84.2%即程序中浮点操作所占的比例为84.2%。
(2a) 题1:(1)某总线在一个总线周期中并行传送4个字节的数据,假设一个总线周期等于一个总线时钟周期,总线时钟频率为33MHz,则:总线带宽是多少?;(2)如果一个总线周期中并行传送64位数据,总线时钟频率升为66MHz,则总线带宽是多少?解:(1) 设总线带宽用Dr表示,总线时钟周期用T=1/f表示,一个总线周期传送的数据量用D表示。
根据定义可得Dr = D/T = D×1/T = D×f =4B×33×1000000/s=132MB/s(2) 64位=8B,Dr= D×f =8B×66×1000000/s=528MB/s简答题2:高速串行传输为什么替代了并行传输–并行传输在高频时代出现了两个问题:●1:同步●2:信号之间的电磁干扰●(另外还有制造成本问题)(4a) 题1:根据给出的图,能指出记录方式(04a)题2:7200转/分的硬盘,平均等待时间是多少?●解答:7200 RPM=120Rev/sec1 revolution=1/120 sec=8.33milliseconds1 /2 rotation = 4.16 ms题3:简单描述CAV和CLV●磁盘片转动的角速度是恒定的,用恒定角速度(constant angular velocity,CAV)表示。
●光盘的光学读出头相对于盘片运动的线速度是恒定的,用恒定线速度(constantlinear velocity,CLV)表示。
(5a) 题1:例6.1 假设一台计算机的I/O处理时间占响应时间的10%,当I/O性能保持不变,而对CPU的性能分别提高10倍和100倍时,该计算机系统的总体性能会发生什么样的变化?解假设改进前程序的执行时间为1个单位时间。
如果CPU的性能提高10倍,程序的执行时间(包含I/O处理时间)减少为:(1-10%) / 10 + 10% = 0.19即整机性能只能提高到原来的约5倍,约50%的CPU性能被浪费在I/O处理上。
如果CPU的性能提高100倍,程序的执行时间减少为:(1 - 10%) / 100 + 10% = 0.109这表示整机性能只能提高约10倍,约90%的性能被浪费在没有改进的I/O处理上。
(5a1) 题2:给出中断实现的整个过程1.中断请求:向中断源发出请求2.中断判优:若同时有多个中断源申请中断,则对其排队判优。
3.中断响应:在允许中断的情况下,CPU执行完一条指令后开始响应中断,进入中断响应周期,包括关中断、保存现场,进入相应的中断服务程序。
4.中断服务:执行中断服务程序5.中断返回:恢复现场,返回主程序断点。
题3:简单叙述DMA 接口功能(1) 向CPU申请DMA传送(2) 处理总线控制权的转交(3) 管理系统总线、控制数据传送(4) 确定数据传送的首地址和长度;修正传送过程中的数据地址和长度(5) DMA 传送结束时,给出操作完成信号(5a) 综合题2:假定硬盘传输数据以32位的字为单位,传输速度为1MB/S,CPU的时钟频率为50MHZ.(1) 采用程序查询的输入输出方式,一个查询操作需要100个时钟周期,求CPU为I/O查询所花费的时间比率,假定进行足够的查询以避免数据丢失。
(2) 采用中断方法进行控制,每次传输的开销(包括中断处理)为100个时钟周期,求CPU为传输硬盘数据花费的时间比重。
(3) 采用DMA控制器进行输入输出操作,假定DMA的启动操作需要1000个时钟周期,DMA完成时处理中断需要500个时钟周期,如果平均传输的数据长度为4KB,问在硬盘工作时处理器将用多少时间比率进行输入输出操作,忽略DMA申请使用总线的影响。
(6a)题1:以IEEE32位浮点格式表示如下的数:(a)-5(b)-6(c)-1.5(d)384(e)1/16(f)-1/32题2:下面IEEE32位浮点数,相等的十进制数是什么?(a)1 10000011 110 0000 0000 0000 0000 0000(b)0 01111110 101 0000 0000 0000 0000 0000(c)0 10000000 000 0000 0000 0000 0000 0000(7a) 题1:设X= - 0.1101,Y = +0.1011,按照Booth算法求[X·Y]补(需掌握标准的和紧凑两种方法)解:[X]补=11.0011[-X]补=00.1101[Y]补=0.1011(8b) 题1:一个计算机系统采用32位单字长指令,地址码为12位。
如果定义了250种二地址指令,那么还可以有多少条单地址指令?(参考答案:(28-250)*212=6*212)题2:某计算机的指令系统字长为16位,采用扩展操作码,操作数地址需要4位。
该指令系统已有14(M)条三地址指令、14(N)条二地址指令、没有零地址指令,问系统最多还有多少条一地址指令?参考答案:((24-M)*24-N)*24= 288题3:题4:解:简答题5:相对CISC来说,RISC主要特点有哪些–指令条数少–指令长度固定,指令格式和寻址种类少–只有取指和存数指令访问存储器,其余的指令操作均在寄存器之间进行.(10a)题1:解释CPU的具体功能–指令控制:控制程序的顺序执行–操作控制:产生完成每条指令所需的控制命令–时间控制:对各种操作加以时间上的控制–数据加工:对数据进行算术运算和逻辑运算–中断处理:处理运行过程中出现的异常情况和特殊请求题2:中断系统需解决的问题(1) 各中断源如何向CPU 提出请求?(2) 各中断源同时提出请求怎么办?(3) CPU 什么条件、什么时间、以什么方式响应中断?(4) 如何保护现场?(5) 如何寻找入口地址?(6) 如何恢复现场,如何返回?(7) 处理中断的过程中又出现新的中断怎么办?(11a)题1:判断以下三组指令中各存在哪种类型的数据相关?(1) I1 LAD R1,A ; M(A)->R1,M(A)是存储器单元I2 ADD R2,Rl ; (R2)+(R1)->R2(2) I1 ADD R3,R4 ; (R3)+(R4)->R3I2 MUL R4,R5 ; (R4)*(R5)->R4(3) I1 LAD R6,B ; M(B)-> R6,M(B)是存储器单元I2 MUL R6,R7 ; (R6)*(R7)->R6参考答案:(1)写后读RAW (2)读后写WAR (3)写后写WAW题2 判断以下三组指令各存在哪种类型的数据相关(1) I1 ADD R1,R2,R3; (R2+R3)→R1I2 SUB R4,R1,R5; (R1-R5)→R4(2) I3 MUL R3,R1,R2; (R1)×(R2)→R3I4 ADD R3,R4,R5; (R4+R5)→R3(3) I5 STA M(X),R3; (R3)→M(X),M(X)是存储器单元I6 ADD R3,R4,R5; (R4+R5)→R参考答案:(1) RAW (2) WAW (3) WAR题3:流水线冲突有哪几种(给出简单描述)?流水线冲突有以下3种类型:(1)结构冲突:因硬件资源满足不了指令重叠执行的要求而发生的冲突。
(2)数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。
(3)控制冲突:流水线遇到分支指令和其他会改变PC值的指令所引起的冲突。
题4:什么叫名相关?名相关有哪两种?如果两条指令使用相同的名,但是它们之间并没有数据流动,则称这两条指令存在名相关。
指令j与指令i之间的名相关有以下两种:(1)反相关。
如果指令j写的名与指令i读的名相同,则称指令i和j发生了反相关。
反相关指令之间的执行顺序是必须严格遵守的,以保证i读的值是正确的。
(2)输出相关。
如果指令j和指令i写相同的名,则称指令i和j发生了输出相关。
输出相关指令的执行顺序是不能颠倒的,以保证最后的结果是指令j写进去的。
题5:解决流水线数据冲突的方法有哪些?(1)定向技术:在某条指令产生一个结果之前,其他指令并不真正需要该计算结果,如果将该计结果从其产生的地方直接送到其他指令需要它的地方,就可以避免暂停。
(2)暂停技术:设置一个“流水线互锁”的功能部件,一旦流水线互锁检测到数据相关,流水线暂停执行发生数据相关指令后续的所有指令,直到该数据相关解决为止。
(3)采用编译器调度。
(4)重新组织代码顺序。
(11b)题1:有哪几种向量处理方式?它们对向量处理机的结构要求有何不同?(1) 水平处理方式:不适合对向量进行流水处理。
(2) 垂直处理方式:适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成MM型的运算流水线。
(3) 分组处理方式:适合流水处理。
可设长度为n的向量寄存器,使每组向量运算的源/目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成RR型运算流水线。
题2:衡量向量处理机性能的主要参数有哪些?(1)向量指令的处理时间。
(2)峰值性能:向量长度为无穷大时,向量处理机的最高性能。
(3)半性能向量长度:向量处理机的性能为其峰值性能一半时所需的向量长度。
(4)向量长度临界值:对同一段程序代码而言,向量方式的处理速度优于标量串行方式处理速度时所需的最小向量长度。