计算机体系结构第四章-1
计算机组成原理第四章存储系统(一)(含答案)

第四章、存储系统(一)4.1 存储系统层次结构随堂测验1、哈弗结构(Harvard Architecture)是指()(单选)A、数据和指令分别存放B、数据和指令统一存放C、指令和数据分时存放D、指令和数据串行存放2、如果一个被访问的存储单元,很快会再次被访问,这种局部性是()(单选)A、时间局部性B、空间局部性C、数据局部性D、程序局部性3、下列关于存储系统层次结构的描述中正确的是()(多选)A、存储系统层次结构由Cache 、主存、辅助存储器三级体系构成B、存储系统层次结构缓解了主存容量不足和速度不快的问题C、构建存储系统层次结构的的原理是局部性原理D、构建存储系统层次结构还有利于降低存储系统的价格4、下列属于加剧CPU和主存之间速度差异的原因的是()(多选)A、由于技术与工作原理不同,CPU增速度明显高于主存增速率B、指令执行过程中CPU需要多次访问主存C、辅存容量不断增加D、辅存速度太慢5、下列关于局部性的描述中正确的是()(多选)A、局部性包括时间局部行和空间局部性B、局部性是保证存储系统层次结构高效的基础C、顺序程序结构具有空间局部性D、循环程序结构具有时间局部性4.2 主存中的数据组织随堂测验1、设存储字长为64位,对short 变量长度为16位,数据存储按整数边界对齐,关于short 变量j 在主存中地址的下列描述中正确的是()(此题为多选题)A、j的物理地址mod 8 = 0B、j的物理地址mod 8 = 1C、j的物理地址mod 8 = 2D、j的物理地址mod 8 = 32、设存储字长为64位,对char 变量长度为8位,数据存储按整数边界对齐,关于char 变量j 在主存中地址的下列描述中正确的是()(此题为多选题)A、j的物理地址mod 8 = 0B、j的物理地址mod 8 = 1C、j的物理地址mod 8 = 2D、j的物理地址mod 8 = 33、下列关于大端与小端模式的描述中,正确的是()(此题为多选题)A、大端模式(Big-endian)是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中B、小端模式(Little-endian)是指数据的低位保存在内存的低地址中,而数据的高位保存在内存的高地址中C、0x12345678 按大端模式存放时,其所在存储单元最低字节单元存放的数据是0x12D、0x12345678 按小端模式存放时,其所在存储单元最高字节单元存放的数据是0x124、下列关于存储字长的描述中正确的是()(此题为多选题)A、主存一个单元能存储的二进制位数的最大值B、存储字长与所存放的数据类型有关C、存储字长等于存储在主存中数据类型包含的二进制位数D、存储字长一般应是字节的整数倍5、某计算机按字节编址,数据按整数边界存放,可通过设置使其采用小端方式或大端方式,有一个float 型变量的地址为FFFF C000H ,数据X = 12345678H,无论采用大端还是小段方式,在内存单元FFFF C001H,一定不会存放的数是()(此题为多选题)A、12HB、34HC、56HD、78H4.3 静态存储器工作原理随堂测验1、某计算机字长16位,其存储器容量为64KB,按字编址时,其寻址范围是()(单选)A、64KB、32KBC、32KD、64KB2、一个16K*32位的SRAM存储芯片,其数据线和地址线之和为()(单选)A、48B、46C、36D、39。
计算机组成原理1-4章带答案

第一章一、选择题1.冯·诺依曼机工作的基本方式的特点是______。
A 多指令流单数据流B 按地址访问并顺序执行指令C 堆栈操作D 存贮器按内容选择地址2.完整的计算机应包括______。
A 运算器、存储器、控制器;B 外部设备和主机;C 主机和实用程序;D 配套的硬件设备和软件系统;3.计算机硬件能直接执行的只有______。
A.符号语言 B 机器语言 C 汇编语言 D 机器语言和汇编语言二、简答题1. 冯·诺依曼计算机的特点是什么?(p8)1、计算机由运算器、存储器、控制器、输入设备和输出设备五大部件组成。
2、指令和数据以同等地位存放于存储器内,并按地址寻访。
3、指令和数据均用二进制表示。
4、指令有操作码和地址码组成,操作码用来表示操作的性质,地址码用来表示操作数在存储器中的位置。
5、指令在存储器内按顺序存放。
通常,指令是顺序执行的,在特定条件下,可根据运算结果或根据设定的条件改变执行顺序。
6、机器以运算器为中心,输入输出设备与存储器间的数据传送通过运算器完成。
三、名词解释CPU、机器字长、存储容量、MIPS、FLOPSCPU(Central Processing Unit 中央处理器):中央处理器(机),是计算机硬件的核心部件,由运算器和控制器组成。
存储容量=存储单元个数*存储字长MIPS:Million Instruction Per Second,每秒执行百万条指令数,为计算机运算速度指标的一种计量单位FLOPS:Floating Point Operation Per Second,每秒浮点运算次数,计算机运算速度计量单位之一。
第三章一、选择题1.系统总线中控制线的功能是______。
A 提供主存、I / O接口设备的控制信号和响应信号B 提供数据信息C 提供时序信号D 提供主存、I / O接口设备的响应信号2.系统总线地址线的功能是______。
A 选择主存单元地址;B 选择进行信息传输的设备;C 选择外存地址;D 指定主存和I / O设备接口电路的地址;3.同步传输之所以比异步传输具有较高的传输频率是因为同步传输______。
计算机组成原理-第4章_指令系统

7. 段寻址方式(Segment Addressing)
方法:E由段寄存器的内容加上段内偏移地址而形成。
应用:微型机采用段寻址方式,20位物理地址为16位 段地址左移四位加上16位偏移量。
分类:① 段内直接寻址; ② 段内间接寻址; ③ 段间直接寻址; ④ 段间间接寻址;
9 堆栈寻址方式
堆栈:是一组能存入和取出数据的暂时存储单元。
*** 指令字长度
概念 指令字长度(一个指令字包含二进制代码的位数) 机器字长:计算机能直接处理的二进制数据的位数。 单字长指令 半字长指令 双字长指令
多字长指令的优缺点
优点提供足够的地址位来解决访问内存任何单元的寻址问题 ; 缺点必须两次或多次访问内存以取出一整条指令,降低了CPU的运 算速度,又占用了更多的存储空间。
*** 指令系统的发展与性能要求
*** 指令系统的发展
指令:即机器指令,要计算机执行某种操作的命令。
指令划分:微指令、机器指令和宏指令。
简单
复杂
指令系统:一台计算机中所有指令的集合;是表征
计算机性能的重要因素。
系列计算机:基本指令系统相同、基本体系结构相同 的一系列计算机。
*** 对指令系统性能的要求
(2)立即数只能作为源操作数,立即寻址主要用来给寄存 器或存储器赋初值。以A~F开头的数字出现在指令中时,前 面要加0。
(3)速度快(操作数直接在指令中,不需要运行总线周期)
(4)立即数作为指令操作码的一部分与操作码一起放在代 码段区域中。
(5)指令的长度(翻译成机器语言后)较长,灵活性较差。
【例】MOV AX, 10H 执行后(AX)=? 其中:这是一条字操作指令,源操作数为立即寻址 方式,立即数为0010H,存放在指令的下两个单元。
计算机网络(第5版)课后习题答案:第4章-网络层

第四章网络层4-01. 网络层向上提供的服务有哪两种?试比较其优缺点。
答:网络层向运输层提供“面向连接”虚电路(Virtual Circuit)服务或“无连接”数据报服务。
前者预约了双方通信所需的一切网络资源。
优点是能提供服务质量的承诺。
即所传送的分组不出错、丢失、重复和失序(不按序列到达终点),也保证分组传送的时限。
缺点是路由器复杂,网络成本高;后者无网络资源障碍,尽力而为,优缺点与前者互易。
4-02. 网络互连有何实际意义?进行网络互连时,有哪些共同的问题需要解决?答:网络互联可扩大用户共享资源范围和更大的通信区域。
进行网络互连时,需要解决共同的问题有:⑴不同的寻址方案;⑵不同的最大分组长度;⑶不同的网络接入机制;⑷不同的超时控制;⑸不同的差错恢复方法;⑹不同的状态报告方法;⑺不同的路由选择技术;⑻不同的用户接入控制;⑼不同的服务(面向连接服务和无连接服务);⑽不同的管理与控制方式。
4-03. 作为中间设备,转发器、网桥、路由器和网关有何区别?答:中间设备又称为中间系统或中继(relay)系统。
⑴物理层中继系统:集线器,转发器(repeater)。
⑵数据链路层中继系统:交换机,网桥或桥接器(bridge)。
⑶网络层中继系统:路由器(router)。
⑷网桥和路由器的混合物:桥路器(brouter)。
⑸网络层以上的中继系统:网关(gateway)。
4-04. 试简单说明下列协议的作用:IP、ARP、RARP和ICMP。
答:IP协议:实现网络互连。
使参与互连的性能各异的网络从用户看起来好像是一个统一的网络。
网际协议TCP、IP是TCP/IP体系中两个最主要的协议之一,与IP协议配套使用的还有四个协议。
ARP协议:是解决同一个局域网上的主机或路由器的IP地址和硬件地址的映射问题。
RARP:是解决同一个局域网上的主机或路由器的硬件地址和IP地址的映射问题。
ICMP:提供差错报告和询问报文,以提高IP数据交付成功的机会。
计算机组成原理第四章存储系统(一)(含答案)

计算机组成原理第四章存储系统(一)(含答案)4.1存储系统层次结构随堂测验1、哈弗结构(Harvard Architecture)是指()(单选)A、数据和指令分别存放B、数据和指令统一存放C、指令和数据分时存放D、指令和数据串行存放2、如果一个被访问的存储单元,很快会再次被访问,这种局部性是()(单选)A、时间局部性B、空间局部性C、数据局部性D、程序局部性3、下列关于存储系统层次结构的描述中正确的是()(多选)A、存储系统层次结构由Cache、主存、辅助存储器三级体系构成B、存储系统层次结构缓解了主存容量不足和速度不快的问题C、构建存储系统层次结构的的原理是局部性原理D、构建存储系统层次结构还有利于降低存储系统的价格4、下列属于加剧CPU和主存之间速度差异的原因的是()(多选)A、由于技术与工作原理不同,CPU增速度明显高于主存增速率B、指令执行过程中CPU需要多次访问主存C、辅存容量不断增长D、辅存速度太慢5、下列关于局部性的描述中正确的是()(多选)A、局部性包括时间局部行和空间局部性B、局部性是保证存储系统层次结构高效的基础C、顺序程序结构具有空间局部性D、循环程序结构具有时间局部性4.2主存中的数据组织随堂测验1、设存储字长为64位,对short变量长度为16位,数据存储按整数边界对齐,关于short变量j在主存中地址的下列描述中正确的是()(此题为多选题)A、j的物理地址mod 8 = 0B、j的物理地址mod 8 = 1C、j的物理地址mod 8 = 2D、j的物理地址mod 8 = 312、设存储字长为64位,对char变量长度为8位,数据存储按整数边界对齐,关于char变量j在主存中地址的下列描绘中精确的是()(此题为多项选择题)A、j的物理地址mod 8 = 0B、j的物理地址mod 8 = 1C、j的物理地址mod 8 = 2D、j的物理地址mod 8 = 33、下列关于大端与小端模式的描述中,正确的是()(此题为多选题)A、大端模式(Big-endian)是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中B、小端形式(Little-endian)是指数据的低位保存在内存的低地址中,而数据的高位保存在内存的高地址中C、0xxxxxxxxx按大端模式存放时,其所在存储单元最低字节单元存放的数据是0x12D、0xxxxxxxxx按小端模式存放时,其所在存储单元最高字节单元存放的数据是0x124、下列关于存储字长的描述中正确的是()(此题为多选题)A、主存一个单元能存储的二进制位数的最大值B、存储字长与所存放的数据类型有关C、存储字长等于存储在主存中数据类型包含的二进制位数D、存储字长普通应是字节的整数倍5、某计算机按字节编址,数据按整数边界存放,可通过设置使其采用小端方式或大端方式,有一个float型变量的地址为FFFF C000H。
计算机组成原理—习题解答(第四章)

第四章题解计算机组成原理习题解答第四章4.2❒4.2在存储系统的层次结构中,设计高速缓冲存储器和虚拟存储器的目的各是什么?对这两个存储层次的管理有何异同点?❒题解:1、设计cache的目的是为了提高存储器的访问速度。
Cache层使得CPU在对存储器进行访问时,速度可以接近Cache的速度,容量可以达到主存的容量。
设计虚存的目的是为了提高存储器的容量。
虚拟存储技术使得用户在使用存储器时,感觉可用容量接近于辅存的容量,而访问速度上接近于主存。
综合上述两个存储层次的作用,从整个存储系统来看,就达到了速度快、容量大、位价低的优化效果。
2、两个存储层次管理的异同点:两个层次的功能均由系统自动实现,对用户来讲都是透明的。
第四章4.2两个存储层次均以信息块作为基本信息的传送单位,Cache存储器每次传送的信息块是定长的,只有几十字节,而虚拟存储器信息块划分方案很多,有页、段等等,长度均在几百~几百K 字节左右。
主存Cache 存储体系中CPU与Cache和主存都建立了直接访问的通道。
一旦不命中时,CPU 就直接访问主存并同时向Cache调度信息块。
而辅助存储器与CPU之间没有直接通路,一旦在主存不命中时,只能从辅存调块到主存。
Cache 存储器存取信息的过程、地址变换和替换策略全部用硬件实现,对程序员均是透明的。
而主存-辅存层次的虚拟存储器基本上是由操作系统的存储管理软件并辅助一些硬件来进行信息块的划分和主存-辅存之间的调度,所以对设计存储管理软件的系统程序员来说,它是不透明的,而对应用程序员,因为虚拟存储路提供了庞大的逻辑空间可以任意使用,是透明的。
第四章4.4❒4.4 图4-3中,如果检索寄存器的值为“**** 1011 **** ****”,屏蔽寄存器的值是什么?检索完成后,匹配寄存器中的值又是什么?❒题解:❒屏蔽寄存器的值是:0000 1111 0000 0000;完成检索后匹配寄存器的值为:01000…第四章4.74.7 将数据Cache和指令Cache分开有什么好处?答:将数据Cache和指令Cache分开有如下好处:1)可支持超前控制和流水线控制,有利于这类控制方式下指令预取操作的完成;2)指令Cache可用ROM实现,以提高指令存取的可靠性;3)数据Cache对不同数据类型的支持更为灵活,既可支持整数(例32位),也可支持浮点数据(如64位)。
计算机体系结构综合习题

计算机体系结构习题一、名词解释第一章:计算机组成:指的是计算机系统结构的逻辑实现,包含物理机器中的数据流和控制流的组成以及逻辑设计等。
它着眼于物理机器级内各事物的排序方式与控制方式、各部件的功能以及各部件之间的联系。
计算机实现:指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。
它着眼于器件技术和微组装技术,其中器件技术在实现技术中起主导作用。
程序的局部性原理:指程序执行时所访问的存储器地址不是随机分布的,而是相对簇聚。
常用的经验规则:程序执行时间的90%都是在执行程序中的10%的代码。
数据访问也具有局部性。
第二章:RISC:即精简指令集计算机,它是尽可能地把指令系统简化,不仅指令的条数少,而且指令的功能比较简单。
(P36页)CISC:即复杂指令集计算机,它是增强指令功能,把越来越多的功能交由硬件实现,指令的数量也越来越多。
(P36页)寻址方式:指指令系统中如何形成所要访问的数据的地址。
第三章:流水线技术:(P53页)把一个重复的过程分解为若干个子过程(相当于上面的工序),每个子过程由专门的功能部件来实现,把多个处理过程在时间上错开,依次通过各功能段,这样,每个子过程就可以与其他的子过程并行进行,这就是流水线技术。
线性流水线:(见P57页)线性流水线是指各段串行连接、没有反馈回路的流水线。
数据通过流水线中的各段时,每个段最多只流过一次。
非线性流水线:(见P57页)非线性流水线是指各段除了有串行的连接外,还有反馈回路的流水线。
数据相关:(见P73页)考虑两条指令i和j,i在j的前面,如果下述条件之一成立,则称指令j与指令i数据相关:(1)指令j使用指令i产生的结果;(2)指令j与指令k数据相关,而指令k又与指令i数据相关。
系统级流水线(P55)是把多个处理机串行连接起来,对同一数据流进行处理,,每个处理机完成整个任务中的一部分。
计算机组成原理第四章答案

计算机组成原理第四章答案1. 注册器和存储器是计算机中用于保存数据的两种不同的设备。
注册器是一种用于高速临时存储数据的小型存储设备,它位于CPU内部,用于保存正在执行的指令、数据以及中间结果。
存储器则是一种用于永久保存数据的设备,它通常是外部的、容量较大的设备,如硬盘、固态硬盘或者内存条。
2. 计算机中的存储器分为主存储器和辅助存储器两种类型。
主存储器是计算机中用于临时保存指令和数据的存储设备,它的容量较小但速度较快。
辅助存储器则是一种容量较大但速度较慢的存储设备,用于永久保存数据和程序文件,如硬盘。
3. 冯·诺依曼计算机的基本构成包括中央处理器(CPU)、存储器、输入设备和输出设备。
其中,CPU负责执行计算机指令并控制计算机的运行,存储器用于保存指令和数据,输入设备用于将外部数据输入计算机,输出设备用于将计算结果输出给用户。
4. 计算机的运算速度主要取决于CPU的运算速度,而CPU的运算速度受到时钟频率、指令周期和执行指令的效率等多个因素影响。
时钟频率是CPU每秒钟钟摆的次数,它决定了CPU的基本工作速度;指令周期是指CPU执行一条指令所需的时间,它由时钟频率决定;指令的执行效率则取决于CPU的微操作执行速度。
5. 指令流水线是一种提高CPU执行效率的技术。
它将执行一条指令的过程分为多个阶段,并让多条指令在不同的阶段同时执行,从而实现指令的并行执行。
指令流水线可以提高CPU 的吞吐量,减少指令执行的延迟。
6. 高速缓存是一种用于提高CPU访问存储器效率的技术。
它位于CPU内部,与主存储器之间,用于保存最近访问的指令和数据。
高速缓存的访问速度比主存储器快,可以减少CPU 对主存储器的访问次数,提高CPU的执行效率。
7. 数据的表示方式包括原码、反码和补码。
原码是用最高位表示符号位,其余位表示数值的方式;反码是对原码取反得到的表示方式;补码是对反码加1得到的表示方式。
补码表示方式可以解决原码和反码相加减时的进位问题,同时将负数的表示范围扩展了一倍。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.2 指令的动态调度
➢ 在前面的基本流水线中:指令在译码阶段判断相关关 系。
ID
检测结构冲突 检测数据冲突
• 一旦一条指令受阻,其后的指令都将停顿。
4.2 指令的动态调度
动态调度的基本思想是前面指令的阻塞不影响后面的 指令的继续前进。具体做法是流水线的译码阶段再分为 两个阶段:
流出(Issue, IS):指令译码,并检查结构冲突。(inorder issue) 读操作数(Read Operands, RO):等待数据冲突消 失(如果有冲突),然后读操作数。(out of order execution)
前提:在乱序流动的流水线中。
不足:可能会产生新的WAR或WAW冲突。
(3)控制冲突:
• 预测分支失败 • 预测分支成功
(编译器)
• 延迟转移技术
静态调度
4.2 指令的动态调度
静态调度
➢ 依靠编译器对代码进行静态调度,以减少相关和冲突。 ➢ 它不是在程序执行的过程中,而是在编译期间进行代码
调度和优化。 ➢ 通过把相关的指令拉开距离来减少可能产生的停顿。
即原来程序中是怎么发生的,改变执行顺序后还是怎 么发生。 弱化为:指令执行顺序的改变不能导致程序中发生新 的异常。
4.2 指令的动态调度
4.2 指令的动态调度
关键知识回顾: 1. 相关 相关是指两条指令之间存在某种依赖关系,是程序固有的一种
属性。 相关包括:名相关,数据相关,控制相关。 2. 冲突( HAZARDS,也称为冒险) 冲突是指由于相关的存在,使得指令流中的下一条指令不能在
指定的时钟周期执行。 具体一次相关是否会导致实际冲突的发生以及该冲突会带来多
长的停顿,则是流水线的属性。 流水线冲突包括:结构冲突,数据冲突,控制冲突。
4.2 指令的动态调度
3. 冲突的解决
(1)结构冲突:停顿(流水线气泡)
(2)数据冲突:
• 定向传送技术
• 定向传送与停顿相结合
• 指令调度(编译器)
动态调度
➢ 在程序的执行过程中,依靠专门硬件对代码进行调度, 减少数据相关导致的停顿。
4.2 指令的动态调度
一、动态调度的基本思想
考虑下面一段代码:
DIV.D F4,F0,F2 SUB.D F10,F4,F6 ADD.D F12,F6,F14
➢ SUB.D指令与DIV.D指令关于F4相关,导致流水线停顿。 ➢ ADD.D指令与流水线中的任何指令都没有关系,但也因此受
4.2 指令的动态调度
IBM 360/91首先采用了Tomasulo算法。 IBM 360/91的设计目标是基于整个360系列的统一指令 集和编译器来实现高性能,而不是设计和利用专用的 编译器来提高性能。 需要更多地依赖于硬件。 IBM 360体系结构只有4个双精度浮点寄存器,限制了 编译器调度的有效性。 360/91的访存时间和浮点计算时间都很长。 (也是Tomasulo算法要解决的问题)
… SUB.D
F10, F4, F6
WAW冲突
Tomasulo算法可以通过使用寄存器重命名来消除。
4.2 指令的动态调度
✓ 回顾:寄存器换名可以消除WAR冲突和WAW冲突。
考虑之前的代码:
反相关,F6
DIV.D SUB.D ADD.D DIV.D
F4, F0, F2
FS1,0,F4, F6 TF6,, F8, F14
途径:资源重复-设置多个处理部件 时间重叠-几乎所有的处理机都利用流水线来使指令
重叠并行执行,以达到提高性能的目的。 本章研究:如何通过各种可能的技术,获得更多的指令级
并行性。 硬件+软件技术
必须要硬件技术和软件技术互相配合,才能够最大限度地挖 掘出程序中存在的指令级并行。
4.1 指令级并行的概念
动态指令调度
相关是程序固有的 一种属性,它反映 了程序中指令之间 的相互依赖关系。
不保持“程序顺序”
相关是否会导致实际冲 突的发生以及该冲突会 带来多长的停顿,则是 流水线的属性。
4.1 指令级并行的概念
3. 对于正确地执行程序来说,必须保持的最关键的两个 属性是:数据流和异常行为。
数据流:指数据值从其产生者指令到其消费者指令的实际 流动。 保持异常行为是指:无论怎么改变指令的执行顺序,都不 能改变程序中异常的发生情况。
4.1 指令级并行的概念
1. 循环级并行
使一个循环中的不同循环体并行执行。
开发循环体中存在的并行性是指令级并行研究的重点之一
最基本的开发循环级并行的技术
循环展开(loop unrolling)技术 (4.5节介绍) 采用向量指令和向量数据表示 (向量章节介绍)
2. 相关与流水线冲突
静态指令调度
第四章 指令级并行
主要内容
4.1 指令级并行的概念 4.2 指令的动态调度 4.3 动态分支预测技术 4.4 多指令流出技术 4.5 循环展开和指令调度
4.1指令级并行的概念
4.1 指令级并行的概念
指令级并行(ILP:Instruction-Level Parallelism):是指 指令之间存在的一种并行性,利用它计算机可以执行两条 或两条以上的指令。
流水线处理机的实际CPI ➢ 理想流水线的CPI加上各类停顿的时钟周期数:
CPI流水线 = CPI理想 + 停顿结构冲突 + 停顿数据冲突 + 停顿控制冲突
➢ 理想CPI是衡量流水线最高性能的一个指标。通过 减少右边各项,就能减小总的CPI,从而提高IPC。
➢ IPC(Instructions Per Cycle):定义为一个时 钟周期内流水线上完成的指令条数。
IS
RO
检测结构冲突 检测数据冲突
4会发生WAR冲突和WAW冲突。
例如,考虑下面的代码
反相关 WAR冲突
DIV.D SUB.D ADD.D DIV.D
F4, F0, F2 F10, F4, F6
F6, F8, F14
F10, F1, F3
数据相关 输出相关
F10, F1, F3
数据相关,F4 输出相关,F10
消除名相关:引入两个临时寄存器S和T,分别将第一个F10 换成S,将后一个F6换成T。
4.2 指令的动态调度
二、Tomasulo算法
1.基本思想 核心思想: 记录和检测指令相关,操作数一旦就绪就立即执 行,把发生RAW冲突的可能性减少到最小; 通过寄存器换名来消除WAR冲突和WAW冲突。