计算机体系结构重点总结
计算机组成与体系结构重点

计算机组成与体系结构重点计算机组成指的是计算机硬件的组成部分,包括中央处理器(CPU)、存储器、输入输出设备和总线等。
这些部分相互协调工作,完成计算机的主要功能。
中央处理器是计算机的核心,负责执行指令并控制整个系统的运行。
存储器则用于存储数据和指令,可以分为主存储器和辅助存储器。
输入输出设备用于和外部世界进行交互,例如键盘、显示器和打印机等。
总线则是不同设备之间信息传输的通道。
在计算机组成与体系结构的研究中,存在几个重要的关键点。
首先是对计算机硬件的深入理解。
计算机硬件是计算机系统的基础,了解计算机硬件的组成和工作原理对于理解计算机系统的整体运行至关重要。
硬件的各个组件之间互相依赖,只有理解其相互关系,才能为系统的性能和可靠性做出合理的设计和调整。
其次是对指令集架构的研究。
指令集架构是决定计算机软件和硬件之间交互方式的关键,不同的指令集架构对计算机系统的性能和功能有着不同的影响。
为了提高计算机系统的性能,需要深入研究指令集的设计和实现。
此外,对于存储器层次结构的研究也是计算机组成与体系结构的重要内容。
计算机的存储器系统是计算机性能的瓶颈之一,如何提高存储器系统的容量和速度是计算机体系结构设计的关键问题。
研究存储器层次结构可以有效地提高存储器的访问速度,从而提高整个系统的性能。
最后,还需要对计算机系统的优化和并行计算进行深入研究。
计算机系统的优化是指通过改进硬件和软件的设计,使计算机系统的性能达到最优化。
并行计算则是指通过多个处理器同时执行多个任务,以提高计算速度和吞吐量。
这些研究对于提高计算机系统的性能和可靠性具有重要意义。
综上所述,计算机组成与体系结构是计算机科学与技术中的重要研究领域。
对计算机硬件和软件之间的关系以及计算机内部各个组件的结构和功能进行深入研究,可以为计算机系统的设计、优化和性能提供有力支撑。
计算机组成与体系结构的研究有助于推动计算机科学与技术的发展,为实现更高效、更可靠的计算机系统提供理论和实践基础。
计算机体系结构必考知识点

计算机体系结构必考知识点一、知识概述《计算机体系结构必考知识点》①基本定义:计算机体系结构呢,简单说就是计算机的各个组成部分,像处理器、内存、输入输出设备等,它们之间是怎么连接的,还有各自的功能怎么协同工作。
就好比一个足球队,每个球员(硬件组件)都有自己的位置(功能),教练(操作系统等软件)怎么安排他们配合踢球(协同工作),这就是大致的概念。
②重要程度:在计算机这个学科里,这可太重要了。
要是不懂体系结构,就好比你盖房子不知道怎么搭框架,那接下来的装修(软件开发之类的)就无从下手。
计算机系统的性能、功能等都和它有很大关系。
③前置知识:得有基本的数字电路知识,像什么是逻辑门之类的。
还有对计算机各个硬件部件有个简单了解,就像你得知道有CPU这个东西,它大致是干啥的。
如果之前学过计算机组成原理那就更好了,就像你是个盖房子的小工,盖了几次小房子(了解简单的硬件组合),再来盖大楼(学习体系结构)就容易些。
④应用价值:实际应用可多了。
比如说设计新的计算机芯片,要考虑体系结构。
像手机厂商想让手机运行得更快,还不那么耗电,那就得优化手机芯片的体系结构。
再比如说云计算中心设计大型服务器集群,也得按照合理的体系结构来,这样才能高效处理海量的数据。
二、知识体系①知识图谱:在计算机学科的大地图里,计算机体系结构是重要的一块。
它连接着计算机硬件底层,向上又影响着操作系统、软件应用的开发。
就好比它是城市里的交通规划(对计算机里的数据等流动起规划作用),其他的建筑物(软件等)得按照这个交通规划来建设。
②关联知识:和计算机组成原理关联紧密,组成原理就像是讲每个部件的详细构造,体系结构就是把这些部件组合起来看。
和操作系统也有很大关系,操作系统的运行依赖于计算机体系结构提供的环境。
就好像演员(操作系统)得在舞台(体系结构)上表演。
③重难点分析:掌握难度在于概念比较抽象,像多级存储体系结构,什么缓存、主存、外存的关系不好理解。
关键点在于要理解各个部件的交互原理。
计算机体系结构重点

1计算机组成——计算机体系结构的逻辑实现。
2计算机实现——计算机组成的物理实现。
3关系系统结构是组成的抽象,组成是实现的抽象4体系结构——程序员所看到的计算机的属性,即概念性结构与功能特性。
5软件兼容——同一个软件可以不加修改地运行于体系结构相同的各档机器上,而且它们所获得的结果一样,差别只在于运行的时间不同。
6 Amdahl定律——加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中的所占的重要性。
1 结构相关——某些指令组合在流水线中重叠执行时,发生资源冲突,则称该流水线有结构相关。
2 数据相关——当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。
3 定向——将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。
4 RAW——两条指令i,j,i在j前进入流水线,j执行要用到i的结果,但当其在流水线中重叠执行时,j可能在i写入其结果之前就先行对保存该结果的寄存器进行读操作,得到错误值。
★1 强制性失效——当第一次访问一个块时,该块不在Cache中,需要从下一级存储器中调入Cache,这就是强制性失效。
2 Victim Cache——位于Cache和存储器之间的又一级Cache,容量小,采用全相联策略。
用于存放由于失效而被丢弃(替换)的那些块。
每当失效发生时,在访问下一级存储器之前,先检查Victim Cache中是否含有所需块。
4 2:1Cache经验规则——大小为N的直接映象Cache的失效率约等于大小为N /2的两路组相联Cache的实效率。
1 互联网络:互联网络是将对称式的系统或分布式系统中的节点连接起来所构成的网络,这些节点可能是处理器,存储模块或者其他设备,他们通过互联网络进行信息交换2 互联网络特点:数数据传送速率高,延迟低,通信频带宽机群系统:机群是一种价格低廉,易于构建,可扩展性强的并行计算机系统,由多台同构或者异构的地理计算机通过高性能网络或者局域网互联在一起,协同完成特定的并行计算机任务。
计算机系统结构考点总结

计算机系统结构考点总结计算机系统结构是计算机科学与技术领域的重要分支,涉及计算机硬件和软件的组成及其相互关系。
为了帮助大家更好地掌握这一领域的核心知识,本文将针对计算机系统结构的考点进行详细总结。
一、计算机系统结构基本概念1.计算机系统结构的定义及发展历程2.计算机系统结构的分类:冯·诺伊曼结构、哈佛结构、堆栈式结构等3.计算机系统性能指标:指令周期、CPU时钟周期、主频、缓存命中率等二、中央处理器(CPU)1.CPU的组成:算术逻辑单元(ALU)、控制单元(CU)、寄存器组等2.指令集架构:复杂指令集计算机(CISC)、精简指令集计算机(RISC)3.CPU缓存:一级缓存、二级缓存、三级缓存及其工作原理4.多核处理器:核数、并行计算、线程级并行等三、存储系统1.存储器层次结构:寄存器、缓存、主存储器、辅助存储器等2.主存储器:DRAM、SRAM、ROM等3.磁盘存储器:硬盘、固态硬盘、光盘等4.存储器管理:分页、分段、虚拟存储器等四、输入输出系统1.I/O接口:并行接口、串行接口、USB、PCI等2.I/O设备:键盘、鼠标、显示器、打印机等3.I/O控制方式:程序控制、中断、直接内存访问(DMA)等4.I/O调度策略:先来先服务(FCFS)、最短作业优先(SJF)、扫描算法等五、总线与通信1.总线分类:内部总线、系统总线、I/O总线等2.总线标准:ISA、PCI、PCI Express等3.通信协议:TCP/IP、UDP、串行通信等4.网络拓扑结构:星型、总线型、环型、网状等六、并行计算与分布式系统1.并行计算:向量机、SIMD、MIMD等2.分布式系统:分布式计算、分布式存储、负载均衡等3.并行与分布式编程:OpenMP、MPI、MapReduce等4.并行与分布式算法:排序、搜索、分布式锁等通过以上考点的总结,相信大家对计算机系统结构有了更加全面和深入的了解。
计算机体系结构重点总结

1.、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高的越多;整机的性能加速不可能大于在原机器中除该部件外所有其它部件运行时间的百分比的倒数1/(1-F)。
F定义为采用先进高速部件的那部分程序在未采用先进高速部件的计算机上运行的时间占总时间的百分比,则F= 采用高速部件的任务在老计算机上运行的时间整个任务在老计算机上运行的时间同时将S定义为先进高速部件与老部件的性能,则S= 老部件完成该功能的时间先进高速部件完成该功能的时间而采用了高速部件后整机性能提高比,即Speedup = T old = 1T new (1-F)+F/S某种硬件增强技术,可使执行速度提高10倍,在采用增强技术的计算机上测出其使用率是50%。
根据Amdahl定律计算:⑴采用增强技术后计算机性能加速比是多少?⑵未采用增强技术运行的部件在不采用增强技术的机器上运行时的时间比例。
2、(1)90/10局部性规则:程序花费90%的执行时间运行指令集中10%的指令代码。
这就是说在指令集中所有的指令只有10%指令是常用的,而另外90%指令的使用率合起来只有10%。
(2)时间局部性:如果某一参数被引用,那它不久将再次被引用。
这里指出了程序执行时在时间上的局部性(3)空间局部性:如果某一参数被引用,那它附近的参数不久也将被引用。
指出程序执行时地址空间上的局部性。
3、计算机的性能是指在计算机上完成用户的应用任务所需的时间长短。
完成同样任务所需的时间越短,计算机的性能越好。
(考判断)4、衡量计算机性能的参数:响应时间是指计算机系统完成某一任务(程序)所花费的时间。
5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。
(考判断)6、计算机整机性能分成两部分:一是CPU执行程序的时间,二是等待时间。
提高计算机性能就是提高CPU性能和减少等待时间。
cpu性能因子CPI:每条指令的平均时钟周期数(clock cycles per instruction),CPI=CPU花费的时钟数/CPU执行的总指令数CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I)(考填空)CPU性能 =1/CPU time= f / ( I×CPI )计算机性能常用指标:(1)MIPS(million instruction per second)MIPS的意思是每秒钟执行的百万条指令数。
计算机体系结构知识点

第一章计算机体系结构得基本概念1计算机系统结构得经典定义程序员所瞧到得计算机属性,即概念性结构与功能特性。
2透明性在计算机技术中,把这种本来存在得事物或属性,但从某种角度瞧又好像不存在得概念称为透明性。
3系列机由同一厂家生产得具有相同系统结构、但具有不同组成与实现得一系列不同型号得计算机。
4常见得计算机系统结构分类法有两种:Flynn 分类法、冯氏分类法Flynn 分类法把计算机系统得结构分为4 类:单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)5 改进后程序得总执行时间系统加速比为改进前与改进后总执行时间之比6CPI(Cycles Per Instruction):每条指令执行得平均时钟周期数CPI = 执行程序所需得时钟周期数/IC7存储程序原理得基本点:指令驱动8冯·诺依曼结构得主要特点1以运算器为中心。
2在存储器中,指令与数据同等对待。
指令与数据一样可以进行运算,即由指令组成得程序就是可以修改得。
3存储器就是按地址访问、按顺序线性编址得一维结构,每个单元得位数就是固定得。
4指令得执行就是顺序得5指令由操作码与地址码组成。
6指令与数据均以二进制编码表示,采用二进制运算。
9软件得可移植性一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。
差别只就是执行时间得不同。
我们称这两台计算机就是软件兼容得。
实现可移植性得常用方法:采用系列机、模拟与仿真、统一高级语言。
软件兼容:向上(下)兼容:按某档机器编制得程序,不加修改就能运行于比它高(低)档得机器。
向前(后)兼容:按某个时期投入市场得某种型号机器编制得程序,不加修改地就能运行于在它之前(后)投入市场得机器。
向后兼容就是系列机得根本特征。
兼容机:由不同公司厂家生产得具有相同系统结构得计算机。
10并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。
考研计算机体系结构知识点梳理

考研计算机体系结构知识点梳理计算机体系结构是计算机科学与技术中的重要分支,涵盖了计算机硬件和软件之间的接口设计、计算机系统的层次结构、指令集架构等内容。
考研中,对计算机体系结构的掌握是非常重要的,本文将对考研计算机体系结构的知识点进行梳理和总结。
一、计算机体系结构的基本概念计算机体系结构(Computer Architecture)是指计算机硬件与软件之间接口规格定义的集合,它包括计算机硬件的组成和工作原理,以及指令集架构和计算机系统的层次结构。
1.1 计算机硬件的组成计算机硬件由中央处理器(CPU)、存储器(Memory)、输入输出设备(I/O)等组成。
其中,中央处理器是计算机的核心部件,负责执行指令和进行数据处理。
1.2 计算机系统的层次结构计算机系统的层次结构包括硬件层次结构和软件层次结构。
硬件层次结构包括处理器、存储器、总线等组成部分;软件层次结构包括操作系统、编译系统、应用软件等。
1.3 指令集架构指令集架构(Instruction Set Architecture,ISA)定义了计算机系统的指令集合和指令的编码格式。
常见的指令集架构包括精简指令集(RISC)和复杂指令集(CISC)。
二、计算机的性能指标在计算机体系结构中,常用的性能指标有时钟周期、时钟频率、执行时间和吞吐量等。
2.1 时钟周期和时钟频率时钟周期是指计算机系统中最小的时间单位,是计算机进行一次简单操作所需要的时间。
时钟频率是指计算机系统每秒钟进行时钟周期的次数。
2.2 执行时间执行时间是指计算机完成一个程序的时间,它等于指令执行的总周期数乘以时钟周期。
执行时间是衡量计算机性能的重要指标,通常以秒为单位。
2.3 吞吐量吞吐量是指计算机系统在单位时间内完成的任务数量。
吞吐量大表示计算机系统的处理能力强,可以同时处理更多的任务。
三、指令的执行流程计算机处理器执行指令的流程包括指令获取、指令译码、指令执行和结果写回等步骤。
3.1 指令获取指令获取是指计算机从存储器中获取指令的过程。
计算机体系结构

计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。
以下是一些主要的知识点:
1. 存储程序计算机(冯诺依曼型):这种类型的计算机包括运算器、存储器、输入输出设备和控制器四部分。
它以运算器为中心,采用存储程序原理,即程序(指令)和数据放在同一存储器中。
此外,存储器按地址访问,控制流由指令流产生,指令由操作码和地址码组成,数据以二进制代码表示。
2. 程序员所看到的机器属性:这包括数据表示,即硬件能直接辨认和处理的数据类型;寻址规则,包括最小寻址单元,寻址方式及其表示;寄存器定义,包括各种寄存器的定义,数量和使用方式。
3. 指令系统:指令系统是计算机中用来计算和控制的命令集合。
4. 流水线技术:这是一种提高处理器执行指令速度的技术,将指令执行过程分解为多个阶段,并让各阶段的操作重叠进行。
5. 存储层次:存储层次是指把内存划分为不同的等级,以满足不同的存储需求。
6. 输入输出系统:这是负责计算机与外部信息交互的部分。
7. 多处理机和非冯-洛依曼型计算机:这些是计算机体系结构中的高级主题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。
F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间整个任务在老计算机上运行得时间同时将S定义为先进高速部件与老部件得性能,则S= 老部件完成该功能得时间先进高速部件完成该功能得时间而采用了高速部件后整机性能提高比,即Speedup = T old = 1T new (1-F)+F/S某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。
根据Amdahl定律计算:⑴采用增强技术后计算机性能加速比就是多少?⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。
2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。
这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。
(2)时间局部性:如果某一参数被引用,那它不久将再次被引用。
这里指出了程序执行时在时间上得局部性(3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。
指出程序执行时地址空间上得局部性。
3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。
完成同样任务所需得时间越短,计算机得性能越好。
(考判断)4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。
5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。
(考判断)6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。
提高计算机性能就就是提高CPU性能与减少等待时间。
cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction),CPI=CPU花费得时钟数/CPU执行得总指令数CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空)CPU性能 =1/CPU time= f / ( I×CPI )计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。
MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 )MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×10610、工作负载基准程序(workload benchmark):(1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空)11、基准程序得一般设计原则:(1)具有代表性,反映用户得实际应用。
(2)不能对基准程序进行优化。
(3)复现性。
能重复测试,其环境相同,结果能重复出现。
(4)可移植性。
系统相关性要小。
(5)紧凑性。
基准程序不宜太庞大。
(6)成本-效率要高。
12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序13、指令设计时主要以下几个方面来考虑: (考填空)⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。
14、正向条件转移大部分就是不成功得,它满足条件得概率较低。
(考判断)15、一般基本传送指令包含Load,Store与Move三类。
(考填空)16、从操作数存放得位置来说,至少有三类地址:(1)存储器地址(2) I/O地址(3)寄存器地址如果不加特殊说明,我们称地址就就是指存储器地址或I/O地址。
17、主存储器编址:计算机有两种习惯使用方法,即在字单元地址内有两种字节排列次序:第一种为低位收尾(little endian),其字节次序就是低字节在最低位得排列; DEC Intel公司第二种为高位收尾(big endian),其字节次序就是高字节在最低位得排列。
IBM Motorola公司操作码得信息源熵(系统包含得平均信息量)公式(H=-Σp i log2p i )式中pi为事件出现得频率,由此我们可以比较压缩前后得信息冗余量或时间冗余量。
“Simple is fast”与“Small is fast”,即:简单事件可以更快速处理;小规模器件得速度可以做得更快,体现了RISC思想得精髓。
20、构成计算机得成本组合:(1)器件成本(2)直接成本(3)间接成本(4)报价单价格 (考填空)21、计算机得三种机器结构:堆栈、累加器、通用寄存器22、处理器(CPU)可分为两部分:(1、)数据通路(ALU(arithmetic logic unit)+寄存器)为处理器工作时数据实际流过得路径。
(2)控制器(解释计算机机器指令代码,并按这些代码发出控制信号控制数据通道得工作以完成指令)就是处理器中得主控部分,就是将指令转换为实际硬件动作得桥梁,设计最复杂。
23、数据通路组成图24、寄存器:专用寄存器+通用寄存器专用寄存器:(1)PC(Program Counter) 程序计数器(2)MAR(memoryaddress register) 存储器地址寄存器MDR(memory dataregister) 存储器数据寄存器(4)IAR(interruptaddress register)中断地址寄存器(5)Temp 暂存寄存器:数据访问中起暂存作用得寄存器。
不知道存在:MAR、MDR、Temp 用户透明:PC、IAR通用寄存器:能被用户自由地用于数据计算得寄存器寄存器堆(register file)由多个通用寄存器合起来得。
存储器层次结构中得最高层,属于最小也就是最快得暂存部件。
25、指令得执行分为以下五个步骤:(1)取指令IF(2、)指令译码/寄存器读出ID(3)执行/有效地址计算EX(4)存储器访问/完成转移:a、访存指令b、转移指令 MEM(5)写回 WB26、微指令编制方式:(1)垂直微代码:加一些硬件电路来解释这些信号,而不就是直接使用它们(2)水平微代码:完全不编码得微指令27、中断在不同得计算机系统中有不同得叫法,Intel与IBM仍将所有得都称为中断,而Motorola将它们称为例外,DEC则根据不同得情况,将它们称作异常、出错、自陷、放弃或中断。
28、流水线得作用:提高硬件功能部件得使用率, 减少指令得平均执行时间。
流水线(pipeline)就是指在程序执行时多条指令重叠进行操作得一种准并行处理实现技术(流水线得并行处理就是指完成一条指令得各个部件在时间上可以重叠工作)。
29、30、流水线竞争有三种:⑴结构竞争(资源竞争):由资源缺乏引起。
⑵数据竞争(data hazard) :由指令间数据相关而引起。
⑶控制竞争(control hazard) :由程序指针PC值得改变而引起。
(考填空)31、为什么计算机设计者允许结构竞争存在(1)减少成本。
(2)降低单元电路得延时时间。
(3)减少电路得复杂程度。
32、三种数据竞争:(1)先写后读相关 RAW (read after write)(2)写写相关 WAW (write after write)(3)先读后写相关 WAR (write after read)指令从ID级流入EX级,一般称指令发射(instruction issue)。
一条指令已建立了这一过程,称为已发射(issued)。
34、35、浮点乘法:15个周期,执行周期7个。
浮点加法:执行周期4个。
浮点除法:15个周期36、37、集中式动态调度。
记分牌有以下四级流水步骤:⑴发射级(issue) 处理结构竞争与WAW竞争⑵读操作数(read operands) 动态解决RAW竞争⑶执行(execution) ⑷写结果(write result) 处理WAR竞争记分牌重点掌握:38、下面我们来分析如图4-30所示得5个功能部件得记分牌数据结构与工作过程。
表4-24给出了执行下列简单得指令序列时记分牌得组成信息:LD F6,34(R2)LD F2,45(R3)MULTD F0,F2,F4SUBD F8,F6,F2DIVD F10,F0,F6ADDD F6,F0,F2表4-24 记分牌得组成结构指令状态记分牌构成分三个部分:1、指令状态。
指出指令工作处在上述四级中得哪一级。
2、功能部件工作状态。
指出功能部件得工作情况,每个功能部件需要指出九项相关参数。
Busy—指出功能部件地忙或空闲状态。
Op—功能部件所执行得操作类型。
F i—目得寄存器。
F j,F k—源操作数所用得寄存器。
Q j,Q k—产生源寄存器数据得功能单元。
R j,R k—指示源寄存器Fj,Fk准备就绪。
3、寄存器结果状态。
如果有一条已激活指令有一个目得操作数就是寄存器,则指出那个功能单元将写(操作)这个寄存器。
相应流水线记分牌得工作过程也分三步。
从表4-24可以瞧到,每条指令不论有没有发射,只要已取入流水线,在指令状态表中就有记录。
而每个功能部件在其状态表中只保持一条记录。
对于上述指令序列:指令状态寄存器表明第一条LD指令已经完成并且将结果写入了寄存器,而第二条LD指令已经执行完成,但还没有写结果。
第三、四、五条指令MULTD,SUBD与DIVD已经发射,但被暂停在读操作数这一级,等候其操作数得到来。
功能部件工作状态则表明第一个乘法单元在等整数单元取操作数F2,同样加法单元在等整数减法部件得操作数F2,除法部件在等第一个乘法部件得操作数F0。
加法指令ADDD被暂停发射,因为存在一个结构竞争,这个结构竞争就是减法指令引起得,等加法功能部件得减法指令执行完,功能部件竞争就会消除。
[例4-8] 我们假定浮点功能部件在EX级流水级其等待延迟时间,加法部件就是2时钟周期,乘法部件就是10时钟周期,则对表4-24记分牌记录得代码序列与初值数据结构,分析当前指令MULTD与指令DIVD继续执行各自进入写结果状态时记分牌得数据结构。
解:第二条指令LD给MULTD与SUBD指令带来了RAW型数据竞争,而指令MULTD给指令DIVD、指令SUBD给指令ADDD也带来了RAW型数据竞争。
在指令DIVD与ADDD之间存在着WAR数据竞争。