高等计算机体系结构考题部分答案整理与分析(1).
计算机体系结构考试卷子及答案

1.某台主频为1GHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:求该计算机的有效CPI、MIPS和程序执行时间。
(10分)2.将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?3.如果某计算机系统有3个部件可以改进,则这3个部件进改进后达到的加速比分别为:S1=30,S2=20,S3=10。
(1)如果部件1和部件2改进前的执行之间占整个系统执行的时间比例都为30%,那么,部件3改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10?(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别是30%,30%和20%,那么,3个部件都改进后系统的加速比是多少?未改进部件执行时间在改进后的系统执行时间中占的比例是多少?(10分)4.假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。
具体数据如下表所示:(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4类操作均改进后,整个程序的加速比是多少?5.一台模型机的9条指令的使用频度如下:(10分)ADD(加):26%SHR(右移):2%SUB(减):17%CLL(循环左移):5%JOM(按页转移):11%CLA(累加器清零):15%STO(存):2%STP(停机):12%JMP(转移):10%试设计这9条指令的Huffman编码的操作码表示以及其等长扩展操作码表示,并计算这两种表示的平均操作码长度。
6.有一个“Cache-主存”存储层次。
主存共分为8个块(0~7),Cache为4个块(0~3),采用直接映像方式。
(1)对于如下主存块地址流:0、2、6、1、3、7、0、1、4、5、4、6、0、7、2,如主存中内容一开始未装入Cache,请列出每次访问后Cache中各块的分配情况;(2)对于(1),指出既发生块失效又发生块争用的时刻;(3)对于(1),求出此期间的Cache命中率。
计算机系统结构复习题(含答案)

计算机系统结构复习题(含答案)计算机系统结构复习题1、虚拟机的概念虚拟机(Virtual Machine)指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。
2、指令系统的设计方法、概念、主要原因、对象、总线的仲裁算法主要原因:因为指令系统是软件设计人员与硬件设计人员之间的一个主要分界面,也是他们之间互相沟通的一座桥梁。
对象:概念:又称指令集(instruction set)是计算机体系结构设计的核心,是计算机软、硬件接口,是指机器所具有的全部指令的集合。
它反映了计算机所拥有的基本功能。
它是机器语言程序员所看到的机器的主要属性之一。
设计方法:①、首先考虑所应实现的基本功能,确定哪些基本功能应该由硬件实现,哪些功能由软件实现比较合适。
包括指令的功能设计和指令格式的设计;②、在确定哪些基本功能用硬件来实现时,主要考虑3个因素:速度、成本、灵活性;硬件实现的特点:速度快、成本高、灵活性差软件实现的特点:速度慢、价格便宜、灵活性好③、对指令系统的基本要求完整性、规整性、正交性、高效率、兼容性。
总线仲裁算法有:静态优先级算法、固定时间片算法、(动态优先级)算法和(先来先服务)算法3、要实现两条指令在世间上重叠解释步骤是什么?为了实现两条指令在时间上重叠解释:首先需要付出空间代价,如增加数据总线、控制总线、指令缓冲器、地址加法器、相关专用通路,将指令分析部件和指令执行部件功能分开、单独设置,主存采用多体交叉存取,等等。
其次要处理好指令之间可能存在的关联,如转移的处理,指令相关,主存空间数的相关、通用寄存器组的数相关和基址值相关等的处理。
此外,还应合理调配好机器指令的微操作,使“分析”和“执行”的时间尽可能相等,以提高重叠的效率。
4、互连网络的交换方式有(线路交换)、(包交换)和(线路/包交换)5、SIMD互连网络采用(线路)交换,多处理机常采用(包)交换6、与重叠机器一样,流水机器在遇到(转移指令)指令,尤其是(条件转移指令)指令时,效率也会显著下降7、按指令与数据流的多倍性将数据流分为(SISD)、(SIMD)、(MISD)、(MIMD)四类。
计算机体系结构答案

计算机体系结构答案2021 福师网院一、填空题(每空1分,共14分)1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相联方式。
2. 虚拟存储器的三种管理方式是段式管理,页式管理和段页式管理。
3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量。
4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为RAW 、WAR 和WAW 三种类型。
5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容。
二、名词解释(每题2分,共16分)计算机体系结构:答:计算机体系结构包括指令集结构、计算机组成和计算机实现三个方面的内容。
兼容机:答:不同厂家生产的具有相同计算机结构的计算机;系列机:同一厂家生产的具有相同计算机结构,但具有不同组成和实现的一系列不同档次不同型号的机器;写直达法:答:执行“写”操作时,不仅写入Cache,而且也写入下一级存储器。
高速缓冲存储器:答:为解决CPU与主存储器间速度差而在内存储器和CPU之间增加的一种存取速度远高于普通内存的特殊存储器。
延迟转移技术:答:为了使指令流水线不断流,在转移指令之后插入一条不相关的有效的指令,而转移指令被延迟执行,这种技术称为延迟转移技术。
线性流水线:答:指各段串行连接、没有反馈回路的流水线。
数据通过流水线中的各段时,每一个段最多只流过一次;非线性流水线:指各段除了有串行的连接外,还有反馈回路的流水线。
流水线的吞吐率:答:在单位时间内流水线所完成的任务数量或输出结果的数量。
并行性:答:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。
只要在时间上相互重叠,就存在并行性。
它包括同时性与并发性两种含义。
三、简答题(每题5分,共30分)1. 如有一个经解释实现的计算机,可以按功能划分成4级。
每一级为了执行一条指令需要下一级的N条指令解释。
专升本计算机试题解析计算机组织与体系结构

专升本计算机试题解析计算机组织与体系结构计算机组织与体系结构是计算机专业中的一门重要课程,其涉及到计算机硬件组成、层次结构以及运行原理等方面的内容。
下面,本文将从试题解析的角度,对专升本计算机组织与体系结构的相关考点进行深入剖析。
一、题目一解析:题目:计算机组织与体系结构是计算机科学基础的核心课程之一,请简要介绍计算机组织与体系结构的概念,并列举一个实际计算机体系结构的例子进行说明。
解析:计算机组织与体系结构是指计算机系统硬件与软件之间的关系,涉及到计算机的层次结构及其连接方式、指令系统、中央处理器、存储器、输入输出等方面的内容。
一个实际的计算机体系结构例子是冯·诺依曼结构,它是一种基于存储程序概念的计算机体系结构,具有存储器、运算器、控制器、输入输出设备等组成部分。
二、题目二解析:题目:请简述冯·诺依曼结构与哈佛结构之间的区别,并分析各自的优缺点。
解析:冯·诺依曼结构与哈佛结构是两种不同的计算机体系结构。
冯·诺依曼结构将指令和数据存储在同一存储器中,通过地址来区分。
而哈佛结构则将指令和数据存储在不同的存储器中,具有独立的指令存储器和数据存储器。
冯·诺依曼结构的优点是简单、灵活,缺点是指令和数据的读取速度受限于存储器单元的数量。
而哈佛结构的优点是指令和数据的并行处理,提高了数据的读取速度,缺点是设计和实现较为复杂。
三、题目三解析:题目:什么是指令系统?请简要介绍指令的类型和格式。
解析:指令系统是计算机体系结构中的一个重要组成部分,用于描述计算机中各种操作的指令及其执行方式。
指令可以分为数据传输指令、算术逻辑指令、控制转移指令等类型。
指令的格式包括操作码、操作数、寻址方式等信息,常见的指令格式有固定格式、可扩展格式等。
四、题目四解析:题目:请简述中央处理器(CPU)的功能和组成部分。
解析:中央处理器是计算机体系结构中的核心部件,负责执行计算机指令、控制、处理和调度计算机的各种操作。
计算机组织架构考试题库及答案

计算机组织架构考试题库及答案计算机组织架构是计算机科学的一个重要分支,它研究的是计算机系统中硬件和软件的组成、结构、操作和设计方法。
以下是计算机组织架构的考试题库及答案,供您参考。
一、选择题1. 计算机组织架构主要研究的是计算机系统中硬件和软件的( )。
A. 组成B. 结构C. 操作D. 设计方法答案:A、B、C、D2. 计算机的中央处理器(CPU)主要由( )两部分组成。
A. 控制器和运算器B. 控制器和内存C. 运算器和内存D. 控制器和输入输出设备答案:A3. 下列哪种存储器是计算机的主要存储设备?( )A. 只读存储器(ROM)B. 随机访问存储器(RAM)C. 磁盘存储器D. 光盘存储器答案:B4. 计算机的指令包括操作码和( )。
A. 地址码B. 操作数C. 寄存器D. 指针答案:B5. 计算机的输入输出设备中,属于输入设备的是( )。
A. 打印机B. 鼠标C. 显示器D. 键盘答案:B、D二、填空题1. 计算机的中央处理器(CPU)主要由控制器和______两部分组成。
答案:运算器2. 计算机的存储器分为内存和外存,其中内存主要包括______和______。
答案:随机访问存储器(RAM)、只读存储器(ROM)3. 计算机的指令由操作码和______组成。
答案:操作数4. 计算机的______负责将指令译码,并控制计算机的运行。
答案:控制器5. 计算机的______用于存储正在运行的程序和数据。
答案:内存三、简答题1. 请简述计算机组织架构的主要研究内容。
答案:计算机组织架构主要研究计算机系统中硬件和软件的组成、结构、操作和设计方法,包括计算机的中央处理器(CPU)、内存、输入输出设备、指令系统等方面的设计和技术。
2. 请简述中央处理器(CPU)的主要功能。
答案:中央处理器(CPU)是计算机的核心部件,主要负责执行计算机指令、控制计算机运行、进行数据运算和处理等功能。
它主要由控制器和运算器两部分组成,通过控制器的控制,协调运算器和其他硬件设备的工作,完成对指令的执行和数据的处理。
《计算机组成与结构》复习题及答案 (1)

《计算机组成与结构》复习题及答案第1章一、一、选择题1、1、计算机系统应包括()。
A)运算器、存储器、控制器B)主机与外部设备C)硬件系统与软件系统D)系统软件与应用软件2、2、下列描述不正确的是()。
A)一种计算机的机器语言就是计算机的指令系统。
B) 汇编语言是一种符号语言,是与机器有关的语言。
C)高级语言是与机器无关的,高级语言源程序编译成目标程序之后,可在各种机器上运行。
D)只有机器语言程序在计算机中才能直接运行。
3、3、关于冯诺依曼计算机,下列叙述不正确的是()A)计算机硬件由控制器、运算器、存储器、输入设备、输出设备五部分组成。
B) 数据和程序在计算机中都用二进制数表示,且存放于计算机的存储器这中。
C)冯诺依曼计算机是一种虚拟计算机系统。
D)目前的大多计算机还是基于冯诺依曼计算机的。
4、4、硬件在功能实现上比软件强的是()。
A)速度快B)成本低C)灵活性强D)实现容易5、5、在计算机系统的层次结构中,不属虚拟机的层次是()。
A)高级语言计算机B)OS语言计算机C)汇编语言计算机D)机器语言6、6、把计算机的发展史划分为四代的依据是()。
A)计算机规模B) 计算机速度C)OS D)物理器件(逻辑元件)7、7、微型计算机出现在那一代()A)第一代B) 第二代C)第三代D)第四代8、8、下列叙述正确的是()。
A)大型计算机是指大型通用计算机,它属C/S模式的。
B) 巨型计算机更适合于高速度、大容量的计算机任务。
C)V AX、PDP都属于小型计算机,二者是相兼容的。
D)工作站可以认为是一种高性能的微型计算机。
9、9、下列计算任务与应用领域相匹配的是()A)卫星与运载火箭轨道的计算/计算科学B)企业信息系统/数据处理C)程控机床加工/计算机控制D)智能机器人/人工智能10、10、对英文缩写解释正确的是()A)CPU:中央处理单元B)ALU:算术逻辑部件C)DBMS:数据库管理系统D) CMD / CAD:计算机辅助制造/计算机辅助设计11、11、对计算机软件硬件资源进行管理的是()A)高级语言处理程序B)操作系统C)数据库管理系统D)应用程序12、12、计算机硬件系统直接运行的程序是()A)源程序B)目标程序C)汇编语言程序D)高级语言程序13、13、将高级语言源程序转化目标程序的过程是()A)汇编B)编译C)解释D)译码13.反映计算机基本功能的是( )。
计算机体系结构期末考试知识点与答案

计算机体系结构期末考试知识点与答案体系结构复习重点.doc1.冯.诺依蔓计算机的特点答:冯·若依曼计算机的主要特点如下:存储程序方式。
指令和数据都是以字的方式存放在同一个存储器中,没有区别,由机器状态来确定从存储器读出的字是指令或数据。
指令串行执行,并由控制器集中加以控制、单元定长的一维线性空间的存储器使用低级机器语言,数据以二进制形式表示。
单处理机结构,以运算器作为中心。
其实,他最大的特点就是简单易操作。
2. T(C)=<K*K',D*D',W*W'>所描述的三个层次(8页)答:3个层次为控制器、算术逻辑部件、基本逻辑部件3. 计算机系统结构的分类(5页)4. 计算机系统中的数据表示(38页)5. 指令系统设计的原则答:指令系统的设计原则是,应特别注意如何支持编译系统能高效、简易地将源程序翻译成目标代码。
首先是正交性:又称分离原则或互不相干原则。
即指令中各个有不同含义的字段之间,在编码时应互相独立、互不相关。
规整性:对相似的操作数做出相同的规定。
可扩充性:要保留一定余量的操作码空间,为以后的扩展所用。
对称性:为了使编译能更加方便,通常希望操作具有对称性。
6. 流水操作中的相关答:流水操作过程中会出现一下的3个相关:资源或结构相关、数据相关、和控制相关。
资源相关是指当有多条指令进入流水线后在同一机器周期内争用同一功能部件所发生的冲突。
数据相关:这是由于流水线中的各条指令的重叠操作使得原来对操作数的访问顺序发生了变化,从而导致了数据相关的冲突。
控制相关主要是转移指令引起的,比起数据相关来,他会使流水线丧失更多的性能。
7. 向量机中对向量的各种运算可以采用的加工方式(149页)答:向量机中对向量的各种运算可以采用不同的加工方式,但比较有效的加工方式应是尽量避免出现数据相关和尽量减少对向量功能的转换。
一种普通加工方式称为横向加工,它是按向量顺序计算的。
另外一种加工方式称为垂直加工,即它是先纵向加工所有B和C向量中元素对的相加操作。
计算机体系结构习题与答案

一、复习题1.简述冯∙诺依曼原理,冯∙诺依曼结构计算机包含哪几部分部件,其结构以何部件为中心?答:冯∙诺依曼理论的要点包括:指令像数据那样存放在存储器中,并可以像数据那样进行处理;指令格式使用二进制机器码表示;用程序存储控制方式工作。
这3条合称冯∙诺依曼原理冯∙诺依曼计算机由五大部分组成:运算器、控制器、存储器、输入设备、输出设备,整个结构一般以运算器为中心,也可以以控制器为中心。
(P51-P54)2.简述计算机体系结构与组成、实现之间的关系。
答:计算机体系结构通常是指程序设计人员所见到的计算机系统的属性,是硬件子系统的结构概念及其功能特性。
计算机组成(computer organization)是依据计算机体系结构确定并且分配了硬件系统的概念结构和功能特性的基础上,设计计算机各部件的具体组成,它们之间的连接关系,实现机器指令级的各种功能和特性。
同时,为实现指令的控制功能,还需要设计相应的软件系统来构成一个完整的运算系统。
计算机实现,是计算机组成的物理实现, 就是把完成逻辑设计的计算机组成方案转换为真实的计算机。
计算机体系结构、计算机组成和计算机实现是三个不同的概念,各自有不同的含义,但是又有着密切的联系,而且随着时间和技术的进步,这些含意也会有所改变。
在某些情况下,有时也无须特意地去区分计算机体系结构和计算机组成的不同含义。
(P47-P48)3.根据指令系统结构划分,现代计算机包含哪两种主要的体系结构?答:根据指令系统结构划分,现代计算机主要包含:CISC和RISC两种结构。
(P55)4.简述RISC技术的特点?答:从指令系统结构上看,RISC 体系结构一般具有如下特点:(1) 精简指令系统。
可以通过对过去大量的机器语言程序进行指令使用频度的统计,来选取其中常用的基本指令,并根据对操作系统、高级语言和应用环境等的支持增设一些最常用的指令;(2) 减少指令系统可采用的寻址方式种类,一般限制在2或3种;(3) 在指令的功能、格式和编码设计上尽可能地简化和规整,让所有指令尽可能等长;(4) 单机器周期指令,即大多数的指令都可以在一个机器周期内完成,并且允许处理器在同一时间内执行一系列的指令。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高等计算机体系结构考题部分答案整理与分析(1)——2002年高体考试真题解析1.填空题1)第一台通用流水线计算机是:Stretch,即IBM7030解析:主要是考察流水线技术的相关背景。
最早实现流水线技术的计算机应该是使用Stretch,即IBM7030,使用流水线实现了重叠取指令、译码和执行。
其中还设计了避免冲突的ALU旁路技术。
在1964年发布了CDC6600是使用记分板技术实现动态调度流水线机制的机器。
而使用保留站机制的Tomasulo算法是在IBM 360/91中使用的。
知识来源于本科课件第二讲2)有效检测N位加法溢出的方法是:察看输入最高位的进位是否等于最高位输出的进位解析:该知识来自本科计算器加减法运算的相关知识。
溢出指运算的结果超出了正常的表示范围。
加法溢出只可能出现在两个同为正数或同为负数相加才可以实现。
可用以下方法检测:察看输入最高位的进位是否等于最高位输出的进位。
若不相等则容易知道该数据溢出。
3)时间局部性是指:如果一个信息项正在被访问,那么近期它还会再被访问解析:考察流水线及性能改进基础——局部性原理。
局部性原理:CPU访问存储器时,无论取指令或者存取数据,访问存储单元都趋向于聚集在一个较小的连续区域中。
局部性原理包含时间局部性和空间局部性。
时间局部性指如果一个信息项正在被访问,那么近期它还会再被访问。
原因:由程序循环和堆栈技术造成的。
空间局部性指在最近的将来用到的信息很可能在现在正在使用的信息在空间地址上临近。
原因:由指令顺序执行和数组存放造成。
4)流水线存在的三种相关是:数据相关、名字相关和控制相关解析:考察指令级并行技术的基础相关知识。
相关性是程序的特性,一个相关是否会导致实际的冒险,该冒险是否会造成停顿,这是流水线结构的基本特征。
指令共有三种不同类型的相关:数据相关、名字相关和控制相关。
2.辨析题1)加深流水线级数一定可以提升处理器性能。
这句话说法不对。
当然在一定条件下加深流水线的级数可以加快流水线处理的并行度,从而提高处理器的性能。
但超过一定限度后,流水线级数无法无限制地增加并提高处理性能。
影响和限制流水线级数来提高性能的因素如下:1)指令流的并行度有限,当流水线级数增加,即流水线深度增加时,因为相关引起停顿将最终造成CPI的增加。
更深的流水线会造成时钟周期的下降,并受到时钟扭斜和负载的限制。
2)增加页面大小一定可以提升系统整体性能。
这句话说得不对。
由于RAM价格下降,存储器变得更大;处理器和存储器之间的速度差别更大,因此必须增加页面大小。
但增加页面大小会使存储器中的内部碎片变得严重,从而浪费很多存储空间。
因此增加页面大小不一定可以提升系统整体性能。
3.简答题1)简要回答DMA的概念和优势。
答:DMA方式是利用硬件控制的特殊处理器实现直接访问存储器,它可以在CPU做其他工作时组织内存和IO设备之间传送数据,适合成组数据的交换。
DMA控制器可以接管CPU总线控制,数据传输不受CPU干预,直接在存储器和外围设备之间传输数据,节约了硬件中断开销,大大减少了CPU访问和控制IO设备的时间。
2)时钟扭斜与建立时间,时钟周期之间的关系。
答:时钟扭斜是指两个同步时钟边沿可能会产生不一致,由于时钟时间>=CLK-to-Q+最长延迟路径+Setup+时钟扭斜,因此时钟扭斜会影响最小时钟周期长度,从而影响处理器的性能和频率。
由于时钟扭斜会影响保持时间,CLK-to-Q+最短延迟路径-时钟扭斜>保持时间,从而无法确定保持时间的范围。
综上,时钟扭斜对电路稳定性、时钟周期和处理器性能都有所影响。
3)什么是Cache分配写回策略?答:cache分配写回策略指Cache对应快被替换时才会被写入内存从而更新数据,之前内存的数据往往是脏数据。
写回策略主要是出于减少存储器之间通信量的考虑。
4)什么是软件流水技术?答:软件流水技术主要是发现如果程序循环中每次迭代没有相关,通过从不同迭代中抽取指令来获得更高的指令级并行,即对循环结构重构,使得每次迭代指令属于原循环不同的迭代过程。
软件流水的代码空间比较小,每次只需填充和排空流水线一次,而程序循环结构展开每次就需要一次迭代。
但要求原有循环结构每次迭代之间不能存在相关。
5)精确中断技术的定义?精确中断指对于单条指令,所有该指令之间的指令都处于提交状态,且所有后续指令,包括产生中断的指令没有改变任何机器状态,需要一定措施使得指令执行次序与指令发射流进行再同步。
高等计算机体系结构考题部分答案整理与分析(2)——2003年高体考试真题解析1.填空题1)第一台全面的、可操作的、存储程序计算机是:剑桥大学的EDSAC计算机解析:这是来自本科的内容,考察计算机制造历史的基本知识。
似乎对于这方面的考察每年似乎都有相关的题目。
世界上第一台通用电子计算机来自1946年宾夕法尼亚大学的ENIAC计算机,世界上第一台可以操作的存储式计算机来自1948年曼彻斯特大学的Mark-I计算机,世界上第一台全面的、可操作的、存储程序的计算机是1949年剑桥大学的EDSAC计算机。
最早用于商业应用的通用计算机是UNIVAC I 计算机。
世界上第一台通用流水线计算机是IBM 7030(Stretch)计算机,世界上第一台超级计算机是1966年CDC公司的CDC 6600计算机。
IBM 360/85计算机是第一台使用cache的商业计算机。
2)Cache访问的三种失效为:义务失效、容量失效、冲突失效解析:Cache访问失效一般有义务失效、容量失效和冲突失效三种。
义务失效指第一次访问不在缓冲器中的数据块,该块必须被调用。
这种失效在所难免,无效大存储器也会发生。
容量失效是程序执行时,缓冲器不能存放需要的所有数据块会先放弃一些数据块再找回数据。
冲突失效是采用组相联或直接相联技术,有多个数据块映射到同一组而产生的数据块的丢失和找回过程。
3)流水技术的三种相关:数据相关、名字相关和控制相关解析:指令共有三种不同类型的相关:数据相关、名字相关和控制相关。
数据相关指后面指令的源操作数是前面指令的目的操作数。
名字相关指两条指令使用同一个寄存器或内存地址,但指令之间不存在数据流。
控制相关指决定分支指令执行顺序和转移方向而引起的相关。
4)(10÷0)在IEEE754中的表示:NaN(Not a Number)解析:IEEE754为专门的非法运算规定了这个特殊符号NaN,表示所得的结果不是一个有效的实数。
出现非法运算程序员也不用理睬,直到方便再进行处理。
2.名词解释1)软件流水技术✧(已考) 软件流水技术主要是发现如果程序循环中每次迭代没有相关,通过从不同迭代中抽取指令来获得更高的指令级并行,即对循环结构重构,使得每次迭代指令属于原循环不同的迭代过程。
软件流水的代码空间比较小,每次只需填充和排空流水线一次,而程序循环结构展开每次就需要一次迭代。
但要求原有循环结构每次迭代之间不能存在相关。
2)延迟转移解析:延迟转移法由编译程序重排指令序列来实现。
基本思想是“先执行再转移”,即发生转移取时并不排空指令流水线,而是让紧跟在转移指令lb之后已进入流水线的少数几条指令继续完成。
如果这些指令是与Ib结果无关的有用指令,那么延迟损失时间片正好得到了有效的利用。
转移预测法用硬件方法来实现,依据指令过去的行为来预测将来的行为。
通过使用转移取和顺序取两路指令预取队列器以及目标指令cache,可将转移预测提前到取指阶段进行,以获得良好的效果。
延迟槽用来存放延迟指令,可以由分支语句之前、分支语句转移目标处和发生转移和转移目标中间代码获得指令。
延迟转移主要局限在与对延迟槽中填充指令的限制和在编译时间内准确判断转移是否发生的能力不足。
3)直接存储访问(DMA)✧(已考)DMA方式是利用硬件控制的特殊处理器实现直接访问存储器,它可以在CPU做其他工作时组织内存和IO设备之间传送数据,适合成组数据的交换。
DMA控制器可以接管CPU总线控制,数据传输不受CPU干预,直接在存储器和外围设备之间传输数据,节约了硬件中断开销,大大减少了CPU访问和控制IO设备的时间。
1)问答题1) 计算Cache的组数,相联度和TLB位数,说明TLB和Cache并行工作流程。
答:数据块放入Cache如何采取灵活方式减少Cache缺失?使用直接映像的方法是最简单的定位方式,即一一对应。
另一个就是用全相联映射,即数据块可以放到Cache 任意位置。
折中方法就是利用组相联映射,每个数据块可以放在固定数量位置。
每个块有几个位置可以放入组关联Cache称为n路组关联Cache。
N即为组关联Cache的关联度。
TLB是为了加快地址变换而设计的转换后援缓冲器,是一个跟踪和记录最近用过地址转换的特殊Cache。
TLB中每个标记项存放虚拟页号的一部分,每个数据项存放物理页号。
同时包含一些有效位和修改位。
对每次访问,我们都要在TLB中查找虚拟页号,如果命中,则物理页号用来形成地址并打开访问位。
TLB和Cache相连工作原理:CPU请求虚拟地址,虚实地址变换机制MMU会通过Table Walk访问主存页表来获得映射,查看是否有要求的虚拟页号。
若命中,则MMU 将对应的虚页号转换为物理页号,产生物理地址访问内存。
若发生缺失,CPU转到页面失效入口交给操作系统实现。
高等计算机体系结构考题部分答案整理与分析(3)——2004年高体考试真题解析1.辨析题1)高的流水级数总能提高性能.2)CPI较低的机器运行速度总是快.3)频率能够衡量两台使用相同指令系统的计算机的相对性能.4)预测错误之间的指令数目比预测错误率更能体现预测性能.5)Superscalar只使用硬件调度指令,VLIW只使用软件调度指令.2.名词解释1)软件流水技术解析:(已考) 软件流水技术主要是发现如果程序循环中每次迭代没有相关,通过从不同迭代中抽取指令来获得更高的指令级并行,即对循环结构重构,使得每次迭代指令属于原循环不同的迭代过程。
软件流水的代码空间比较小,每次只需填充和排空流水线一次,而程序循环结构展开每次就需要一次迭代。
但要求原有循环结构每次迭代之间不能存在相关。
2)(3,2)预测器解析:(已考) 预测转移是处理控制相关的一种策略。
预测转移通过其他分支指令的行为进行控制称为关联控制器。
(m,n)关联预测器指通过该分支指令前面m条指令的转移结果来从2m个n位预测器中选择转移结果。
这m条最近转移指令结果可以放到m位移位寄存器中,每一位表示该转移是否发生。
3)SMP(对称多处理器系统)解析:对称式共享存储器系统结构(SMP)指多个处理器通过总线共享一个物理存储器,每个处理器与同一个共享内存有相同的关系的设计结构。
它支持共享和私有数据的高速缓存。
私有数据是被单个处理器使用,而共享数据由多个处理器使用,本质上通过读写共享数据完成处理器之间的通信。