最新计算机体系结构期末考试试题及答案资料
计算机体系结构考试卷子及答案

1.某台主频为1GHz的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:求该计算机的有效CPI、MIPS和程序执行时间。
(10分)2.将计算机系统中某一功能的处理速度加快15倍,但该功能的处理时间仅占整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?3.如果某计算机系统有3个部件可以改进,则这3个部件进改进后达到的加速比分别为:S1=30,S2=20,S3=10。
(1)如果部件1和部件2改进前的执行之间占整个系统执行的时间比例都为30%,那么,部件3改进前的执行时间占整个系统执行时间的比例为多少,才能使3个部件都改进后的整个系统的加速比Sn达到10?(2)如果3个部件改进前执行时间占整个系统执行时间的比例分别是30%,30%和20%,那么,3个部件都改进后系统的加速比是多少?未改进部件执行时间在改进后的系统执行时间中占的比例是多少?(10分)4.假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。
具体数据如下表所示:(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4类操作均改进后,整个程序的加速比是多少?5.一台模型机的9条指令的使用频度如下:(10分)ADD(加):26%SHR(右移):2%SUB(减):17%CLL(循环左移):5%JOM(按页转移):11%CLA(累加器清零):15%STO(存):2%STP(停机):12%JMP(转移):10%试设计这9条指令的Huffman编码的操作码表示以及其等长扩展操作码表示,并计算这两种表示的平均操作码长度。
6.有一个“Cache-主存”存储层次。
主存共分为8个块(0~7),Cache为4个块(0~3),采用直接映像方式。
(1)对于如下主存块地址流:0、2、6、1、3、7、0、1、4、5、4、6、0、7、2,如主存中内容一开始未装入Cache,请列出每次访问后Cache中各块的分配情况;(2)对于(1),指出既发生块失效又发生块争用的时刻;(3)对于(1),求出此期间的Cache命中率。
计算机组织架构考试题库及答案

计算机组织架构考试题库及答案计算机组织架构是计算机科学的一个重要分支,它研究的是计算机系统中硬件和软件的组成、结构、操作和设计方法。
以下是计算机组织架构的考试题库及答案,供您参考。
一、选择题1. 计算机组织架构主要研究的是计算机系统中硬件和软件的( )。
A. 组成B. 结构C. 操作D. 设计方法答案:A、B、C、D2. 计算机的中央处理器(CPU)主要由( )两部分组成。
A. 控制器和运算器B. 控制器和内存C. 运算器和内存D. 控制器和输入输出设备答案:A3. 下列哪种存储器是计算机的主要存储设备?( )A. 只读存储器(ROM)B. 随机访问存储器(RAM)C. 磁盘存储器D. 光盘存储器答案:B4. 计算机的指令包括操作码和( )。
A. 地址码B. 操作数C. 寄存器D. 指针答案:B5. 计算机的输入输出设备中,属于输入设备的是( )。
A. 打印机B. 鼠标C. 显示器D. 键盘答案:B、D二、填空题1. 计算机的中央处理器(CPU)主要由控制器和______两部分组成。
答案:运算器2. 计算机的存储器分为内存和外存,其中内存主要包括______和______。
答案:随机访问存储器(RAM)、只读存储器(ROM)3. 计算机的指令由操作码和______组成。
答案:操作数4. 计算机的______负责将指令译码,并控制计算机的运行。
答案:控制器5. 计算机的______用于存储正在运行的程序和数据。
答案:内存三、简答题1. 请简述计算机组织架构的主要研究内容。
答案:计算机组织架构主要研究计算机系统中硬件和软件的组成、结构、操作和设计方法,包括计算机的中央处理器(CPU)、内存、输入输出设备、指令系统等方面的设计和技术。
2. 请简述中央处理器(CPU)的主要功能。
答案:中央处理器(CPU)是计算机的核心部件,主要负责执行计算机指令、控制计算机运行、进行数据运算和处理等功能。
它主要由控制器和运算器两部分组成,通过控制器的控制,协调运算器和其他硬件设备的工作,完成对指令的执行和数据的处理。
计算机体系结构期末考试知识点与答案

计算机体系结构期末考试知识点与答案体系结构复习重点.doc1.冯.诺依蔓计算机的特点答:冯·若依曼计算机的主要特点如下:存储程序方式。
指令和数据都是以字的方式存放在同一个存储器中,没有区别,由机器状态来确定从存储器读出的字是指令或数据。
指令串行执行,并由控制器集中加以控制、单元定长的一维线性空间的存储器使用低级机器语言,数据以二进制形式表示。
单处理机结构,以运算器作为中心。
其实,他最大的特点就是简单易操作。
2. T(C)=<K*K',D*D',W*W'>所描述的三个层次(8页)答:3个层次为控制器、算术逻辑部件、基本逻辑部件3. 计算机系统结构的分类(5页)4. 计算机系统中的数据表示(38页)5. 指令系统设计的原则答:指令系统的设计原则是,应特别注意如何支持编译系统能高效、简易地将源程序翻译成目标代码。
首先是正交性:又称分离原则或互不相干原则。
即指令中各个有不同含义的字段之间,在编码时应互相独立、互不相关。
规整性:对相似的操作数做出相同的规定。
可扩充性:要保留一定余量的操作码空间,为以后的扩展所用。
对称性:为了使编译能更加方便,通常希望操作具有对称性。
6. 流水操作中的相关答:流水操作过程中会出现一下的3个相关:资源或结构相关、数据相关、和控制相关。
资源相关是指当有多条指令进入流水线后在同一机器周期内争用同一功能部件所发生的冲突。
数据相关:这是由于流水线中的各条指令的重叠操作使得原来对操作数的访问顺序发生了变化,从而导致了数据相关的冲突。
控制相关主要是转移指令引起的,比起数据相关来,他会使流水线丧失更多的性能。
7. 向量机中对向量的各种运算可以采用的加工方式(149页)答:向量机中对向量的各种运算可以采用不同的加工方式,但比较有效的加工方式应是尽量避免出现数据相关和尽量减少对向量功能的转换。
一种普通加工方式称为横向加工,它是按向量顺序计算的。
另外一种加工方式称为垂直加工,即它是先纵向加工所有B和C向量中元素对的相加操作。
最新系统结构总复习题(附答案)

《计算机系统结构》期末考试复习题一、选择题:1、我们称由(B )实现的机器为虚拟机器。
A、硬件B、软件C、微程序D、固件2、计算机系统结构设计者所关心的是(C )所看到的的计算机结构。
A、硬件设计人员B、逻辑设计人员C、机器语言或汇编语言程序员D、高级语言程序员3、计算机组成是计算机系统结构的(B )。
A、硬件实现B、逻辑实现C、软件实现D、以上三种4、在计算机系统设计时,为了提高系统性能,应当注意(A )。
A、加快经常性使用指令的执行速度B、要特别精心设计少量功能强大的指令B、要减少在数量上占很小比例的指令的条数D、要加快少量指令的速度5、SIMD计算机可以处理(D )。
A、多指令流、单数据流B、单指令流单数据流C、多指令流多数据流D、单指令流多数据流6、在提高CPU性能的问题上,从系统结构角度,可以(C )。
A、提高时钟频率B、减少程序指令条数C、减少每条指令的时钟周期数D、减少程序指令条数和减少每条指令的时钟周期数7、冯.诺依曼计算机是(B )。
A、以存储器为中心B、以CPU为中心C、以处理输入/输出危重点D、以存储器与计算器为中心8、解决软件移植最好的办法就是(C )。
A、采用模拟方法B、采用仿真的方法C、采用统一高级语言D、采用统一标准设计计算机结构9、对计算机系统结构,下列透明的是(A )。
A、数据总线宽度B、浮点数表示C、CPU寄存器个数D、存储器的编址方法10、以下对系统程序员不透明的是(B )。
A、系列机各档不同的数据通路宽度B、虚拟存储器C、指令缓冲寄存器D、存储器读写缓冲寄存器11、在浮点数表示中,尾数的位数多少主要影响( B )。
A、表数范围B、表数精度C、表数效率D、运算实现容易程度12、当浮点数的尾数基值为(A )时,其表数效率最高(假如不考虑隐藏位)。
A、16B、8C、4D、213、当浮点数的尾数基值为( D )时,其表数精度最高,表数范围最大。
A、2B、8C、16D、2或414、当浮点数的尾数用原码表示,基值为2,阶码用移码表示,基值为2时,若尾数部分占23位(不含符号位),阶码占8位(含符号位),则表示的最大负数和最大正数分别为( C )。
(完整版)计算机系统结构考试题目及参考答案

一:名词解释1:虚拟机:由软件实现的机器。
2:CPI:是衡量CPU执行指令效率的重要标志,指执行每条指令所需的平均时钟周期数。
3:摩尔定律:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。
4:并发性:指两个或多个事件在同一时间间隔内发生的并行性。
5:程序局部性原理:是指程序在执行时呈现出局部性规律,即在一段时间内,整个程序的执行仅限于程序中的某一部分。
相应地,执行所访问的存储空间也局限于某个内存区域。
局部性原理又表现为:时间局部性和空间局部性。
6:CISC/RISC:CISC:即复杂指令系统计算机,指在系统中增加更多和复杂的指令,来提高操作系统效率的计算机。
RISC:即精简指令系统计算机,指在系统中选取使用一些频率最高的、长度固定的、格式种类少的简单指令的计算机。
7:计算机系统结构:指对机器语言计算机的软、硬件功能的分配和对界面的定义。
8:系列机:指先设计好一种系统结构,而后就按这种系统结构设计它的系统软件,按器件状况和硬件技术研究这种结构的各种实现方法,并按照速度、价格等不同要求,分别提供不同速度、不同配置的各档机器。
9:模拟:用机器语言程序解释实现程序移植的方法。
10:仿真:用微程序直接解释另一种机器的指令系统。
11:寻址方式:寻找操作数或指令的有效地址的方式。
12:替换算法:在存储体系中,当出现页面失效时或者主存的所有页面已经全部被占用而又出现页面失效时,按照某种算法来替换主存中某页。
[由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。
这时,需要被迫腾出其中的某一块,以接纳新调入的块。
]二:选择题1,直接执行微指令的是(C)A 汇编程序B 编译程序C 硬件D微指令程序2,对汇编语言程序员不透明的是(C)A 程序计数器B主存地址寄存器C条件码寄存器D指令寄存器3,最早的冯·诺依曼型计算机是以(B)为中心的A运算器B控制器C存储器 D I/O设备4,计算机系统结构的角度的结构来看,机器语言程序员看到的机器属性是(C )A 计算机软件所要完成的功能B 计算机硬件的全部组成C 编程要用到的硬件组织D计算机各部分硬件的实现5,不同系列计算机之间实现可移植性的途径,不包括(B )A 采用统一的高级语言B采用统一的汇编语言C 模拟D仿真6,利用时间重叠原理,实现并行处理的是(A)A流水处理机B多处理机 C 阵列处理机D集群系统7,多处理机实现的并行主要是(B)A指令级并行 B 任务级并行C 操作级并行D操作步骤的级并行8计算机系统结构不包括(B)A信息保护B存储速度C数据表示D机器工作状态9,不需要编址的数据存储空间(D )A CPU通用寄存器B 主存储器C I/O寄存器D堆栈10,RISC执行程序的速度比CISC 快的原因是(C)A RISC指令系统中条数较少B 程序在RISC编译生成的目标程序较短C RISC指令平均执行周期数较少D RISC中只允许LOAD和STORE指令存储11,程序员在编写程序时,使用的访存地址是(B)A主存地址B逻辑地址C物理地址D有效地址12,虚拟存储器主要是为了(A)A扩大存储器系统容量B提高存储器系统速度C扩大存储器系统容量和提高存储器系统速度D便于程序的访存操作13,与全相联映像相比,组相联映像的优点是(B)A目录表小B块冲突概率低C命中率高D主存利用率高14,输入输出数据不经过CPU内部寄存器的输入输出方式是(C )A程序控制方式B中断 C DMA方式D上述三种方式15,在配置了通道的计算机系统中,用户程序需要输入输出时引起的中断是(A)A访管中断 B I/O中断C程序性中断D外部中断16,当计算机系统通过执行通道程序,完成输入输出工作时,执行通道程序的是(B)A CPUB 通道C CPU和通道D指定的外设三:填空1,常见的计算机系统结构的分类法有两种:Flynn分类法,冯氏分类法冯氏分类法是根据系统的最大并行度对计算机系统结构进行分类,大多数的位并行的单处理机属于字串位并的处理机方式2,由软件实现的机器称为:虚拟机3,在一个计算机系统中,低层机器的属性往往对高层机器的程序员是透明的。
2022年河南大学计算机应用技术专业《计算机系统结构》科目期末试卷A(有答案)

2022年河南大学计算机应用技术专业《计算机系统结构》科目期末试卷A(有答案)一、选择题1、费林按指令流和数据流的多倍性把计算机系统分类,这里的多倍性指()。
A.系统瓶颈部件上处于同一执行阶段的指令流是数据流的多少倍。
B.系统瓶颈部件上处于同一执行阶段的数据流是指令流的多少倍。
C.系统瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数。
D.A和B2、开发并行的途径有(),资源重复和资源共享。
A.多计算机系统B.多道分时C.分布式处理系统D.时间重叠3、下列说法中不正确的是()A.软件设计费用比软件重复生产费用高B.硬件功能只需实现一次,而软件功能可能要多次重复实现C.硬件的生产费用比软件的生产费用高D.硬件的设计费用比软件的设计费用低4、不同系列的机器之间,实现软件移植的途径不包括()。
A.用统一的高级语言B.用统一的汇编语言C.模拟D.仿真5、目前,MO由()实现,M1用()实现,M2至M5大多用()实现。
A.软件,固件,硬件B.固件,软件,硬件C.硬件,软件,固件D.硬件,固件,软件6、在尾数下溢处理方法中,平均误差最大的是()A.截断法B.舍入法C.恒置"1"法D.ROM查表法7、属计算机系统结构考虑的是()A.主存采用MOS还是TTLB.主存采用多体交叉还是单体C.主存容量和编址方式D.主存频宽的确定8、下列关于标量流水机的说法不正确的是()A.可对标量数据进行流水处理B.没有向量数据表示C.不能对向量数据进行运算D.可以对向量、数组进行运算9、计算机系统结构不包括( )。
A.主存速度B.机器工作状态C.信息保护D.数据10、“启动I/O”指令是主要的输入输出指令,是属于()。
A.目态指令B.管态指令C.目态、管态都能用的指令D.编译程序只能用的指令二、判断题11、多数I/O系统的结构应面向操作系统设计,考虑如何在操作系统与I/O系统之间进行合理的软、硬件功能分配。
计算机组成与系统结构_上海交通大学中国大学mooc课后章节答案期末考试题库2023年

计算机组成与系统结构_上海交通大学中国大学mooc课后章节答案期末考试题库2023年1.下面关于冯诺依曼计算机特点的描述,错误的是哪一个?答案:以运算器为中心,输入输出设备与存储器之间的数据传送都经过运算器。
自冯诺依曼计算机问世70多年来,计算机技术发展和变化很大,但这个特点一直没有改变。
2.假设某个使用桌面客户端和远程服务器的应用受到网络性能的限制,那么对于下列方法,哪个既没有改进吞吐率、也没有改善响应时间?答案:增加计算机内存3.假设同一套指令集用不同的方法设计了两种机器M1和M2。
机器M1的时钟周期为0.8ns,机器M2的时钟周期为1.2ns。
某个程序P在机器M1上运行时的CPI为4,在M2上的CPI为2。
对于程序P来说,哪台机器的执行速度更快?快多少?答案:M2 比 M1 快,快25%4.只有当程序执行时才将源程序翻译成机器语言,并且一次只能翻译一行语句,边翻译边执行的是()程序,把汇编语言源程序转变成机器语言程序的过程是()程序。
Ⅰ编译Ⅱ目标Ⅲ汇编Ⅳ解释答案:Ⅳ和Ⅲ5.假设一台计算机的I/O处理占整个系统运行时间的10%,当CPU性能改进到原来的10倍,而I/O性能仅改进为原来的两倍时,系统总体性能改进获得的加速比为多少?答案:7.14倍6.设主存储器容量为64K*32位,并且指令字长,存储字长,机器字长三者均相等,请问MAR,PC、MDR,IR 等寄存器的位数分别为多少位?答案:MAR 、PC为16位,MDR 、 IR均为32位7.假定带符号数整数采用补码表示,若int型变量x和y的机器数分别为FFFF FFDFH 和 0000 0041H,则x、y的值以及x-y的机器数分别是:答案:x=-33,y=65, x-y的机器数为 FFFF FF9EH8.某32位计算机按字节编址,采用小段(little Endian)方式存储。
若语句"int i=0 ; " 对应的指令机器代码为C7 45 FC 00 00 00 00,那么语句" int i = - 64 ;" 对应的指令机器代码是:答案:C7 45 FC C0 FF FF FF9.执行以下代码后,哪些变量的值为0?unsigned int a = 0xffffffff; unsigned int b = 1;unsigned int c = a + b; unsigned long d = a + b;unsigned long e = (unsigned long)a + b;(假定 int 型数据长度为32 位,long型数据长度为64位.)答案:c 和 d10.无符号整数变量ux和uy的声明和初始化如下:unsigned ux=x;unsigned uy=y;若sizeof(int)=4,则对于任意int型变量x和y,判断以下表达式哪些为永真i. x*4+y*8==(x<<2)+(y<<3)ii. x*y==ux*uyiii. (x*x)>=0iv. x/4+y/8==(x>>2)+(y>>3)答案:i 和 ii11.对于一个n(n≥8)位的变量x,根据C语言中按位运算的定义,下面的C语言表达式,哪一个的功能是:“x的最高有效字节不变,其余各位全变为0”?答案:(x>>(n-8))<<(n-8)12.考虑以下C语言程序代码:int func1(unsigned word) { return (int) (( word <<24) >> 24); } int func2(unsigned word) { return ( (int) word <<24 ) >> 24; }假设在一个32位机器上执行这些函数,该机器使用二进制补码表示带符号整数。
2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷(总分:100分,时间:100分钟)姓名:专业:学号:学习中心:一、填空题(每空1分,共14分)1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相连方式。
2.虚拟存储器的三种管理方式是段式管理,页式管理和段页式管理。
3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为读与写(RAM)、写与读(WAR)和写与写(WAW)三种类型。
5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容二、名词解释(每题2分,共16分)计算机体系结构:计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。
其中计算机理论组成部分并不单与某一个实际硬件相挂钩,如存储部分就包括寄存器、内存、硬盘等。
兼容机:兼容机,就是由不同公司厂家生产的具有相同系统结构的计算机。
简单点说,就是非厂家原装,而改由个体装配而成的机器,其中的元件可以是同一厂家出品,但更多的是整合各家之长的计算机。
写直达法:写直达法一般指全写法。
全写法(write-through):又称写直达法、写穿法,透写法,Cache使用方式之一。
高速缓冲存储器:高速缓冲存储器(Cache)其原始意义是指存取速度比一般随机存取记忆体(RAM)来得快的一种RAM,一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM技术,也有快取记忆体的名称。
高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成,容量比较小但速度比主存高得多,接近于CPU的速度。
在计算机存储系统的层次结构中,是介于中央处理器和主存储器之间的高速小容量存储器。
它和主存储器一起构成一级的存储器。
高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
填空题
1.从2002年以来,计算机性能的年增长率下降到了约30%。
其主要原因是:①大功耗问题;②可以进一
步有效地开发的指令级并行性已经很少;③存储器访问速度的提高缓慢。
2. 可移植性是指一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。
实现可移植性的常用方法有3种:系列机,模拟和仿真,统一高级语言。
2.通用寄存器型指令集结构计算机在灵活性和提高性能方面有明显的优势。
主要体现在①寄存器的访问
速度比存储器快;②对编译器而言,能更加容易有效地分配和使用寄存器;③寄存器可以用来存放变量。
3.MIPS的数据寻址方式只有立即数寻址和偏移量寻址。
4.向量处理机的结构由所采用的向量处理方式决定。
有两种典型的结构;存储器-存储器型结构和寄存器-
寄存器型结构。
5.Cache-主存层次的工作由硬件实现,对系统程序员是透明的。
6.降低Cache不命中率最直接的方法是增加Cache的容量。
不过,这种方法不但会增加成本,而且还可
能增加命中时间,这种方法在片外Cache中用得比较多。
7.大多数磁盘阵列的组成可以由以下两个特征来区分:数据交叉存放的粒度、冗余数据的计算方法以及在
磁盘阵列中的存放方式。
8.时延和带宽是用来评估互连网络性能的两个基本指标。
时延包括通信时延和网络时延。
9.计算机系统可分为SISD、SIMD、MISD和MIMD四类,许多早期并行处理机是SIMD计算机,近年
来,MIMD已经成为通用多处理机系统结构的选择。
这是因为MIMD具有灵活性,并且MIMD能充分利用现有微处理器的性价比优势。
判断题
1.从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中,第2级是操作系统虚
拟机,第3级是汇编语言虚拟机。
(错)
2.计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因素,加快硬件周转而赢
得时间。
(错)
3.指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指令的CPI。
(对)
4.指令条数多,通常超过200条,是设计RISC的原则之一。
(错)
5.根据流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线性流水线。
(对)
6.在多级存储体系中,“主存一辅存”层次的存储管理实现主要由软件实现。
(对)
7.失效率和平均访存时间都可评价存储系统的性能,它们都和机器的硬件速度有关。
(错)
8.RAID的特点有容量大,速度快、可靠性高,同时保存数据无冗余信息。
(对)
9.在多处理机的互连网络中,交叉开关网络属于动态互连网络。
(对)
10.机群是一种价格低廉、易于构建、可扩缩性极强的并行计算机系统。
(对)
名词解释
1.RISC
精简指令集计算机是一种执行较少类型计算机指令的微处理器
2.请求字优先
调块时,首先向存储器请求CPU所要的请求字。
请求字一旦到达,就立即送往CPU,让CPU继续执行,同时从存储器调入该块的其余部分。
3.单一系统映像
包含四重含义。
(1)单一系统。
尽管系统中有多个处理器,用户仍然把整个机群视为一个单一的计算系统来使用。
(2)单一控制。
逻辑上,最终用户或系统用户使用的服务都来自机群中唯一一个位置。
(3)对称性。
用户可以从任一个结点上获得机群服务,也就是说,对于所有结点和所有用户,除了那些具有特定访问权限的服务与功能外,所有机群服务与功能都是对称的。
(4)位置透明。
用户不必了解真正提供服务的物理设备的具体位置。
4.阵列处理机
阵列处理机也称并行处理机(Parallel Processor)通过重复设置大量相同的处理单元PE,将它们按一定方式互连成阵列,在单一控制部件CU控制下,对各自所分配的不同数据并行执行同一组指令规定的操作,操作级并行的SIMD计算机,它适用于矩阵运算。
5.数据驱动计算
一种提前计算的策略只在当某一个函数需要用到某一个自变量时才驱动对该自变量的求值操作。
按需求值,是一种滞后计算的策略。
数据流计算机中驱动方式的一种.
简述题
1.MIPS指令实现的简单数据通路中,操作分成了哪5个时钟周期?对MIPS的寄存器一寄存器ALU指令
和store指令请各写出一条具体指令,并列出它们在在各个时钟周期的具体操作。
答:5个时钟周期:①取指令②指令译码/读寄存器③执行/有效地址计算④存储器访问/分支完成⑤写回2.简述降低Cache失效率的方祛和原理。
计算题
1.计算机系统中有三个部件可以改进,这三个部件的部件加速比为:
部件加速比1=30;部件加速比2=20;部件加速比3=10
(1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?
(2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?
解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:
∑∑+-=i i
i n S F F S )1(1
已知S1=30,S2=20,S3=10,Sn =10,F1=0.3,F2=0.3,得:
)
()(10/20/0.330/0.30.30.3-111033F F +++++= 得F3=0.36,即部件3的可改进比例为36%。
(2)设系统改进前的执行时间为T ,则3个部件改进前的执行时间为:(0.3+0.3+0.2)T = 0.8T ,不可改进部分的执行时间为0.2T 。
已知3个部件改进后的加速比分别为S1=30,S2=20,S3=10,因此3个部件改进后的执行时间为: T T T T T n 045.010
2.020
3.0303.0'=++= 改进后整个系统的执行时间为:Tn = 0.045T+0.2T = 0.245T
那么系统中不可改进部分的执行时间在总执行时间中占的比例是:
82.0245.02.0=T
T
2. 有一个5段流水线,各段执行时间均为△t.其预约表如下
(1)画出流水线任务调度的状态转移图。
(2)分别求出允许不等时间间隔调度和等时间间隔调度的两种最优调度策略,以及这两种调度策略的流水线最大吞吐率。
(3)若连续输入10个任务,求这两种调度策略的流水线实际吞吐率和加速比。
解:(1)根据初始冲突向量的构成方法,对预约表各行中打“×”的拍数求出差值,除去重复的后汇集在一起,即得到延迟禁止表为F ={1,3,6}。
由F 可得到初始冲突向量为:
C0 =(100101)
根据后继冲突向量的递推规则Cj = SHR (k )(Ci )∨C0则可得出所有的后继状态,具体有: C0三个后继状态:C1 =SHR (2)(C0)∨C0 = 101101 5
C2 =SHR (4)(C0)∨C0 = 100111
C3 =SHR (5)(C0)∨C0 = 100101= C0 4 2
5 5
C1二个后继状态:C4 =SHR (2)(C1)∨C0 = 101111 C5 =SHR (5)(C1)∨C0 = 100101=C0 5
C2二个后继状态:C6 =SHR (4)(C2)∨C0 = 100111=C2 4 2
C7 =SHR (5)(C2)∨C0 = 100101=C0
C4一个后继状态:C8 =SHR (5)(C4)∨C0 = 100101=C0
由后继状态和引起状态转移的时间间隔可得到状态有向图如上图所示。
(2)
(3)由状态转移有向图可得到无冲突的任务调度策略及其平均延迟时间,如下表所示。
调度策略 平均延迟时间 特别地,从C0出发的[4,(4)]也是一个任务
(2,5) (2+5)△t/2 = 3.5△t 调度策略,除第一条有向弧外,第二条有向弧是一
(4,5) (4+5)△t/2 = 4.5△t 个环路,该调度策略为(4)。
从表中可以得到平均
(5) 5△t 延迟时间最小的等间隔和不等间隔的调度策略为
(2,2,5) (2+2+5)△t/3 = 3△t [4,(4)]和(2,2,5),相应的最小平均延迟时
4,(4) 4△t 间为4△t 和3△t ,所以流水线的最大吞吐率为:
100101 C 0 100111 C 2
101101 C 1 101111 C 4
TPAmax = 1/(4△t)= 0.25/△t TPBmax = 1/(3△t)= 0.33/△t
(3)按等间隔最优调度策略[4,(4)]连续输入10个任务时,流水线的实际吞吐率为:
TP = 10/[(4 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 4 + 7)△t] = 10/43△t 按不等间隔最优调度策略(2,2,5)连续输入10个任务时,流水线的实际吞吐率为:
TP = 10/[(2 + 2 + 5 + 2 + 2 + 5 + 2 + 2 + 5 + 7)△t] = 5/17△t。