计算机系统结构 第六章练习答案

合集下载

(完整版)计算机系统结构课后习题答案

(完整版)计算机系统结构课后习题答案

第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。

这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。

虚拟机:用软件实现的机器。

翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。

执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。

Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。

程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执行的平均时钟周期数。

测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器一旦启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。

系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。

计算机系统结构课后习题答案

计算机系统结构课后习题答案

计算机系统结构课后习题答案第1章计算机系统结构的基本概念1.1 解释下列术语层次机构:按照计算机语⾔从低级到⾼级的次序,把计算机系统按功能划分成多级层次结构,每⼀层以⼀种不同的语⾔为特征。

这些层次依次为:微程序机器级,传统机器语⾔机器级,汇编语⾔机器级,⾼级语⾔机器级,应⽤语⾔机器级等。

虚拟机:⽤软件实现的机器。

翻译:先⽤转换程序把⾼⼀级机器上的程序转换为低⼀级机器上等效的程序,然后再在这低⼀级机器上运⾏,实现程序的功能。

解释:对于⾼⼀级机器上的程序中的每⼀条语句或指令,都是转去执⾏低⼀级机器上的⼀段等效程序。

执⾏完后,再去⾼⼀级机器取下⼀条语句或指令,再进⾏解释执⾏,如此反复,直到解释执⾏完整个程序。

计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种⾓度看⼜好像不存在的概念称为透明性。

计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。

系统加速⽐:对系统中某部分进⾏改进时,改进后系统性能提⾼的倍数。

Amdahl定律:当对⼀个系统中的某个部件进⾏改进后,所能获得的整个系统性能的提⾼,受限于该部件的执⾏时间占总执⾏时间的百分⽐。

程序的局部性原理:程序执⾏时所访问的存储器地址不是随机分布的,⽽是相对地簇聚。

包括时间局部性和空间局部性。

CPI:每条指令执⾏的平均时钟周期数。

测试程序套件:由各种不同的真实应⽤程序构成的⼀组测试程序,⽤来测试计算机在各个⽅⾯的处理性能。

存储程序计算机:冯·诺依曼结构计算机。

其基本点是指令驱动。

程序预先存放在计算机存储器中,机器⼀旦启动,就能按照程序指定的逻辑顺序执⾏这些程序,⾃动完成由程序所描述的处理⼯作。

计算机系统结构(第三版)张晨曦 课后答案

计算机系统结构(第三版)张晨曦 课后答案
i
fi Si
−1
式中,fi 为可加速部件 i 在未优化系统中所占的比例;Si 是部件 i 的加速比。
⎧ f ⎫ f f S = ⎨[1 − ( f1 + f 2 + f 3 )] + 1 + 2 + 3 ⎬ S S S 1 2 3⎭ ⎩
0.3 0.3 f 3 ⎫ ⎧ 10 = ⎨[1 − (0.3 + 0.3 + f 3 )] + + + ⎬ 30 20 30 ⎭ ⎩

45000 × 1 + 75000 × 2 + 8000 × 4 + 1500 × 2 = 1.776 129500

案 网
计算机体系结构 • 第一章 • 第4页
⎡ f ⎤ Te = To ⎢(1 − f e ) + e ⎥ S e⎦ ⎣
S=
1 (1 − f e ) +
fe Se
S=
i
1 (1 − ∑ f i ) + ∑
对于第三级而言,为了完成 IC 条指令的功能,第三级指令的条数为: 执行第三级
IC 。为了 M2
IC IC 条指令,需要执行 N 条第二级的指令对其进行解释。那么对第二级 2 M M2 IC IC + 2N 2 M M
而言,总的指令条数为:
N⎤ ⎡ = ⎢1 + ⎥ K ⎣ M⎦ N⎤ ⎡ T4 = ⎢1 + ⎥ K ⎣ M⎦
1.5 计算机系统有三个部件可以改进,这三个部件的加速比如下: 部件加速比 1=30; 部件加速比 2=20; 部件加速比 3=10; (1) 如果部件 1 和部件 2 的可改进比例为 30%,那么当部件 3 的可改进比例为多少时, 系统的加速比才可以达到 10? (2) 如果三个部件的可改进比例为 30%、30%和 20%,三个部件同时改进,那么系统 中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:在多个部件可改进情况下 Amdahl 定理的扩展:

计算机系统结构试题6附答案

计算机系统结构试题6附答案

第一部分选择题一、单项选择题(每小题1分,共10分)在每小题的四个备答案中有一个正确的答案,将正确答案的序号写在题干后的括号内)1.计算机使用的语言是( B )A.专属软件范畴,与计算机体系结构无关B.分属于计算机系统各个层次C.属于用以建立一个用户的应用环境D.属于符号化的机器指令2.动态数据流机最突出的特点是使( C )A.数据流令牌无标号B.需要程序记数器来实现C.令牌带上标号D.同步由门(Latch)寄存器来实现3.多处理机上两个程序段之间若有先写后读的数据相关,则( B )A.可以并行执行B.不可能并行C.任何情况均可交换串行D.必须并行执行4.多处理机的各自独立型操作系统( D )A.要求管理程序不必是可再入的B.适合于紧耦合多处理机C.工作负荷较平衡D.有较高的可靠性5.输入输出系统硬件的功能对( B )是透明的。

A.操作系统程序员B.应用程序员C.系统结构设计人员D.机器语言程序设计员6.“启动I/O”指令是主要的输入输出指令,是属于( B )A.目态指令B.管态指令C.目态、管态都能用的指令D.编译程序只能用的指令7.全相联地址映象是指( A )A.任何虚页都可装入主存中任何实页的位置B.一个虚页只装进固定的主存实页位置C.组之间是固定的,而组内任何虚页可以装入任何实页位置D.组间可任意装入,组内是固定装入8.( C )属于MIMD系统结构。

A.各处理单元同时受同一个控制单元的管理B.各处理单元同时接受同一个控制单元送来的指令C.松耦合多处理机和多计算机D.阵列处理机9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10号处理机与第( D )号处理机相联。

A.11B.8C.14D.210.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( A )A.可获得高的吞吐率和效率B.流水线的效率和吞吐率恶化C.出现瓶颈D.可靠性提高第二部分非选择题二、填空题(每空1分,共20分)11.标志符与每个数据相连,合存于_同一存储单元__,用于描述单个数据的___类型特征___。

操作系统第六章习题及答案

操作系统第六章习题及答案

1、 假定盘块的大小为1KB ,硬盘的大小为500MB,采用显式链接分配方式时,其FAT 表需占用多少存储空间?如果文件A 占用硬盘的第11、12、16、14四个盘块,试画出文件A 中各盘块间的链接情况及FAT 的情况。

(假定FAT 表项的长度通常取半个字节的整数倍)。

提示:FAT 表项数目由磁盘的物理盘块数决定,而表项的长度有磁盘系统的最大盘块号决定。

根据题意,该硬盘共有500K 个盘块,故FAT 中共有500K 个表项,若盘块从1开始编号,为了能保存最大的盘块号500K ,该FAT 表项最少需要19位,将它扩展为半个字节的整数倍后,可知每个FAT 表项需要20位,即2.5个字节。

因此,FAT 需占用的存储空间为2.5*500KB=1250KB.文件A 中各盘块间的链接情况及FAT 的情况2、 请分别解释在连续分配方式、隐式链接分配方式、显式链接分配方式和索引分配方式中如何将文件的字节偏移量3500转换为物理块号和块内位移量。

(设盘块大小为1KB,盘块号需4个字节。

)提示:先将字节偏移量转换成逻辑块号和块内位移量。

(1) 连续分配方式:字节偏移量3500转换成逻辑块号和块内位移量为3500/1024=3 (428)可从相应文件的FCB 中得到分配给该文件的起始物理盘块号,假设为a0,字节偏移量3500相应的物理块号为a0+3,块内位移量为428。

(2) 隐式链接分配方式:由于每个盘块中需要留出4个字节来存放分配给文件的下一个盘块的块号,因此字节偏移量3500的逻辑块号为3500/1020=3 (440)从相应文件的FCB 中可获得分配给该文件的首个(即第0个)盘块的块号,如b0,然后可通过读第b0块获得分配给文件的第1个盘块的块号,如b1;在从b1块中得到第2块的块号,如b2;从b2块中得到第3块的块号,如b3。

因此可得到字节偏移量3500对应的物理块号b3,而块内偏移量为440。

(3) 显式链接分配方式:字节偏移量3500转换成逻辑块号和块内位移量为3500/1024=3 (428)可从相应文件的FCB 中得到分配给该文件的首个物理盘块的块号,如c0,然后从FAT 表的第c0项中得到分配给文件的第一个盘块的块号,如c1;再在FAT 表的第c1项中得到分配给文件的第2个盘块的块号c2;在FAT 表的第c2项中得到分配给文件的第3个盘块的块号c3。

计算机系统结构作业答案

计算机系统结构作业答案

计算机系统结构计算机系统结构作业1第1章计算机系统结构的基本概念一、解释下列术语:计算机系统结构;计算机组成;计算机实现;透明性;系列机;软件兼容;兼容机;模拟;仿真;虚拟机;宿主机;Amdahl定律;CPI;MIPS;MFLOPS。

【答案】计算机系统结构、计算机组成和计算机实现是三个不同的概念。

系统结构定义为由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性,这里的程序设计者所看到的计算机属性是指为机器语言或编译程序设计者所看到的计算机属性,是硬件子系统的概念性结构及其功能特性,它是计算机系统的软、硬件的界面。

计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流和控制流的组成以及逻辑设计等。

计算机实现是指计算机组成的物理实现。

透明性:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,成为透明性现象。

所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。

不同公司厂家生产的具有相同系统结构的计算机称为兼容机。

软件兼容:在新的计算机系统出台后,原先已开发的软件仍能继续在升档换代的新型号机器上使用,这就是软件兼容。

系列机方法能够在具有相同系统结构的各种机器之间实现软件移植,为了实现软件在不同系统结构的机器之间的相互移植,可以采用模拟和仿真。

模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。

仿真是指用微程序直接解释另一种机器指令系统的方法。

虚拟机是被模拟的机器;宿主机是进行模拟的机器。

Amdahl 定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。

Fe=(改进前可改进部分占用的时间)/(改进前整个任务的执行时间) Se=(改进前可改进部分的执行时间)/(改进后改进部分的执行时间) 则,改进后整个系统加速比为ee e n S F F s /)1(1+-=。

计算机系统结构__《张晨曦、王志英》课后习题参考答案

计算机系统结构__《张晨曦、王志英》课后习题参考答案
CPI:每条指令执行的平均时钟周期数。
测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的处理性能。
存储程序计算机:冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中,机器一旦启动, 就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。
异构型多处理机系统:由多个不同类型、至少担负不同功能的处理机组成,它们按照作业要求的顺序,利用时间重叠 原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。
同构型多处理机系统:由多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个 任务。
1.2 试用实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。 答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构。确定主存周期、逻辑上 是否采用并行主存、逻辑设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计等属于计算机实现。 计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种体系结构可以有多种组成。 一种组成可以有多种实现。
1.3 计算机系统结构的 Flynn 分类法是按什么来分类的?共分为哪几类? 答:Flynn 分类法是按照指令流和数据流的多倍性进行分类。把计算机系统的结构分为: (1) 单指令流单数据流 SISD (2) 单指令流多数据流 SIMD (3) 多指令流单数据流 MISD (4) 多指令流多数据流 MIMD
计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。
在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。
计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。

第六章习题答案.doc

第六章习题答案.doc

第六章习题答案一、单选题1.存储单元是指______C____。

A、存放一个二进制信息位的存贮元B、存放一个机器字的所有存贮元集合C、存放一个字节的所有存贮元集合D、存放两个字节的所有存贮元集合2.计算机系统中的存贮器系统是指_______D___。

A、RAM存贮器B、ROM存贮器C、主存贮器D、主存贮器和外存贮器3.主存贮器和CPU之间增加cache的目的是_____A_____。

A、解决CPU和主存之间的速度匹配问题B、扩大主存贮器容量C、扩大CPU中通用寄存器的数量D、既扩大主存贮器容量,又扩大CPU中通用寄存器的数量4.存储器是计算机系统的记忆设备,它主要用来______C____。

A、存放数据B、存放程序C、存放数据和程序D、存放微程序5.采用虚拟存贮器的主要目的是___B___。

A、提高主存贮器的存取速度B、扩大主存贮器的存贮空间,并能进行自动管理和调度C、提高外存贮器的存取速度D、扩大外存贮器的存贮空间6.静态存储单元是一个双稳态触发器,每个触发器储存一个_____A_____进制位。

A、二B、八C、十六D、十7.____C______读写选择线分开,并且要另加刷新电路。

这样,存储器和外加电路的连接增加了,外加电路本身也增加了。

A、4管动态RAMB、单管动态RAMC、3管动态RAMD、静态RAM8.段是用户定义的虚拟地址空间的一部分。

段的长度是______A____。

A、可变的B、不可变,长为4kC、不可变,长为4MD、不可变,长为4G9.每个段由3个参数进行定义,其中不是段的参数的是____B______。

A、段基地址B、线性地址C、段界限D、段属性10.通过在线性地址空间的页与物理地址空间的页之间建立的映射,分页管理实现___C_______的转换。

A、物理地址到线性地址B、逻辑地址到线性地址C、线性地址到物理地址D、线性地址到逻辑地址二、判断题1.外存储器直接参与计算机的运算,它存放CPU当前不使用的程序和数据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章向量处理机.在大型数组的处理中常常包含向量计算,按照数组中各计算相继的次序,我们可以1把向量处理方法分为哪三种类型?纵横处理方式纵向处理方式,横向处理方式,横向处理方式:向量计算是按行的方式从左至右横向的进行纵向处理方式:向量计算是按列的方式自上而下纵向的进行纵横处理方式:横向处理和纵向处理相结合的方式.解释下列与向量处理有关的术语。

2为了使向量硬件设备和标量设备的利用率相等,一个程序)向量和标量的平衡点:(1中向量代码所占的百分比)用户代码的向量化比值:用户代码可向量化的部分占全部的比重2(将标量运算进行向量化或者将向量运算进行适当的修改3)向量化编译器或量化器:(使之能够进入向量处理进行向量处理的编译器3.简要叙述提高向量处理机性能的常用技术1)链接技术(2)向量循环或分段开采技术(3)向量递归技术(4)稀疏矩阵的处理技术(4.下述的几个需要解决的问题中,那个是向量处理机所最需要关心的?计算机指令的优化技术A.设计满足运算器带宽要求的存储器B.如何提高存储器的利用率,增加存储器系统的容量C.纵横处理方式的划分问题D.速度,1Mflops假设系统在向量模式下面能够达到9Mflops,在标量模式下能够达到5.而代码的90%是向量运算,10%是标量运算,这样花在两种模式上的计算时间相等。

那么向量平衡点是:A.0.1 一个程序中向量代码所占的百分比D.以上都不是6.查看下面三条指令:V3←AV2←V0+V1V4←V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。

三条指令全部采用串行的方法,那么执行的时间是:+20 +21+22 +237.下面一组向量操作能分成几个编队?假设每种流水功能部件只有一个。

LV V1,Rx ;取向量MULTSV V2,F0,V1 ;向量和标量相乘Y取向量; ,Ry V3 LVADDV V4,V2,V3 ;加法SV Ry,V4 ;存结果可以划分成四个编队:(1)LV (2)MULTSV LV (3)ADDV (4)SV8.在一台向量处理机上实现A=B×s操作,其中A和 B是长度为200的向量,s是一个标量。

向量寄存器长度为64。

功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。

总的执行时间是?9.简述三种向量处理方式,他们对向量处理机结构要求有什么不同。

解:水平处理方式:向量长度为N,则水平处理方式相当于执行N次循环。

不适合对向量进行流水处理。

(或者叫做横向处理方式)垂直处理方式:将整个向量按相同的运算处理完毕之后,再去执行其他的运算,适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入输出端直接与存储器相联,构成M-M型的运算流水线。

分组处理方式:把长度为N的向量分为若干组,每组按照纵向处理10.解释下列与向量处理有关的术语。

(1)向量规约指令(2)收集和散播指令解:(1)将向量化转化为标量的指令(2)收集指令可以把非连续存储单元的内容传送到向量寄存器组中若干个连续的寄存器;散播指令与此相反。

他们用于稀疏矩阵的存储与运算,可以节省空间。

11. 查看下面三条指令:V3←AV2←V0+V1V4←V2*V3假设向量长度小于64,且前后其他的指令均没有相关性,数据进入和流出每个功能部件,包括访问存储器都需要一拍的时间,假设向量的长度为N。

三条指令采用链接的方法,那么执行的时间是:+22 +15+16+1712.在一台向量处理机上实现A=B×s操作,其中A和 B是长度为200的向量,s是一个标量。

向量寄存器长度为64。

功能部件的启动开销为:取数和存数部件为12个时钟周期,乘法部件为7个时钟周期,加法部件为6个时钟周期。

那么一个结果元素的平均执行时间(包括启动开销)为:A.3.7 某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功能部件时间为3拍。

采求。

(D+E)*F接着计算在流水线不停的情况下,(A+B)*C,先计算的链接技术,CRAY-1用类似此链接流水线的通过时间是多少拍?1拍)(设寄存器出入各需14.名词解释向量流水处理机解:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。

向.某向量处理机有16个向量寄存器,其中V0-V5种分别存放有向量A,B,C,D,E,F,15向量各元素均为浮点数;处理部件采用两个单功能流水线,加法功能部件时量的长度是8,在流拍,乘法功能部件时间为3拍。

采用类似的链接技术,先计算(A+B)*C,CRAY-1间为2完成这些计算并且把结果存进相。

每拍时间是50ns,水线不停的情况下,接着计算(D+E)*F 1拍)应的寄存器,此处理部件实际吞吐率是多少MFLOPS?(设寄存器出入各需也可以以向量一台单处理机可以以标量方式运行,.设某基准程序在此计算机上运行倍。

在向量方式情况下,计算可比标量方式快9方式运行。

用于向量方式,其余机器时间则以标量方式运行。

请计算25%。

另外,已知T的的时间是T并计算上述程序中向量化代码所占在上述条件下与完全不用向量方式条件下相比的加速比,的百分比。

=*9+*1)/T=3加速比= ,所以完全不用向量方式执行该段代码用时T中向量化代码所占的时间为,则串行代码用时==由于=3T/T=3. +9*=3T, 因此加速比.Amdahl定律根据一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速17.RR。

设α是该计算机的典型程为度;另一种是标量方式,执行速度为10Mflops1Mflops sv那么向量化百分比应该序代码中可以向量化部分的百分比。

如果要使平均执行的速度达到,多大?1/[a/Rv+(1-a)/Rs]=a=所以拍,乘法需要是标量寄存器,加法需要6.在CARY1机器上,设向量长度均为32,s18拍。

则拍,打入寄存器及启动功能部件(包括寄存器)各需要17拍,从存储器读数需要6:下面的指令组完成所需要的拍数是6打入1,启动1,读数V3←存储器←V2V0+V1s0←s2+s3V3←V1×V48+31+9+31(括号中给出相应功能部件的时机器上,链接方式执行下面4条向量指令19.在CRAY-1拍,试求此链接流水线的流过时间间),如果向量寄存器和功能部件之间的数据传输需要1为多少拍?拍)97V0←存储器(存储器取数拍)5 V0+V1 (向量加3V1←拍)64(按照←V3V2<A3 A3左移V5←V3∧V4 (向量逻辑乘2拍)4一台单处理机可以以标量方式运行,也可以以向量方式运行。

在向量方式情况下,20.的T。

另外,已知T计算可比标量方式快18倍。

设某基准程序在此计算机上运行的时间是用于向量方式,其余机器时间则以标量方式运行。

那么在上述条件下与完全不用向量方25%式的条件下相比的加速比是:以上均不正确1/[18+1]一台向量计算机一次只能以下述两种方式中的一种运行:一种是向量方式,执行速21.RR。

设α是该计算机的典型程1Mflops度为为10Mflops;另一种是标量方式,执行速度sv序代码中可以向量化部分的百分比。

求平均执行速度的计算公式。

1/[a/Rv+(1-a)/Rs]=10/(10-9a)22.向量处理机有那两种最基本的结构?存储器--存储器结构寄存器--寄存器结构23.研制高性能的向量处理机主要需要解决哪几个问题?(1)较好的维持向量/标量性能平衡(2)可扩展性随处理机数目的增加而提高(3)增加存储器系统的容量和性能(4)提供高性能的I/O和易访问的网络24.为了提高向量处理机的性能,会采用一些特殊的技术,下面那一项不是提高向量处理机性能而采用的技术?A.链接技术B.向量递归技术缓存技术D.稀疏矩阵的处理技术25.在CARY1机器上,设向量长度均为32,s是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。

则下面的指令组完成所需要的拍数是:V0←存储器V2←V0+V1V3←V2×V1V5←V3×V426.若要进行向量运算D=A×(B+C),假设向量长度N<64,且B和 C已经存至V0和V1,则下面三条指令就可以完成上述的运算。

V3←A (6拍)V2←V0+V1 (6拍))拍(7V3 ×V2←V4.)。

读写各需1拍分别求三条指令全部用串行的方法和链接技术执行的时间(是向量,最初Y和X+Y,其中X27.在某台向量处理机上执行DAXPY代码,即完成Y=a×是一个标量,他们的向量指令如下:存放在内存,a取向量 ;LV V1,Rx标量和向量相乘V2,F0,V1 ;MULTSVY ;取向量LV V2,Ry相加 ;ADDV V4,V2,V3存结果 ;SV Ry,V4向量长度,6拍乘法需要7拍,加法需要求总的执行时间。

假设其中存取数需要12拍,。

是n 28.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么最大性能是多少?A. 90MFLOPSB. 80MFLOPS MFLOPS D. 100MFLOPS29.假设某向量处理机上执行DAXPY代码所需要的时钟周期是4n+64,其中n是向量长度,时钟频率是200MHz,那么半性能向量长度是:A.12.830.日本FOCOM向量处理机VP-200具有流水线链接和并行化功能。

它有2条存储流水线到向量寄存器,两者可以并行工作。

此外尚有加法和乘法流水线。

各流水线间均可以链接操作。

若现在要在Vp-200向量机上实现以下的向量操作:A(I)=B(I) ×C(I)+D(I) ×E(I)+F(I) ×G(I)I=1,2,…,N。

假定所有流水线的延迟时间都相等,取/存操作转换时将有t的流水线重构延迟时间。

求完成操作所需要的时间。

所以时间为:4N+t31. 在CARY1机器上,设向量长度均为32,s是标量寄存器,加法需要6拍,乘法需要7拍,从存储器读数需要6拍,打入寄存器及启动功能部件(包括寄存器)各需要1拍。

则下面的指令组完成所需要的拍数是:V3←存储器V2←V0+V1V4←V2×V3存储器←V4n表示向量流水方式的工作速度优于标量串行方式工作时间时所需要的向量长度32.v的临界值。

请问该参数主要衡量那些标准?衡量建立时间,也衡量标量向量的速度比对性能的影响。

33.有关半性能向量长度,下面哪种说法正确?该值是最大性能的一半A.B.该值越大说明向量计算机性能越好C.该值是为达到一半最大性能所需要的向量长度D.该值必须是整数,计算的时候应该向下取整为输出线。

相关文档
最新文档