《计算机系统结构》复习题

《计算机系统结构》复习题
《计算机系统结构》复习题

计算机系统结构复习

填空(15*1分),选择(15*1分),简答题(5/6 30分),综合题(4*10分)

1、从使用语言角度,可将系统按功能划分为多层次机器级结构,层次结构分别是:应用语 ________ 言机器级、高级语言机器级、汇编语言机器级、操作系统机器级、传统机器语言机器级和微

程序机器级。

2、各机器级的实现主要靠翻译和解释或两者结合进行。翻译是先用转_________ 级上的程序整个地变换成低一级机器级上等效的程序,然后再在低一级机器级上实现的技__________ 术。解释则是_________ 能,是通过对高级的机器级语言程序中的每条语句或指令逐条解释来实现的技术。

3、计算机系统结构在计算机系统机器级层次中指传统机器级的系统结构。

4、计算机系统结构研究的是软、硬件之间的功能分配以及对传统机器级界面的确定,为机_ 器语言、汇编语言程序设计或编译程序生成系统提供使其设计或生成的程序能在机器上正确

运行应看到的遵循的计算机属性。

5、计算机系统结构的属性包括:1?数据表示、2?寻址方式、3?寄存器组织、4?指令系统、

5?存储系统组织、6?中断机构、7?系统机器级的管态和用户态的定义和切换、8?机器级的I/O

结构、9?系统各部分的信息保护方式和保护机构等。

6、机器透明性:指相对于每一机器级设计人员,都客观存在的功能或属性看不到的现象,称相对于此级设计人员来说,这些功能或属性是具有透明性,即透明的。

7、计算机组成指的是计算机系统结构的逻辑实现,包括机器级内部的数据流和控制流的组

成以及逻辑设计等。它着眼于机器级内部各事件的排序方式与控制机构、各部件的功能及各

部件间的联系。

&计算机组成设计要解决的问题是在所______________________________________________________ 各种设备各部件组织成计算机,来实现所确定的系统结构。

9、当前,计算机组成设计主要是围绕_________ 功能的分散和设置专用功能部件来进行的。

10、计算机组成设计要确定的方面一般应包括:1?数据通路宽路、 2.专用部件的设置、3?各种操作对部件的共享程度、 4.功能部件的并行度、5?控制机构的组成方式、6?缓冲和排队

技术、7.预估预判技术、8.可靠性技术等。

11、计算机实现指计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,微组装技术,信号传输,电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术,其中,器件技术在实现技术中起着主导作用。

13、软、硬件取舍的三个基本原则是:

(1).考虑在现有硬件、器件(主要是逻辑器件和存储器)条件下,系统要有高的性能价格比,主要从实现费用、速度和其他性能要求来综合考虑。

(2).考虑到准备采用和可能采用的组成技术,使它尽可能不要过多或不合理地限制各种组成、实现技术的采用。

(3).从"软”的角度考虑如何为编译和操作系统的实现以及为高级语言程序的设计提

供更多更好的硬件支持。

14、程序在系统上运行的时间应该是衡量机器时间(速度)性能最可靠的标准。

15、计算机性能诵常用峰值性能及持续性能来评价。峰值性能是指在理想情况下计算机系统可获得的最高理论性能值,它不能反映出系统的实际性能。

16、持续性能的表示有算术性能平均值、调和性能平均值和几何性能平均值三种。

17、算术性能平均值通常对系统执行时间评价;调和性能平均值与运行全部程序所需的时间成反比,比较准确地衡量计算机的时间(速度)性能;几何性能平均值是对不同机器进行性

能比较时,可以对性能采取归一化,即可以以某台机器性能作为参考标准,让其他机器的性

能与参考标准去比,不论哪台机器作参考机,几何性能平均值均能正确地反映出结果的一致性。

18、计算CPU的程序执行时间Tcpu有3个因素,即程序执行的总指令条数IC、平均每条指令的时钟周期数CPI、主时钟频率fc。

19、MIPS是机器单位时间执行指令的条数。它与时钟周期数CPI有关,CPI越少,MIPS

就越高,一定程度上反映机器的性能越好。MIPS很大程度依赖于机器的指令系统,用它很

难准确衡量指令系统不同的机器之间的性能。因此MIPS只能用于比较相同机器指令系统的

计算机之间的性能。即使是同一台机器,程序不同,其CPI也不同,其性能的差异会很大。

其次MIPS还与机器硬件有关,如浮点运算部件的机器,虽MIPS很低,但浮点运算速度会

很高,而在软件实现浮点运算机器上,MIPS虽然很高,但浮点运算速度可能很低。

MFLOPS只能反映机器执行浮点操作的性能,并不能反映机器的整体性能。

20、简述Amdahl定理?

答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的

使用频率或占总执行时间的比例有关。

Told :没有采用改进措施前执行某任务的时间

Tnew :采用改进措施后执行某任务的时间

Sp :加速比(系统改进后的性能与未改进时的性能的比值)Sp= Told/ Tnew

Fe:计算机执行某个任务的总时间中可被改进部分的时间所占比例。

r new :改进部分采用改进措施后比没有采用改进措施的性能提高倍数。(部件加速比)

21、程序访问的局部性包括时间上和空间上的两个局部性。

22、什么是时间上的局部性?

指最近将来要用到的信息很可能就是现在正在使用的信息,这是因为程序存在着循环。

23、什么是空间上的局部性?

指最近将来要用到的信息很可能与现在正在使用的信息在程序位置上是邻近的,这是因为指令通常是顺序存放、顺序执行的,数据也通常是以向量、阵列、树、表等形式簇聚地存放在一起。

24、系统结构的差异决定软件的移植工作量,要实现软件移植工量小,常采用三种方法来实现:统一高级语言、采用系列机、模拟和仿真。

25、模拟是指?仿真是指?

B机器的每条机器指令用A机器一段机器语言程序解释,如同A机器上也有B机器的指令系统一样,这种用机器语言程序解释实现软件移植的方法称为模拟.进行模拟的A机器

称为宿主机,被模拟的B机器称为虚拟机.

用微程序直接解释另一种机器指令系统的方法就称为仿真。进行仿真的机器称为宿主

机,被仿真的B机器称为目标机。为仿真所写的解释程序称为仿真微程序。

26、多级存储体系的采用是依据局部性原理原理建立,且存储速度提高,但存储体价格下降。

27、B机上的每条指令都由A机上的一段微程序解释执行称为仿—

28、流水线分为静态流水线和动态流水线。

静态:某一时间内各段只能按同一种功能连接流水。

动态:同一时间内可按不同运算或功能连接。

29、衡量浮点操作的指标是MFLOPS ,衡量指令执行速度的指标是MIPS ___ 。

30、指令系统设计的两大典型风格是CISC__ 和RISC ______________ 。

31、克服流水中的瓶颈段的两种方法是:瓶颈流水段的细分和瓶颈流水段的重复。

32、流水线中出现的3种相关是:结构相关,数据相关,控制相关。

33、系统结构的差异决定软件的移植工作量,避免软件移植瓶颈,常采用三种方法来解决,三种方

法是统一高级语言、采用系列机、模拟和仿真。

34、向量的处理三种方式有:(1)横向处理方法;(2)纵向处理方法;(3)纵横向处理方法。

35、处理器间采用单向环网时的互连函数是:PM2o或PM20。

36、以硬件为基础实现多Cache (缓存)一致性方法有:写作废法、写更新法、目录表法。

37、编址方式常分为三种,它们是_隐含编址,独立编址—和统一编址。

38、阵列处理机的基本结构分为两种:(1)分布式存储器的阵列机;(2)共享存储器的阵列机。

39、程序并行性相关性有三种,即数据相关、数据反相关、数据输出相关。

40、寻址方式的三种面向:面向主存,面向寄存器,面向堆栈。

41、指令系统的特性:

1. 规整性;

2.对称性;

3.独立性和全能性;

4.正交性;

5.可组合性;

6.可扩充性

42、中断的响应次序是在同时发生多个不同中断类的中断请求时,中断响应硬件中的排队器所决定的响应次序。

43、中断的处理次序

46、数据表示指的是能由机器硬件直接识别和引用的数据类型。

数据结构是要通过软件映像,变换成机器中所具有的数据表示来实现的。数据表示和数据结构是软,硬件的交界面。

47、自定义数据表示包括标志符数据表示和数据描述符两类;

高级数据表示:自 ________

48、在指令系统设计、发展和改进上,RISC采用:通过减少指令种数和简化指令功能来降低硬件设计的复杂度,提高指令的执行速度。

49、在指令系统设计、发展和改进上,CISC采用:进一步增强原有指令的功能以及设置更为复杂的新指令取代原先由软件子程序完成的功能,实现软件功能的硬化。

51、流水线的表示法有三种:连接图法、时空图法、预约表法。

52、定向技术法的基本思想:如果后续指令要使用前面指令的运算果值,则通过硬件专门电

路将该运算结果提前传送到有关缓冲寄存器,使后续指令得以不停顿地进入流水线。

53、衡量流水线性能的主要指标有:吞吐率、加速比和效率。

54、I/O 系统的三种控制方式:

a. 程序控制1/0(包括全软的,程序查询的,中断驱动的)

b. 直接存储器访问(DMA

c. I/O处理机方式(通道方式,外围处理机方式PPU

55、标量流水机全局性相关的处理:

(1)使用猜测法。(2)加快和提前形成条件码。(3)采取延迟转移。(4)加快短循环程序

的处理。

55. 指令系统的发展和改进:P64简答题

CISC可分别从面向目标程序,面向高级语言,面向操作系统的优化实现三个方面来叙述。

RISC:逻辑采用硬联和微程序相结合;在CPU中设置大量工作寄存器并采用重叠寄存器窗口。

56. RISC重叠寄存器窗口的作用:

(1) . 减少访存,尽量让指令在寄存器之间进行,提高执行速度,缩短指令周期,简化寻址方式和指

令格式。

(2) . 更简单有效的支持高级语言中大量出现的过程调用,减少过程调用中为保存主调过程现场,建立被调过程新现场,以及返回时恢复主调过程现场等所需的辅助操作。

(3) . 更简单,直接地实现过程中的参数传递。

57. 设计RISC机器的一般原则及可采用的基本技术是哪些?

设计RISC机器的一般原则:1.精简指令的条数;2.简化指令的格式,让指令字等长,并让所有指令都在一个机器周期执行完; 3.扩大机器中通用寄存器的个数,只让存取两类指令

可以访问,其他的指令一律只能对寄存器进行操作; 4.指令的实现以组合电路硬联实现为主,

少量指令可采用微程序解释; 5.精心设计高质量的编译程序来优化支持高级语言程序的实

现。

设计RISC机器的基本技术:1.按设计RISC机器的一般原则来精选和优化设计指令系统;

2. 逻辑上采用硬联组合电路为主,适当辅以微程序控制来实现;

3.在CPU内设置大量的寄存

器,并采用重叠寄存器组的窗口; 4.指令采用重叠和流水的方式解释,并采用延迟转移;5.

采用高速缓冲存储器Cache缓冲指令和数据。

56、将下面程序改写成不存在数据相关的形式?

Z=0

DO 10 I=1,64

X(I)=X(I)+Y(I) Z=Z+X(I)

10 CONTINUE

57、简述计算机系统结构、计算机组成和计算机实现的定义和相互关系?

答:计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性。所谓

外特性,就是计算机的概念性结构和功能特性。

计算机组成:计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流的组成

以及逻辑设计等。

计算机实现:是指计算机组成的物理实现。包括处理机、主存、等部件的物理结构,器件集成度、速度、信号传输等。

相同系统结构,可以有不同的组成;一种组成可以有多种不同的实现方法;采用不同的

系统结构会使可以采用的组成技术产生差异;组成也会影响结构。

62、向量流水处理的三种方式:

1 ?横向处理方式,又称为水平处理方式,横向加工方式等。向量计算是按行的方式从左至右横

向地进行。

2. 纵向处理方式,又称为垂直处理方式,纵向加工方式等。向量计算是按列的方式自上而下纵向

地进行。

3. 纵横处理方式,又称为分组处理方式,纵横向加工方式等。横向处理和纵向处理相结合的方

式。

63、向量链接技术:结果寄存器可能成为后继指令的操作数寄存器,两条有数据相关的向量指令并行执行,这种技术称为两条流水线的链接技术

64、实现链接的条件

(1)没有向量寄存器冲突和运算部件冲突。

(2)只有第一个结果送入向量寄存器的那一个周期可以链接。

(3)先行的两条指令产生运算结果的时间必须相等。

(4)两条向量指令的向量长度必须相等。

66、PM2I单级网络的互连函数:______________________________________________ 。

67、处理器间采用单向环网时的互连函数是:PM2o或PM2。

68、处理器间采用双向环网时的互连函数是:PM2o和PM2。

69. 开发系统结构中的并行性的途径有时间重叠,资源重复和资源共享等。

70. 计算机系统的分类

弗林?按指令流和数据流的多倍性

单指令流单数据流(SISD)

单指令流多数据流(SIMD

多指令流单数据流(MISD 多指令流多数据流(MIMD

71、什么是机群系统?什么是大规模并行机系统?

72、静态数据流机与动态数据流机主要区别在哪里?

73. VLSI的发展与应用,对逻辑设计方法产生了什么影响?举例说明器件发展是推动系统结构发展的关键因素。

器件的发展使逻辑设计已由过去传统的逻辑化简,转变成强调在满足系统结构所提出的功能要求前提下,如何能用上大批量生产的高集成度片子,提高其系统效能,缩短其研制周

期,降低其生产成本。计算机的设计也已从过去只进行全硬的逻辑设计发展到现在所用的软硬结合方法进行计算机的辅助设计和辅助制造。

74. 简要歹U出集中式串行链接/定时查询/独立请求三种总线控制方式的优缺点。同时分析硬

件产生故障时通信的可靠性。

A. 串行链接方式的优点:1.选择算法简单,用于解决总线控制分配的控制线的线数少,

只要3根,切不取决于部件的数量;2.部件的增减容易,只需简单地把它连到总线上或从总线上去掉即可,可扩充性好; 3.逻辑简单,容易通过重复设置提高可靠性。

缺点:1.对“总线可用”线及其有关电路的失效敏感; 2.由于优先级是线连固定,不

能由程序改变,不灵活; 3.受总线长度的限制,增减或移动部件也受到限制。

B. 定时查询方式的优点:1.计数器初值,部件号均可由程序设定,优先次序可由程序控制,灵活性强;2.不会因某个部件失效而影响其他部件对总线的使用,可靠性高。

缺点:1.控制线的数量多,需2+[1b N]根;2.可以共享总线的部件数受限于定时查询线的线数(编址能力),扩展性稍差;3.控制较为复杂;4.总线分配的速度取决于计数信号的频率和部件数,不能很高。

C. 独立请求方式的优点:1.总线分配速度快,所有部件的总线请求同时送到总线控制器,

不用查询;2.控制器可以使用程序可控的预定方式,自适应方式,循环方式或他们的混合方

式灵活确定下一个使用总线的部件; 3.能方便的隔离失效部件的请求。

缺点:控制线数量过大,为控制N个设备必须有2N+1根控制线,而且总线控制器要

复杂得多。

75. 引入数据表示的原则(P43)

原则一看系统的效率是否显著提高,包括实现时间和存储空间是否有显著减少,实现时间是否减少又主要看在主存和处理机之间传送的信息量是否减少。传送的信息量减少,实现时间就越少。

原则二看引入这种数据表示后,其通用性和利用率是否提高。如果只对某种数据结构的实现效率很高,而对其他数据结构的实现效率很低,或者引入这种数据表示在应用中很少用到,那么为此所耗费的硬件过多却并未在性能上得到好处,必然导致性能价格比的下降。

P33 习题1 6 ,7,10,11 第一章Amdahl 定理(大题1 个)P79 习题2 9 ,10,11,12 (第二章哈夫曼编码,大题 1 个) P109 习题 3 5 ,6,8

第三章P89 中断屏蔽位设置(大题 1 个)

P195 习题5 6 ,11

第五章P185 流水线预约表及状态图(大题 1 个)

P200 习题6 1 ,2,5 第六章P200 链接图会画(大题1 个)

40、有两台机器,它们对条件转移指令的处理采用不同的设计方案:(1)CPUA 采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行测试,以确定是否进行转移。因此实现一次条件转移要执行比较和测试两条指令。(2)CPUB 采用比较和测试两种能合在一条指令的方法,这样实现条件转移只需一条指令。假设在这两台机器的指令系统中,执行条件转移指令需 2 个时钟周期,而其他指令只需 1 个时钟周期。又假设CPUA 中,条件转移指令占总执行指令条数20%。由于每条转移指令

都需要一条比较指令,所以比较指令也将占20%。由于CPUB 在转移指令中含了比较功能,

因此它的时钟周期就比CPUA 要慢25%。问CPUA 和CPUB 哪个工作速度要快些?

41、假设FPSQR操作占整个测试程序执行时间的20%改进的一种方法是采用FPSQF硬件,使FPSQF操作的速度加快到10倍。另一种方法是使FP指令的速度提高到2倍,FP指令占整个执行时间的50%。比较两个设计方案。

42、假设要将某一执行部件改进后速度提高10倍, 改进后被改进部件执行时间占系统总运行时间的50%?问改进后,获得的加速比Sp是多少?

43、假设Cache的工作速度是主存的5倍,且Cache被访问命中的概率为90%.问:采用Cache 后,能使整个存储系统获得多高的加速比?

44、为提高某计算机运算速度,决定增加向量处理部件. 此时处理向量的速度比其通常的运算

速度要快20 倍. 现定义向量处理部件运算的时间占总时间的百分比称为可向量化百分比

(1)求出加速比和可向量化百分比之间的关系.

(2)若要得到加速比为 2.5,可向量化百分比是多少?

45、某计算机Cache能存放2000条指令.假设10%勺指令承担了90%寸间的指令访问,且知这10%指令中每条指令的执行时间相同. 如果要执行的某程序共50000 条指令,且已知其中的10%是频繁使用的?问:当计算机执行该程序时,在Cache中能访问到的指令会占多少百分比?

58、下列5条指令组成的程序在一台3段流水线处理机上执行,每一流水段上都有相关检测和分解。这3个流水段是取指令IF、取操作数OF (—个或多个)、执行EX (包括写回)。程序中ACC 为累加寄存器,M为存储器。

请画时时空图说明:(1)在程序执行中所有可能出现的相关情况,(2)避免相关发生的

调度方法。

INC R0;RO ( RO) +1

MVL ACC,R0; ACC (ACC)*(R0)

STR R1,ACC;R1(ACC)

ADD ACC,R0 ;ACC(ACC)+(R0)

STA M,ACC ;M(ACC)

59、在一台流水线处理机上执行下面程序。

11SUB R0 ,R0 ;RO0

I2LOAD R1,#8 ;R1向量长度8

I3Loop:LOAD R2,A(R1);R2A向量的第1个兀素

I4MUL R2R1;R2(R2)*(R1)

I5ADD R0,R2;RO(R0)+(R2)

16DNE R1 Loop;R1(R1)-1,若(R1) 0 转向Loop

17STORE R0,M(x);保存结果

每条指令都要经过“取指”、“译码”、“执行”、“写结果” 4个流水段,每个流水段延迟都是5ns。但在“执行”流水段LS部件和ALU部件只能其中一个工作,其中LS部件完成LOAD 和STORE操作,ALU部件完成其他操作。这两个操作部件的输出端和输入端有直接输出通路相互切换连接,且ALU部件产生的条件码也直接送入控制器。假定采用静态分支预测技术,每次都预测转移不成功。要求:

(1 )画出指出指令流水线的时空图(中间部分可省略,图中可用指令序号表示)

(2 )计算流水线的吞吐率和加速比,并分别计算译码部件和ALU部件的使用效率。

(2)画出调度流水线的状态图;

(3)求流水线的最小启动循环和最小启动距离;

(4)求平均启动距离最小的恒定循环。

(5)按最小启动距离调度任务时,有10个任务进入流水,画出时空图,计算实际吞吐率。

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示: (1 用两给出条指 (1) (24? 变八级流水线(细分) ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。

(2) (3)重复设置部件 吞吐率提高倍数= t t ??2310 75 =1.64 3.5 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 +B 4;再计算由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。 段23 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

计算机系统结构网上作业

计算机系统结构作业参考答案 一、 1、试述现代计算机系统的多级层次结构。 计算机系统具有层次性,它由多级层次结构组成。从功能上计算机系统可分为五个层次级别:第一级是设计级。这是一个硬件级,它由机器硬件直接执行。 第二级是一般机器级,也称为机器语言级。它由微程序解释系统.这一级是硬件级。 第三级是操作系统级,它由操作系统程序实现。这些操作系统由机器指令和广义指令组成,这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。 第四级是汇编语言级。它给程序人员提供一种符号形式的语言,以减少程序编写的复杂性。这一级由汇编程序支持执行。 第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。 答:一般原则: (1)确定指令系统时,只选择使用频度很高的指令及少量有效支持操作系统,高级语言及其它功能 的指令,大大减少指令条数,一般使之不超过100条; (2)减少寻址方式种类,一般不超过两种; (3)让所有指令在一个机器周期内完成; (4)扩大通用寄存器个数,一般不少于32个,尽量减少访存次数; (5)大多数指令用硬联实现,少数用微程序实现; (6)优化编译程序,简单有效地支持高级语言实现。

基本技术: (1)按RISC一般原则设计,即确定指令系统时,选最常用基本指令,附以少数对操作系统等支持最有用的指令,使指令精简。编码规整,寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现,功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即:为了减少访存,减化寻址方式和指令格式,简有效地支持高级语言中的过程调用,在RISC机器中设有大量寄存嚣,井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令,即可让本条指令执行与下条指令预取在时间上重叠。另外,将转移指令与其前面的一条指令对换位置,让成功转移总是在紧跟的指令执行之后发生,使预取指令不作废,节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配,减少访存次数。不仅要利用常规手段优化编译,还可调整指令执行顺序,以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别 (1)全相连映像 主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分,Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同,Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关,Cache必须对每个块和块自身的地址加以存储。当请求数据时,Cache控制器要把请求地址同所有的地址加以比较,进行确认。 (2)直接映像 把主存分成若干区,每区与Cache大小相同。区内分块,主存每个区中块的大小和Cache 中块的大小相等,主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中,即相同块号的位置。主存地址分为三部分:区号、块号和块内地址,Cache地址分为:块号和块内地址。直接映像方式下,数据块只能映像到Cache中唯一指定的位置,故不存在替换算法的问题。它不同于全相连Cache,地址仅需比较一次。 (3)区别: 全相连映像比较灵活,块冲突率低,只有在Cache中的块全部装满后才会出现冲突,Cache 利用率高。但地址变换机构复杂,地址变换速度慢,成本高。 直接映像的地址变换简单、速度快,可直接由主存地址提取出Cache地址。但不灵活,块冲突率较高,Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成?

计算机系统结构专业简历

计算机系统结构专业简历 写简历时:使用语言力求平实、客观、精炼,篇幅视工作所限为1-2页,工作年限5年以下,通常以1页为宜;工作年限在5年以上,通常为2页。以下是小编为大家搜集整理提供到的计算机系统结构专业简历内容,希望对您有所帮助。欢迎阅读参考学习! 计算机系统结构专业简历俞xx 一年以上工作经验|男|25岁(1991年7月17日) 居住地:南京 电话:138*******(手机) E-mail:XXX 最近工作[7个月] 公司:XX有限公司 行业:网络游戏 职位:游戏策划师 最高学历 学历:本科 专业:计算机系统结构 学校:南京理工大学 自我评价 本人品行端正,谦虚谨慎,吃苦耐劳,综合素质好。交际、沟通能力较强,拥有创新思维,有团队精神并能承受较大的工作

压力。性格直爽、乐观、自信的我,为人坦城、做事认真、接受与理解力强,爱好唱歌、爬山等。对于自己要做的事情一定会尽心尽力尽职尽责将其做到最好,不管在任何环境下都能用最短的时间去适应。 求职意向 到岗时间:可随时到岗 工作性质:全职 希望行业:网络游戏 目标地点:南京 期望月薪:面议/月 目标职能:游戏策划师 工作经验 2015/2 – 2015/9:XX有限公司[7个月] 所属行业:网络游戏 策划部游戏策划师 1.参与项目的战斗设计,完成第二版角色动作、技能、战斗打击效果设计及跟进。 2.参与部分关卡设计,包括场景排布和怪物场景内刷新规则,怪物AI和技能的设计。 3.针对项目第二版新手引导流程设计与优化,对项目各个系统功能的BUG测试修复以及体验优化。 2014/6 – 2015/1:XX有限公司[7个月] 所属行业:网络游戏

华科专升本计算机系统结构-作业全

第一章作业 简答题 1、简述什么是计算机系统结构。 2、答:计算机系统结构是程序员所看到的计算机属性,即概念性结构与功能性结构。 3、 4、计算机系统的层次从下到上包括哪些? 5、答:计算机系统的层次从上到下包括微程序机器级、机器语言、操作系统虚拟机、汇编 语言虚拟机、高级语言虚拟机、应用语言虚拟机。 6、 7、Flynn分类法是以什么对计算机系统进行分类分成哪几类? 8、答:Flynn分类法是以指令流和数据流的多倍性对计算机系统进行分类。Flynn分类法 把计算机系统的结构分为以下4类:单指令流单数据流、单指令多数据流、多指令流单数据流、多指令流多数据流。 9、 10、简述Amdahl定律及加速比计算公式。 答:Amdahl定律指出加快某部件执行速度所能获取得系统性加速比,受限于该部件的执行时间占系统中总执行时间的百分比。 加速比计算公式=系统性能(改进后)/系统性能(改进前)=总执行时间(改进前)/总执行时间(改进后) 计算题 5、如果某一些计算任务用向量方式求解比用标量方式求解快20倍。为达到加速比2,可用向量方式求解所花费时间占总的时间的百分比为多少 解:由题可知,系统加速比=2,部件加速比=20,通过向量方式求解可改进比例未知,可设为X。 根据Amdahl定律可知 系统加速比=1/[(1-X)+X/20]=2 求解得X=10/19 由此可得,可用向量方式求解所花费时间占总的时间的百分比魏53% 第二章作业 1、简述指令集结构设计的基本原则。 完整性、规整性、高效性和兼容性 2、简述RISC结构的设计原则。 1)选取使用频率最高的指令,并补充一些最有用的指令; 2)每条指令的功能应尽可能简单,并在一个机器周期内完成; 3)所有指令长度均相同; 4)只有Load和Store操作指令才访问存储器,其它指令操作均在寄存器之间进行; 5)以简单有效的方式支持高级语言。 3

吉大14秋学期《计算机系统结构》在线作业二答案

吉大14秋学期《计算机系统结构》在线作业二 单选题判断题 一、单选题(共15 道试题,共60 分。) 1. 关于非专用总线三种控制方式中,下列叙述错误的是()。 A. 集中式定时查询,所有部件共用同一条“总线忙”线 B. 集中式定时查询,所有部件都用同一条“总线请求”线 C. 集中式独立请求,所有部件都用同一条“总线请求”线 D. 集中式串行链接,所有部件都用同一条“总线请求”线 -----------------选择:C 2. 汇编语言源程序变换成机器语言目标程序是经( ) 来实现的。 A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译 -----------------选择:D 3. 计算机使用的语言是( )。 A. 专属软件范畴,与计算机体系结构无关 B. 分属于计算机系统各个层次 C. 属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 -----------------选择:B 4. 多端口存储器适合于连接()。 A. 紧耦合多处理机 B. 松耦合多处理机 C. 机数很多的处理机 D. 机数可变的多处理机 -----------------选择:A 5. 在系统结构设计中,提高软件功能实现的比例会( )。 A. 提高解题速度 B. 减少需要的存贮容量 C. 提高系统的灵活性 D. 提高系统的性能价格比 -----------------选择:C 6. 用户高级语言源程序中出现的读写(I/O) 语句,到读写操作全部完成,需要通过( )共同完成。 A. 编译系统和操作系统 B. I/O 总线、设备控制器和设备 C. 操作系统和I/O 设备硬件 D. 编译系统、操作系统软件和I/O 总线,设备控制器、设备硬件等 -----------------选择:D

计算机系统结构

计算机系统结构

课后习题 第一章计算机系统结构的基本概念 5.从机器(汇编)语言程序员看,以下哪些是透明的? 指令地址寄存器;指令缓冲器;时标发生器;条件寄存器;乘法器;主存地址寄存器;磁盘外设;先行进位链;移位器;通用寄存器;中断字寄存器。 答:透明的有:指令缓冲器、时标发生器、乘法器、先进先出链、移位器、主存地址寄存器。 6.下列哪些对系统程序员是透明的?哪些对应用程序员是透明的? 系列机各档不同的数据通路宽度;虚拟存储器;Cache存储器;程序状态字;“启动I/O”指令;“执行”指令;指令缓冲寄存器。 答:对系统程序员透明的有:系列机各档不同的数据通路宽度;Cache存储器;指令缓冲寄存器; 对应用程序员透明的有:系列机各档不同的数据通路宽度;Cache存储器;指令缓冲寄存器;虚拟存储器;程序状态字;“启动I/O”指令。 note: 系列机各档不同的数据通路宽度、Cache存贮器、指令缓冲寄存器属于计算机组成,对系统和程序员和应用程序员都是透明的。

虚拟存贮器、程序状态字、“启动I/O”指令,对系统程序员是不透明的,而对应用程序员却是透明的。 “执行”指令则对系统程序员和应用程序员都是不透明的。 8. 实现软件移植的主要途径有哪些?分别适用于什么场合?各存在什么问题?对这些问题应采取什么对策?如果利用计算机网络实现软件移植,计算机网络应当如何组成?

第二章数据表示与指令系统 1.数据结构和机器的数据表示之间是什么关系?确定和引入数据表示的基本原则是什么? 答:数据表示是能由硬件直接识别和引用的数据类型。数据结构反映各种数据元素或信息单元之间的结构关系。 数据结构要通过软件映象变换成机器所具有的各种数据表示实现,所以数据表示是数据结构的组成元素。不同的数据表示可为数据结构的实现提供不同的支持,表现在实现效率和方便性不同。数据表示和数据结构是软件、硬件的交界面。 除基本数据表示不可少外,高级数据表示的引入遵循以下原则:

-计算机系统结构(有详细答案)

(仅供参考,不作为考试标准), 选择题(30分,每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员 在计算机系统设计时,为了提高系统性能,应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度 重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度 为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法 与全相联映象相比,组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令 流水操作中,遇到数据相关时,采用的解决办法有________。 A)用优化编译器检测,通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络 虫蚀寻径以流水方式在各寻径器是顺序传送的是________。 授课:XXX

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

计算机系统结构三四章作业及答案

简述流水线技术的特点。(1) 流水线把一个处理过程分解为若干个子过程,每个子过程由一个专门的功能部件来实现。因此,流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件,并依靠它们的并行工作来提高吞吐率。(2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞和断流。(3) 流水线每一个功能部件的前面都要有一个缓冲寄存器,称为流水寄存器。(4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。(5) 流水线需要有通过时间和排空时间。在这两个时间段中,流水线都不是满负荷工作。 解决流水线瓶颈问题有哪两种常用方法?答:细分瓶颈段与重复设置瓶颈段 有一条指令流水线如下所示: (1 (? ? TP = 有一个流水线由4段组成,其中每当流过第三段时,总要在该段循环一次,然后才能流到第4段。如果每段经过一次所需的时间都是△t ,问: (1)当在流水线的输入端连续地每△t 时间输入一个任务时,该流水线会发生什么情况? (2)此流水线的最大吞吐率为多少?如果每2△t 输入一个任务,连续处理10个任务时,其实际吞吐率和效率是多少? (3)当每段时间不变时,如何提高流水线的吞吐率?人连续处理10个任务时,其吞吐率提高多少? 解:(1)会发生流水线阻塞情况。 (2)

(3)重复设置部件 吞吐率提高倍数= t t ??2310 75 有一条动态多功能流水线由5段组成,加法用1、3、4、5段,乘法用1、2、5段,第2段的时间为2△t ,其余各段的时间均为△t ,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ,画出时空图,并计算其吞吐率、加速比和效率。 4+B 4;再计算(A 由图可见,它在18个△t 时间中,给出了7个结果。所以吞吐率为: 如果不用流水线,由于一次求积需3△t ,一次求和需5△t ,则产生上述7个结果共需(4×5+3×3)△t =29△t 。所以加速比为: 该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得: △t,需经9△t 才能完成一个任务,其预约表如下所示。 (1)画出流水线任务调度的状态转移图。 时间 入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

很详细的系统架构图-强烈推荐

很详细的系统架构图 专业推荐 2013.11.7

1.1.共享平台逻辑架构设计 如上图所示为本次共享资源平台逻辑架构图,上图整体展现说明包括以下几个方面: 1 应用系统建设 本次项目的一项重点就是实现原有应用系统的全面升级以及新的应用系统的开发,从而建立行业的全面的应用系统架构群。整体应用系统通过SOA面向服务管理架构模式实现应用组件的有效整合,完成应用系统的统一化管理与维护。 2 应用资源采集 整体应用系统资源统一分为两类,具体包括结构化资源和非机构化资源。本次项目就要实现对这两类资源的有效采集和管理。对于非结构化资源,我们将通过相应的资源采集工具完成数据的统一管理与维护。对于结构化资源,我们将通过全面的接口管理体系进行相应资源采集模板的搭建,采集后的数据经过有效的资源审核和分析处理后进入到数据交换平台进行有效管理。 3 数据分析与展现 采集完成的数据将通过有效的资源分析管理机制实现资源的有效管理与展现,具体包括了对资源的查询、分析、统计、汇总、报表、预测、决策等功能模块的搭建。 4 数据的应用 最终数据将通过内外网门户对外进行发布,相关人员包括局内各个部门人员、区各委办局、用人单位以及广大公众将可以通过不同的权限登录不同门户进行相关资源的查询,从而有效提升了我局整体应用服务质量。

综上,我们对本次项目整体逻辑架构进行了有效的构建,下面我们将从技术角度对相关架构进行描述。 1.2.技术架构设计 如上图对本次项目整体技术架构进行了设计,从上图我们可以看出,本次项目整体建设内容应当包含了相关体系架构的搭建、应用功能完善可开发、应用资源全面共享与管理。下面我们将分别进行说明。 1.3.整体架构设计 上述两节,我们对共享平台整体逻辑架构以及项目搭建整体技术架构进行了分别的设计说明,通过上述设计,我们对整体项目的架构图进行了归纳如下:

计算机体系结构实验报告二

实验二结构相关 一、实验目的: 通过本实验,加深对结构相关的理解,了解结构相关对CPU性能的影响。 二、实验内容: 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行 周期数的百分比。 4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。 三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程 打开软件,load structure_d.s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(R-stall 数据相关Stall- 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面的数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关的部件:译码部件。 2)第二个结构相关:ADDI R2, R2, #8,与第一个结构相关类似。由于数据相关, 上一条指令暂停在ID阶段,所以导致下一条指令发生结构相关。

计算机体系结构第一次作业

问答题(共4道题) 1.什么是存储系统? 答:存储系统是指计算机中由存放程序和数据的各种存储设备、控制部件及管理信息调度的设备(硬件)和算法(软件)所组成的系统。计算机的主存储器不能同时满足存取速度快、存储容量大和成本低的要求,在计算机中必须有速度由慢到快、容量由大到小的多级层次存储器,以最优的控制调度算法和合理的成本,构成具有性能可接受的存储系统。 2.什么是高速缓冲存储器 答:指存取速度比一般随机存取记忆体(RAM)来得快的一种RAM。 一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成,容量比较小但速度比主存高得多,接近于CPU的速度。 在计算机存储系统的层次结构中,是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 3.假设一台模型计算机共有10种不同的操作码,如果采用固定长操作码需要4 位。已知各种操作码在程序中出现的概率如下表所示,计算采用Huffman编码 法的操作码平均长度,并计算固定长操作码和Huffman操作码的信息冗余量 (假设最短平均长度H=3.1位)。 答:构造Huffman树如下:

Huffman 编码的平均码长为: ∑=10 1 i i i l p =0.17*2+(0.15+0.15+0.13+0.12)*3+(0.09+0.08+0.07)*4+(0.03+0.01)*5=3.15 冗余量=(3.15-3.10)/3.15=1.59% 固定码长=log210=4 冗余量=(4-3.10)/4=22.5% 4.若某机要求有:三地址指令4条,单地址指令192条,零地址指令16条。设指令字长为12位,每个地址码长3位。问能否以扩展操作码为其编码? 答:三种指令字格式如下:

计算机系统结构试题及答案

计算机系统结构复习题 单选及填空: 计算机系统设计的主要方法 1、由上往下的设计(top-down) 2、由下往上的设计(bottom-up) 3、从中间开始(middle-out) Flynn分类法把计算机系统的结构分为以下四类: (1)单指令流单数据流 (2)单指令流多数据流 (3)多指令流单数据流 (4) 多指令流多数据流 堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。 累加器型机器:CPU 中存储操作数的单元是累加器的机器。 通用寄存器型机器:CPU 中存储操作数的单元是通用寄存器的机器。 名词解释: 虚拟机:用软件实现的机器叫做虚拟机,但虚拟机不一定完全由软件实现,有些操作可以由硬件或固件(固件是指具有软件功能的固件)实现。 系列机:由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 兼容机:它是指由不同公司厂家生产的具有相同系统结构的计算机。 流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。 单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。 多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。 吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。 指令的动态调度:

是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。 指令的静态调度: 是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。 超标量: 一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。 超流水:在一个时钟周期内分时流出多条指令。 多级存储层次: 采用不同的技术实现的存储器,处在离CPU不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的内容都是其下一层(离CPU更远的一层)存储器中内容的子集。目标是达到离CPU最近的存储器的速度,最远的存储器的容量。 写直达法: 在执行写操作时,不仅把信息写入Cache中相应的块,而且也写入下一级存储器中相应的块。写回法: 只把信息写入Cache中相应块,该块只有被替换时,才被写回主存。 集中式共享多处理机: 也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成,各处理器共享一个集中式的物理存储器,这个主存相对于各处理器的关系是对称的, 分布式共享多处理机: 它的共享存储器分布在各台处理机中,每台处理机都带有自己的本地存储器,组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址,在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起,每台处理机除了能访问本地存储器外,还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。 多Cache一致性: 多处理机中,当共享数据进入Cache,就可能出现多个处理器的Cache中都有同一存储器块的副本,要保证多个副本数据是一致的。 写作废协议: 在处理器对某个数据项进行写入之前,它拥有对该数据项的唯一的访问权 。 写更新协议: 当一个处理器对某数据项进行写入时,它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。 机群:是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

相关文档
最新文档