计算机系统结构与并行处理

合集下载

计算机体系结构与并行处理

计算机体系结构与并行处理计算机体系结构与并行处理是计算机科学领域中的重要概念。

本文将介绍计算机体系结构的基本原理、并行处理的概念及其应用，并附带题库类型的相关问题及解析。

一、计算机体系结构基本原理计算机体系结构是指计算机系统中各个硬件组件之间的结构关系和工作原理。

它包括计算机的各个层次结构，以及指令系统设计、存储器层次结构和总线结构等内容。

1. 数据通路与控制单元计算机体系结构中，数据通路用于处理和传输数据，控制单元则负责指导和协调各个硬件组件的工作。

数据通路包括算术逻辑单元(ALU)、寄存器、数据缓冲器等，而控制单元则由指令寄存器(IR)、程序计数器(PC)和控制逻辑组成。

2. 存储器层次结构存储器层次结构包括寄存器、高速缓存、主存和辅助存储器等。

其中，寄存器是CPU内部用于保存数据和指令的最快速的存储器。

高速缓存则位于CPU与主存之间，用于加速数据的读写。

主存是计算机中用于存储程序和数据的主要存储设备。

而辅助存储器则用于长期存储数据和程序。

3. 指令系统设计指令系统是计算机体系结构的核心部分，它规定了计算机所能执行的指令集和执行方式。

指令集包括数据传输指令、算术逻辑指令、控制转移指令等。

指令系统设计的关键是平衡指令的功能和数量，以满足计算机的多样化需求。

4. 总线结构总线是计算机中用于数据传输的公共通道。

总线结构包括数据总线、地址总线和控制总线等。

数据总线用于传输数据，地址总线用于定位数据在存储器中的位置，而控制总线则用于传输控制信号。

二、并行处理的概念及应用并行处理是指多个处理器同时执行多个任务或同一任务的不同部分，以提高计算机系统的性能和效率。

它可以分为粗粒度并行和细粒度并行。

1. 粗粒度并行粗粒度并行是指将一个任务分成多个子任务，由多个处理器分别执行。

每个处理器独立地处理自己的子任务，最后将结果合并。

粗粒度并行适用于需要处理的数据量大、计算复杂度高的任务，如科学计算和大规模数据处理。

2. 细粒度并行细粒度并行是指将一个任务分成多个子任务，并行执行它们的不同部分。

02325计算机系统结构复习资料

第一章计算机系统结构的基本概念从处理数据的角度看，并行级别有位串字串，位并字串，位片串字并，全并行。

位串字串和位并字串基本上构成了SIMD。

位片串字并的例子有：相联处理机STARAN，MPP。

全并行的例子有：阵列处理机ILLIACIV。

从加工信息的角度看，并行级别有存储器操作并行，处理器操作步骤并行，处理器操作并行，指令、任务、作业并行。

存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的，采用单体多字、多体单字或多体多字的交叉访问主存系统，进而采用按内容访问方式，位片串字并或全并行方式，在一个主存周期内实现对存储器中大量字的高速并行操作。

例子有并行存储器系统，以相联存储器为核心构成的相联处理机。

处理器操作步骤并行是指在并行性概念中引入时间因素，让多个处理过程在时间上错开，轮流重复地执行使用同一套设备的各个部分，加快硬件周转来赢得速度。

例子有流水线处理机。

处理器操作并行是指一个指令部件同时控制多个处理单元，实现一条指令对多个数据的操作。

擅长对向量、数组进行处理。

例子有阵列处理机。

指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。

例子有多处理机，计算机网络，分布处理系统。

并行性的开发途径有时间重叠(Time Interl eaving )，资源重复(Resou rceReplication)，资源共享(ResourceSharing)。

时间重叠是指在并行性概念中引入时间因素，让多个处理过程在时间上错开，轮流重复地执行使用同一套设备的各个部分，加快硬件周转来赢得速度。

例子有流水线处理机。

资源重复是指一个指令部件同时控制多个处理单元，实现一条指令对多个数据的操作。

例子有阵列处理机，相联处理机。

资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率，从而提高系统性能。

例子有多处理机，计算机网络，分布处理系统。

SISD:一个指令部件控制一个操作部件，实现一条指令对一个数据的操作。

计算机系统结构课后答案uint7

第七章课后题1.多处理机在结构、程序并行性、算法、进程同步、资源分配和调试上与并行处理机有什么差别？答：多处理机与并行处理机的主要差别是并行性的等级不同。

（1）结构灵活性。

多处理机制结构灵活性高于并行处理机。

（2）程序并行性。

多处理是指令、任务、作业并行，并行性的识别较难;并行处理机是操作级并行，并行性的识别较易。

（3）并行任务派生。

并行处理机工作能否并行工作由指令决定，多处理机必须有专门指令指明程序能否并行执行，派生的任务数是动态变化的。

（4）进程同步。

并行处理机的进程同步是自然的，而多处理机必须采取同步措施。

（5）资源分配和任务调度。

多处理机的资源分配和任务调度比并行处理机复杂得多。

2.多处理机有哪些基本特点？发展这种系统的主要目的可能有哪些？多处理着重解决哪些技术问题？答：○多处理机的基本特点：多处理机具有两台以上的处理机,在操作系统控制下通过共享的主存或输入/输出子系统或高速通讯网络进行通讯.结构上多个处理机用多个指令部件分别控制,通过机间互连网络通讯;算法上不只限于处理向量数组,还要实现更多通用算法中的并行;系统管理上要更多地依靠软件手段,有效解决资源分配和管理,特别是任务分配,处理机调度,进程的同步和通讯等问题.○使用多处理机的目的:一是用多台处理进行多任务处理协同求解一个大而复杂的问题来提高速度,二是依靠冗余的处理机及其重组来提高系统的可靠性,适应性和可用性.○多处理着重要解决的技术问题:（1）硬件结构上，如何解决好处理机、存储器模块及I/O子系统间的互连。

（2）如何最大限度开发系统的并行性，以实现多处理要各级的全面并行。

（3）如何选择任务和子任务的大小，即任务的粒度，使并行度高，辅助开销小。

（4）如何协调好多处理机中各并行执行任务和进程间的同步问题。

（5）如何将任务分配到多处理机上，解决好处理机调度、任务调度、任务调度和资源分配，防止死锁。

（6）一旦某个处理发生故障，如何对系统进行重新组织，而不使其瘫痪。

并行处理与体系结构

所设计的结点体系结构允许使用不同的通信体系结构(例如以太网或HPS)。
通信协议独立于通信硬件：如以太网或HPS，都允许使用标准IP协议或IBM 专用用户空间协议。
哈尔滨工业大学计算机科学与技术学院
33
例题： MPI及超立方体计算机
消息传递接口(MPl)是使用少量独立(正交)语言特征的佳例。
随着附加处理器的增多，系统性能会有多大改进。
哈尔滨工业大学计算机科学与技术学院
14
例如，假定一个有n个处理器的系统，作数据库服务器用
它拥有美国人口数据库，通常有100位美国科学家查询，其性能为每秒1000个事务处理(TPS)。
现在如果我们将处理器数加倍成2n，能期望速度有多少改进?期望是多少？
所增加的资源中，处理器最为常见；也可能是存储器容量和I／O容量。
哈尔滨工业大学计算机科学与技术学院
15
（2）问题规模可扩展性
是指系统在处理更大数据量和工作负载的更大求解问题时其性能如何。
例如：仍以上述的数据库服务器为例，如果该服
务器上装有中国人口的数据库，则此服务器的服务质量将会如何? 注意到此数据库的大小已增至原来的5
实际系统总有一个最大存储器容量的上限。例如：
IBM SP2中的每个结点最多可容纳2GB 存储器；
CrayT3D为64MB。
哈尔滨工业大学计算机科学与技术学院
12
（3）软件可扩展性
包括：
操作系统的一个新版本，它具有更多功能性，如多线程，从而可支持更多的用户进程，更大的地址空间以及更高效的内核功能等。
哈尔滨工业大学计算机科学与技术学院64哈尔滨工业大学计算机科学与技术学院65哈尔滨工业大学计算机科学与技术学院666419哈尔滨工业大学计算机科学与技术学院67哈尔滨工业大学计算机科学与技术学院68例如高位存储器扩充存储器和扩展存储器哈尔滨工业大学计算机科学与技术学院69考虑到代的可扩展性ibmrs6000smp作了过度设计第一代的smp基于powerpc601处理器

并行计算机系统结构

并⾏计算机系统结构
并⾏计算机系统结构
1. 并⾏计算机结构模型
1. 单指令流多数据流机SIMD(Single Instruction Multiple Data)；
2. 并⾏向量计算机PVP(Parallel Vector Processor)；
3. 对称多处理机SMP(Symmetric MultiProcessor)；
4. ⼤规模并⾏处理机MPP(Massively Parallel Processor)；
5. 分布式共享存储DSM(Distributed Shared Memory)
6. 多处理机和⼯作站机群COW(Cluster Of Workstation)（现在常称之为机群）。

1. 并⾏计算机访存模型
1. UMA（Uniform Memory Access）模型是均匀存储访问模型的简称。

2. NUMA(Nonuniform Memory Access)模型是⾮均匀存储访问模型的简称。

3. COMA(Cache-Only Memory Access)模型是全⾼速缓存存储访问的简称。

4. CC-NUMA（Coherent-Cache Nonuniform Memory Access）模型是⾼速缓存⼀致性⾮均匀存储访问模型的简称。

5. NORMA（No-Remote Memory Access）模型是⾮远程存储访问模型的简称。

《计算机组成与系统结构》课件第9章

2) 多级互连网络另一种组织与控制更为有效的交换网络是基于a×b交换开关构造而成的。2×2交换开关是一种最常用的二元开关，如图9.13(a)所示，它有两个输入和两个输出，从任意输入线到达的消息都可以交换到任意的输出线上。
图 9.13 2×2的交换开关
图 9.14 Omega网络
多级互连网络设计的关键是: (1) 选择何种交换开关; (2) 交换开关之间采用何种拓扑连接; (3) 对交换开关采用何种控制方式。
图 9.3 计算机分类
9.3 阵列处理机和向量处理机
9.3.1 阵列处理机阵列处理机属于分布式内存SIMD(DM-SIMD)系统，它
由许多在不同数据集合上执行同样指令序列、完成同样功能的完全相同的处理器组成。阵列处理机中的处理器共享一个控制器(所以它不是通常意义上的独立CPU)，控制器发布指令，指令由处理器阵列中的处理器执行。因为阵列机中的所有处理器是以步调一致的方式工作的，所以处理器之间不需要同步，这就大大简化了这种系统的设计。
向量-寄存器处理器的基本组成如图9.5所示，它是以 Cray-1为基础的一个模型，标量部分是MIPS，向量部分是 MIPS的逻辑向量扩展，其主要模块功能如下:
(1) 向量寄存器组。 (2) 向量功能单元。 (3) 向量Load-Store部件。 (4) 标量寄存器组。
图 9.5 基本的向量-寄存器体系结构
9.4 互连网络
9.4.1 基本概念互连网络(Interconnection Network)是一种由开关元件按
照一定的拓扑结构和控制方式构成的网络，用于实现计算机系统中部件之间、处理器之间、部件与处理器之间甚至计算机之间的相互连接，
根据连接的设备数和设备的接近程度，可以将互连网络分为以下四类:

计算机体系结构基本概念

计算机体系结构基本概念计算机体系结构是指计算机系统中的各个组成部分之间的关系和交互方式。

它是计算机硬件与软件之间的接口，决定了计算机系统的工作方式、性能表现以及可扩展性。

本文将介绍计算机体系结构的基本概念和相关内容。

一、计算机体系结构的概述计算机体系结构是指计算机系统的结构组织，包括硬件和软件。

主要由计算机硬件、指令系统、运算方式和数据流组成。

计算机体系结构的目标是提供高性能、可靠性、可扩展性和高效能的计算机系统。

计算机体系结构的设计通常以指令集架构和微架构为基础。

二、指令集架构指令集架构是计算机体系结构中的一个重要概念。

它定义了计算机系统处理信息的方式。

指令集架构包括计算机的指令集、寄存器、数据类型和地址模式等。

根据指令集的不同，可以将计算机体系结构分为复杂指令集计算机（CISC）和精简指令集计算机（RISC）。

三、微架构微架构是指计算机体系结构的实现方式。

它包括处理器的内部结构、数据通路、控制流和存储相关的电路设计。

微架构的设计影响着计算机系统的性能和功能。

常见的微架构包括超标量、乱序执行和流水线等。

四、存储结构与存储器层级存储结构是指计算机系统中用于存储数据的层次结构。

存储器层级分为寄存器、高速缓存、内存和辅助存储器等。

不同层级的存储器具有不同的特点，如容量、速度和价格等。

存储结构的设计旨在提高计算机系统的访问速度和运行效率。

五、总线结构总线结构是计算机体系结构中连接各个组件的通信系统。

它包括地址总线、数据总线和控制总线等。

总线结构的设计影响着计算机系统的数据传输速度和可扩展性。

六、并行处理与多核技术并行处理是指多个处理器或计算单元同时执行指令，提高计算机系统的运行速度和性能。

多核技术则是将多个处理核心集成到同一个芯片上，实现并行运算。

并行处理和多核技术在高性能计算、科学计算和图像处理等领域得到广泛应用。

七、虚拟化技术虚拟化技术是指通过软件将计算机资源抽象为多个逻辑实体，实现多个操作系统和应用程序的隔离和共享。

未来计算机体系结构的发展趋势

未来计算机体系结构的发展趋势随着科技的不断发展，计算机体系结构也在不断演进，朝着更高效、更强大的方向发展。

未来计算机体系结构的发展趋势主要包括以下几个方面：1. 并行处理能力的提升：未来计算机体系结构将更加注重并行处理能力的提升。

传统的冯·诺伊曼体系结构限制了计算机的并行处理能力，而未来的计算机体系结构将采用更加灵活的方式，如多核处理器、GPU等，以实现更高效的并行计算。

2. 智能化和自适应性：未来计算机体系结构将趋向于智能化和自适应性。

智能化的计算机体系结构可以根据不同的任务和场景进行智能调整，提高计算机的性能和效率。

自适应性的计算机体系结构可以根据计算负载的变化自动调整资源分配，提高计算机的利用率。

3. 内存和存储的创新：未来计算机体系结构将在内存和存储方面进行创新。

传统的计算机体系结构中，内存和存储是分开的，数据需要从存储器中加载到内存中进行计算。

未来的计算机体系结构将采用更加紧密集成的内存和存储，将计算和存储的距离缩短，提高计算速度和效率。

4. 能源效率的提升：未来计算机体系结构将更加注重能源效率的提升。

传统的计算机体系结构在高性能计算的同时也带来了高能耗的问题。

未来的计算机体系结构将采用更加节能的设计，如低功耗芯片、动态电压调整等，以提高计算机的能源效率。

5. 安全性和可靠性的增强：未来计算机体系结构将加强对安全性和可靠性的考虑。

随着互联网的普及和信息技术的发展，计算机系统面临着越来越多的安全威胁和故障风险。

未来的计算机体系结构将采用更加安全和可靠的设计，如硬件加密、容错技术等，以保护计算机系统的安全和稳定运行。

6. 软硬件协同设计：未来计算机体系结构将更加注重软硬件协同设计。

传统的计算机体系结构中，硬件和软件是分开设计的，导致了性能和效率的限制。

未来的计算机体系结构将采用软硬件协同设计，将硬件和软件的优势结合起来，实现更高效的计算和更好的用户体验。

总结起来，未来计算机体系结构的发展趋势将注重并行处理能力的提升、智能化和自适应性、内存和存储的创新、能源效率的提升、安全性和可靠性的增强，以及软硬件协同设计。

自考《计算机系统结构》第9章精讲

第九章并⾏处理技术本章讲述的重点内容就是阵列处理机和多处理机，对阵列机的基本结构、主要特点、以及阵列机的互连络和并⾏存储器的⽆冲突访问等内容要加强理解。

本章应掌握的概念有：阵列处理机、络拓扑结构、单级⽴⽅体络、多级⽴⽅体等。

⼀、并⾏处理技术（识记）：并⾏性主要是指同时性或并发性，并⾏处理是指对⼀种相对于串⾏处理的处理⽅式，它着重开发计算过程中存在的并发事件。

并⾏性通常划分为作业级、任务级、例⾏程序或⼦程序级、循环和迭代级以及语句和指令级。

作业级的层次⾼，并⾏处理粒度粗。

粗粒度开并⾏性开发主要采⽤MIMD⽅式，⽽细粒度并⾏性开发则主要采⽤SIMD⽅式。

开发计算机并⾏性的⽅法主要有：资源重复、时间重叠和资源共享三种⽅法。

⼆、SIMD并⾏计算机（阵列处理机）阵列机也称并⾏处理机。

它将⼤量重复设置的处理单元按⼀定⽅式互连成阵列，在单⼀控制部件CU（Contrul Unit）控制下对各⾃所分配的不同数据并⾏执⾏同⼀指令规定的操作，是操作并⾏的SIMD计算机。

它采⽤资源重复的措施开发并⾏性。

是以SIMD（单指令流多数据流）⽅式⼯作的。

1、阵列机的基本结构（识记）阵列机通常由⼀个控制器CU、N个处理器单元PE（Processing Element）、M个存储模块以及⼀个互连络部件（IN）组成。

根据其中存储器模块的分布⽅式，阵列机可分为两种基本结构：分布式存储器的阵列机和共享存储器的阵列机（理解⼆者不同之处）。

阵列机的主要特点：它采⽤资源重复的⽅法引⼊空间因素，这与利⽤时间重叠的流⽔线处理机是不⼀样的。

它是利⽤并⾏性中的同时性⽽不是并发性，所有的处理单元必须同时进⾏相同操作（资源重复同时性）（我们想象⼀下亚运会的开幕式⼤型团体操表演，每个⼈就是⼀个PE，他们听从⼀个总指挥的指令，同时进⾏⾃⼰的操作，很快地就能"计算"出⼀个结果（队形）来。

）它是以某类算法为背景的专⽤计算机，基本上是专⽤于向量处理的计算机（某类算法专⽤机）。

计算机体系结构第5章_并行处理技术

第5章并行处理技术
3.累加和并行算法
对于累加和这样的递归操作，为了加快并行计算，常采用递归折叠方法。
一般而言，对于在P个处理单元上实现P个元素累加求和，需要折叠 log2 P 次，并行相加 log2 P 次，并行传送数据的次数根据各PE间互连网络的拓扑结构不同而有很大差异。设加法1次所需的时间为t加，并行相加的总次数为n，数据在两个相邻处理单元之间传送一次所需的时间为t传，并行传送数据的总次数为 x，则并行处理所需的总的时间为：nt加+ xt传。
在设计互连网络时应考虑以下的四个特征： 1.通信工作方式通信工作方式可分为同步和异步两种。 2.控制策略控制策略分为集中和分散两种。 3.交换方式交换方式分为线路交换和分组交换两种。 4.网络拓扑网络拓扑分为静态和动态两种。
第5章并行处理技术
5.3.2 互连函数的表示互连函数----互连函数描述的是各处理单元之间或处理单元与共享主存
(1)若处理单元的个数P＜n2
第5章并行处理技术
第5章并行处理技术
下面分析这种并行算法的计算时间和通信时间。 ①计算时间用Pij计算Cij时，需要对(n/m×n/m)阶子矩阵中的每个元素cij进行n次乘法和n次加法，故Pij的运行时间为： n/m×n/m×n×(t乘+t加)=n3/m2×(t乘+t加)
(3)∵ t乘、t加和tw 均为一个指令周期，ts忽略不计，n=64，m=8 ∴ 整个矩阵乘算法所需的总的运行时间为： TP =n3/m2×(t乘+t加)+ 2(mts + n2/m×tw) =643/82×(1+1)+2(0+642/8×1) =9216(指令周期)
第5章并行处理技术

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第 1 页 ( 共 8 页 )命题纸使用说明：1、字迹必须端正，以黑色碳素墨水书写在框线内，文字与图均不得剪贴，以保证“扫描”质量；2、命题纸只作考试（测验）命题所用，不得移作他用。

大学 2003 ～ 2004 学年秋季学期试卷课程名:计算机系统结构与并行处理(一) 学分：_4_学号：_______ 姓名：_________ 院：计算机学院一．填充题：（每小题3分、共12分）1．计算机系统结构定义是程序设计者所看到的计算机属性，即概念性，结构，功能性。

2．虚拟存储系统，辅存容量为228Byte ，主存容量为216Byte ，页面为1Kbyte ，则MEM 系统提供的程序空间有 218 页，对应实存空间 26 页，若采用组相联，则整个虚存应分为 212 区。

3．流水线结构的并行性是采用时间重迭的技术途径。

4．在系统结构中，程序访问局部化性质应用于 cache ，流水线，虚拟存储器等方面。

二．简答题：（每小题4分、共24分） 1．简述系列机的概念。

先设计一种系统结构；按其设计它的系统软件；按照器件状况和硬件技术，研究这种结构的各种实现方法；按速度，价格等不同要求分别提供不同速度，不同配置的各档机器。

成绩第 2 页 ( 共 8 页 ) 2．存储器层次结构是怎样的？其容量、速度、价格是怎样分布的。

速度越来越快，价格越来越高寄存器组cache主存储器辅助存储器后援存储器容量越来越大3．简述虚拟计算机概念。

计算机只对观察者而存在；功能体现在广义语言上；对该语言提供解释手段；作用在信息处理或控制对象上；简言之，是由软件实现的机器。

4．What is the policy of “write back” when writing to the cache? (answer in English)The information is written only to the block in the cache.The modified cache block is written to main memory only when it is replaced.第 3 页 ( 共 8 页 )5．什么是“数据相关”、“转移相关”？简述之。

数据相关：当前一条指令的执行结果可能在流水线中是后续指令的操作数，它们可能发生了“先读后写”等相关。

它是一种局部相关。

转移相关：由转移指令引起流水线“断流”。

这是一种全局相关6．先行控制结构中有那些缓冲栈组成？分别叙述其功能。

先行指令栈：读取后援指令，保证指令分析器能够顺序取指。

现行读数栈：读出的数据放在该栈，运算器直接从其读取数据进行操作。

先行操作栈：指令分析器预处理万一条指令，就将相应操作命令送入该栈，而执行部件从栈内按顺序逐步取出操作命令执行。

后行写数据栈：每当接到运算器送来的要写入主存的数据，由控制逻辑自动向主存发写数请求，完成存数的操作。

命题纸使用说明：1、字迹必须端正，以黑色碳素墨水书写在框线内，文字与图均不得剪贴，以保证“扫描”质量；2、命题纸只作考试（测验）命题所用，不得移作他用。

第 4 页 ( 共 8 页 )三．某机有10条指令，其使用频度分别为0.14，0.12，0.12，0.03，0.05，0.06，0.04，0.13，0.30，0.01。

要求：(a) 画出Hafuman编码的二叉树。

(b) 写出等长二进制编码，Hafuman编码，2-4扩展编码。

（15分）0.01 0.030.04 0.140.130.120.120.060.050.040.270.11 0.240.080.190.430.571.000.3011 01111111I 二进制编码Haffman码2-4扩展编码0.30 0000 00 000.14 0001 010 010.13 0010 011 10000.12 0011 100 10010.12 0100 101 10100.06 0101 1100 10110.05 0110 1101 11000.04 0111 1110 11010.03 1000 11110 11100.01 1001 11111 1111平均码长 4 2.93 3.12第 5 页 ( 共 8 页 )命题纸使用说明：1、字迹必须端正，以黑色碳素墨水书写在框线内，文字与图均不得剪贴，以保证“扫描”质量；2、命题纸只作考试（测验）命题所用，不得移作他用。

四．主存有4个模块，每块大小为1K 字节，若采用低位交叉编址方式（1）请画出地址划分示意图。

（2）设已知存储单元地址A=0FFEH ，请在地址划分示意图上标明A 的位置。

（10分）AM 30002 0006 0FFEM 40003 0007 0FFFM 10000 0004 0FFC0001 0005 0FFDM 2第 6 页 ( 共 8 页 )五．有一个Cache—主存层次：主存分8块（0~7），Cache为4块（0~3），块大小为1KB。

采用组相联映象，组内块数为2块。

已知页面地址流为2，7，4，2，0，1，5，4，1，2，6，5，6，0，2。

（1）画出主存-Cache映象图和地址对应示意图。

标出地址各字段的位数。

（2）试用LRU和OPT替换算法，分别画出替换示意图、求出命中率H。

（14分）LRU：A 2 7 4 2 0 1 5 4 1 2 6 5 6 0 20组4 4 4* 1 1* 4 4* 4* 4* 5 5 5* 5*0 0* 5 5* 1 1 1 1* 1* 0 01组2 2* 2* 2H 2 2 2 2 2 2 2H 2** 2* 2* 2H7 7 7* 7* 7* 7* 7* 7* 7* 6 6 6H 6 6*H=4 15OPT：A 2 7 4 2 0 1 5 4 1 2 6 5 6 0 20组4 4 4 4 4 4*H 1* 1* 1* 1* 1* 0 00* 1* 5* 5 5 5 5 5H 5 5* 5*1组2 2 2 2H 2 2 2 2 2 2H 2* 2* 2 2 2H7* 7* 7* 7* 7* 7* 7* 7* 7* 6 6 6H* 6* 6*H=6 15第 7 页 ( 共 8 页 )命题纸使用说明：1、字迹必须端正，以黑色碳素墨水书写在框线内，文字与图均不得剪贴，以保证“扫描”质量；2、命题纸只作考试（测验）命题所用，不得移作他用。

六．设有数据处理流水线，如图所示。

Cache 每送出4个数据后，间隔400ns 再送出4个数据，连续不断。

请画出此条件下，包括Cache 在内的处理过程时—空图，并求出其效率E 和吞吐率T P 。

（10分）C ache 100ns1 100ns2 200ns2 200ns3 100ns循环一次3 1 2 34 12F 2 4 2 2E 1 3 4 1 2 1 1 2 3 4 1 2 3cache 12 3 4 1 2 31 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18|——————11t ———————————————|| ————12t ——————————————————|E=2411*5=43.64%T P =411=3.64MIPS第 8 页 ( 共 8 页 )七．假设一个4段流水线（其时钟周期τ=20 ns）的预约表如下，要求：（1）写出禁止等待时间和初始冲突向量C0。

（2）画出调度该流水线的状态变换图。

（3）确定与最佳迫切循环相关联MAL。

（4）确定与MAL和给定的τ对应的流水线吞吐率。

（15分）ΧΧΧΧΧΧΧΧ（1）S1 禁止时间 3. 5 2S2禁止时间 2S3禁止时间 2禁止时间2，3，5 允许时间1， 4初始冲突向量C0={10110}（2）6+101106+ 4 6+110111 111114（3）MAL=(1,6)=3.51 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16S1 X1 X2 X1 X2 X1 X2 X3 X4 X3 X4 X3 X4S2 X1 X2 X1 X2 X3 X4 X3 X4S3 X1 X2 X3 X4S4 X1 X2 X1 X2 X3 X4 X3 X4H P =2/(7*τ)=14.2MIPS上海大学2003 ～2004学年冬季学期试卷课程名：计算机系统结构与并行处理(二)_学分：4__成学号：_______ 姓名：_________ 院系：_______绩题号一二三四五六七八得分得分一．填充题：（共15分,每空1分）1．网格（Grid）技术是20世纪90年代中期随着计算机网络技术和分布式计算技术的不断发展而诞生的一种全新技术。

2．计算模型的四种驱动方式是控制驱动、数据驱动、需求驱动和模式匹配驱动。

3．RISC结构中采用的三种流水线结构是超标量结构、超流水线结构和超长指令字（VLIW）结构。

4．单机系统实现并行处理的途径是时间重叠、资源重复、资源共享。

多机系统实现并行处理的途径是功能专用化、机间互联、网络化。

二、简答题：（共20分）1．请画图表示两种并行处理机的结构（6分）见书上138 图5－2 5－32．简述集群系统的概念。

（5分）集群系统是利用高速通信网络将一组高性能工作站或高档PC 机连接起来，在并行程序设计和集成开发环境支撑下统一调度、协调处理以实现高效并行处理的系统。

集群系统中的主机和网络可以是同构的，也可以是异构的，主要利用消息传递方式实现机间的通信，由建立在一般的操作系统上的并行编程环境完成系统的资源管理及相互协作。

得分3．简述计算机性能评价和计算机性能测量的定义（4分）计算机性能评价是指计算机系统对原始数据进行逻辑推算。

计算机性能测量是指采用基准测试程序包来度量计算机系统的性能。

4．简述数据流计算机工作原理。

（5分）数据流计算机没有程序计数器，没有中央控制器，指令的执行由数据来驱动，把控制流变为数据流。

当指令所需数据可用时，指令就可以执行。

三．综合题（65分）1．如FP 操作比例为35%，FP 的CPI=4.5，其它指令CPI=1.6。

FPSQR 操作比例为5%，FPSQR 的CPI=20。

有二种方案：方案1：把所有FP 的CPI 减为2；方案2：把FPSQR 的CPI 减为6。

要求： (a) 试比较二种方案的CPI 。