并行处理机和多处理机

合集下载

操作系统五大管理功能包括哪些

操作系统五大管理功能包括哪些操作系统的五个基本管理功能你知道是什么呢?下面由小编整理了操作系统五大管理功能包括哪些的相关知识，希望对你有帮助。

操作系统五大管理功能包括哪些1) 设备管理：主要是负责内核与外围设备的数据交互，实质是对硬件设备的管理，包括对输入输出设备的分配，初始化，维护与回收等。

例如管理音频输入输出。

2) 作业管理：这部分功能主要是负责人机交互，图形界面或者系统任务的管理。

3) 文件管理：这部分功能涉及文件的逻辑组织和物理组织，目录结构和管理等。

从操作系统的角度来看，文件系统是系统对文件存储器的存储空间进行分配，维护和回收，同时负责文件的索引，共享和权限保护。

而从用户的角度来说，文件系统是按照文件目录和文件名来进行存取的。

4) 进程管理：说明一个进程存在的唯一标志是pcb(进程控制块)，负责维护进程的信息和状态。

进程管理实质上是系统采取某些进程调度算法来使处理合理的分配给每个任务使用。

5)存储管理：数据的存储方式和组织结构。

补充：操作系统的四大类操作系统的类型也可以分为几种：批处理系统，分时操作系统，实时操作系统，网络操作系统等。

下面将简单的介绍他们各自的特点：1) 批处理系统：首先，用户提交完作业后并在获得结果之前不会再与操作系统进行数据交互，用户提交的作业由系统外存储存为后备作业;数据是成批处理的，有操作系统负责作业的自动完成;支持多道程序运行。

2) 分时操作系统：首先交互性方面，用户可以对程序动态运行时对其加以控制;支持多个用户登录终端，并且每个用户共享CPU和其他系统资源。

3) 实时操作系统：会有时钟管理，包括定时处理和延迟处理。

实时性要求比较高，某些任务必须优先处理，而有些任务则会被延迟调度完成。

4) 网络操作系统：网络操作系统主要有几种基本功能(1) 网络通信：负责在源主机与目标主机之间的数据的可靠通信，这是最基本的功能。

(2) 网络服务：系统支持一些电子邮件服务，文件传输，数据共享，设备共享等。

自考《计算机系统结构》第9章精讲

第九章并⾏处理技术本章讲述的重点内容就是阵列处理机和多处理机，对阵列机的基本结构、主要特点、以及阵列机的互连络和并⾏存储器的⽆冲突访问等内容要加强理解。

本章应掌握的概念有：阵列处理机、络拓扑结构、单级⽴⽅体络、多级⽴⽅体等。

⼀、并⾏处理技术（识记）：并⾏性主要是指同时性或并发性，并⾏处理是指对⼀种相对于串⾏处理的处理⽅式，它着重开发计算过程中存在的并发事件。

并⾏性通常划分为作业级、任务级、例⾏程序或⼦程序级、循环和迭代级以及语句和指令级。

作业级的层次⾼，并⾏处理粒度粗。

粗粒度开并⾏性开发主要采⽤MIMD⽅式，⽽细粒度并⾏性开发则主要采⽤SIMD⽅式。

开发计算机并⾏性的⽅法主要有：资源重复、时间重叠和资源共享三种⽅法。

⼆、SIMD并⾏计算机（阵列处理机）阵列机也称并⾏处理机。

它将⼤量重复设置的处理单元按⼀定⽅式互连成阵列，在单⼀控制部件CU（Contrul Unit）控制下对各⾃所分配的不同数据并⾏执⾏同⼀指令规定的操作，是操作并⾏的SIMD计算机。

它采⽤资源重复的措施开发并⾏性。

是以SIMD（单指令流多数据流）⽅式⼯作的。

1、阵列机的基本结构（识记）阵列机通常由⼀个控制器CU、N个处理器单元PE（Processing Element）、M个存储模块以及⼀个互连络部件（IN）组成。

根据其中存储器模块的分布⽅式，阵列机可分为两种基本结构：分布式存储器的阵列机和共享存储器的阵列机（理解⼆者不同之处）。

阵列机的主要特点：它采⽤资源重复的⽅法引⼊空间因素，这与利⽤时间重叠的流⽔线处理机是不⼀样的。

它是利⽤并⾏性中的同时性⽽不是并发性，所有的处理单元必须同时进⾏相同操作（资源重复同时性）（我们想象⼀下亚运会的开幕式⼤型团体操表演，每个⼈就是⼀个PE，他们听从⼀个总指挥的指令，同时进⾏⾃⼰的操作，很快地就能"计算"出⼀个结果（队形）来。

）它是以某类算法为背景的专⽤计算机，基本上是专⽤于向量处理的计算机（某类算法专⽤机）。

九章节多处理机

X`
X
总线
X 写回
3）I/O传输引起的不一致若C1、C2都有共享数据X的拷贝，当I/O处理机将一个新的数据X`输入
内存时，导致了主存与Cache之间的数据不一致。若C1、C2都有共享数据X的拷贝，当P1运行过程中修改了X的值，使其
变为X`，P1采用“写回”策略，那么，主存的X与C1中的X`不一致。这时，若I/O处理机要求输出，输出的将是主存的X，而非修改后的X`。
若C1、C2都有共享数据X的拷贝，P2进程修改了C2中X，使其变为X`，且采用“写通过”策略，使主存中的X也修改为X`。由于某种原因，该进程从P2迁移到P1上运行，此时，C1中仍然是X，而不是修改过的X`。
处理机 P1
P2
P1
P2
P1
P2
调整缓冲存储器
X
X
共享存储器
X
迁移之前
X
X`
X` 写通过
上述4中策略可组合起来使用，即： “写通过WT”+“写无效WI”、“写通过WT”+“写更新WU” “写回WB”+“写无效WI”、 “写回WB”+“写更新WU”
处理机 P1
P2
P1
P2
P1
P2
高速缓冲
存储器 X
X
共享存储器
更新之前
X`

I
写无效
X`
X`
总线
写更新
由于写更新策略在本地Cache修改时要通过总线将修改过的数据块内容广播给所有含有该数据块拷贝的其它Cache，增加了总线的负担，所以，一般系统中，很少使用写更新策略，而是采用写无效策略。基于此，以下只讨论写无效策略的监听协议。
2) NUMA多处理机非均匀存储器存取 (Nonuniform Memory Access)模型 ▲存储器访问时间随存储单元的位置不同而变化。 ▲共享存储器在物理上是分布在所有处理机中的本地存储器。所有局部

多处理机优质文档

4．进程同步
9.1 多处理机结构
并行处理机实现操作级的并行，所有处于活动状态甚至有的产品已接的近了处多处理理机单专用元互联同网（时如交执叉开行关网共络、同多机的网络指）的令性能操。作，受同一个控制器
3）研究自动化并行编译器，直接将顺
P2运行时从内存中控读取制得到，X，工但是作这个自读到然的X是是“过同时”步的。的。但多处理机所实现的是指令
多处理机
9.1 多处理机结构
一、多处理机结构多处理机系统——由若干台独立的处理机组成，利
用多台处理机并发地执行同一个作业。 1．共享存储器的多处理机结构（结构如下图所示）图中存储器和I/O设备是独立的子系统，为所有处理机共享。
9.1 多处理机结构
2．分布存储型多处理机结构（松耦合的多处理机结构如下图所示）图中每台处理机有自己的存储器和1／O设备。
9.2 多处理机的Cache一致性
一、问题的由来 1．主存——Cache一致性策略 (1)写通过策略(Write-through)：写Cache时同时写主存。 (2)写回策略(Write-back)：写Cache时不写主存。 2．共享可写数据引起的不一致 ( p513)
9.2 多处理机的Cache一致性
（3）并行处理机由于主要完成数组向量运算，它的PE和 MM之间的数据交往是比较有规则的，存储器访问的地址变换功能不必要求太高，因而互连网络的作用主要放在数据对准上，可以做得比较简单。但是，多处理机由于互连网络必须满足各个PE随机地访问主存储器的要求，所以，连接模式、频带和路径选择等问题都要复杂
指令内部，一条指令可以同时对整个数组进行处理，再加上系统具有的专用性特点，就使程序并行性的识别较易实现。
M（I4M）D多结处构理特机点属、任程算务法级之和并时行间间。分有析数据交往或控制依赖，那么，执行过程中有的机群系统一般采用进通用程局域就网，要目前中局域途网技停术大下体分来两类进：入等待状态，直到它所依赖的执

处理机

功能分类
处理机又可根据在计算机系统中的功能来分类。一般情况下，处理机的指令系统可以反映出处理机功能的强弱和它的适用范围。通用中央处理器具有很强的指令功能，适用于科学计算、数据处理、商业应用、事务管理各个领域或某一个和某几个领域。某些处理机的指令系统只有局部的功能,往往以其用途来命名。①输入-输出处理机：解释和执行输入-输出指令,具有一定的字符处理能力,它完成输入-输出操作和设备控制操作。②通信控制处理机：在计算机网中实现各个处理机之间的通信并协调它们的操作。③支持和维护处理机：具有系统控制台功能，能实现系统维护和故障诊断。④数组处理机：结构上适合于数组和矩阵运算尤其是信号处理算法运算，与前置处理机或主机配接后可大大增强系统的向量处理能力。此外还有：具有数据库管理功能的数据库处理机；实现虚拟存储器页面调度的处理机等。
操作
处理机的操作是首先将用户程序和数据通过输入－输出设备输入到主存储器（主存）或辅助存储器。中央处理器从主存取出指令，完成对指令的解释，执行控制操作；若是运算型指令，还须从主存取出数据，由运算器完成运算。结果通常暂存在运算器或送回主存。
执行程序
处理机执行程序过程涉及输入-输出操作、主存-辅存的信息交换，这些都要经过输入、输出接口部件。处理机与外界的这种信息交换有三种方式。①中断方式：即程序I/O。每传送一个位组（如一个字或字节）产生一次中断,由CPU执行相应的中断程序完成。这种方式主要用于慢速输入-输出设备。②直接存储器存取(DMA)方式:在硬件线路控制下直接在快速输入-输出设备和主存之间完成一条输入－输出指令规定的信息量交换。③通道控制方式：各通道各有自己的通道程序,实现输入-输出指令规定的主存和输入-输出设备之间的信息交换。
分类
从系统结构角度，按处理机执行的指令流和与指令流相关的数据流的关系，有单指令流单数据流（SISD）处理机、单指令流多数据流（SIMD）处理机和多指令流多数据流（MIMD）处理机。SISD处理机的程序是按单一指令序列执行的，操作数据亦按对应的指令确定的单一顺序逐个处理。大多数处理机都属于这一类。SIMD和MIMD处理机又称并行处理机。并行处理机的目的在于提高处理机的数据处理能力。SIMD处理机以处理向量数据为主，故又称向量处理机。其中以单个指令执行部件和多个相同的运算处理器构成的处理机称为阵列（式）处理机,如美国的伊利阿克ILLIAC-Ⅳ。以生产流水线方式组织指令部件(称先行控制)和运算功能部件的SIMD处理机，称为流水线处理机，如中国1983年研制成功的“银河”计算机的处理机。联想处理机则是采用按内容检索的联想存储器为主要特征的SIMD处理机。至于MIMD处理机，实际上是多处理机系统，它是多个相同的处理机通过公共主存储器相互耦合构成有多重处理能力的系统。

多处理机

•本章重点：
多处理机结构特点，程序并行性，并行任务的派生与汇合。
•本章难点：
并行算法的研究思路，程序中并行任务的派生与汇合。
7.1 多处理机的特点及主要技术问题
多处理机具有两台以上的处理机，在操作系统控制下通过共享的主存或输入输出子系统或高速通讯网络进行通讯。多处理机属MIMD系统。一、多处理机与并行处理机的差别
二、多处理机存在的主要技术问题
1、硬件上处理好处理机、I/O通道、存储模块的互连问题。 2、软件上最大限度开发系统的并行性，以实现多处理机各级的全面并行。 3、确定任务粒度问题，即如何选择任务和子任务的大小。 4、进程同步问题。 5、任务分配，资源分配，防止死锁问题。 6、当系统中某个处理机发生故障后的恢复问题。 7、多处理机机数增多后，如何能给编程者提供良好的编程环境问题。
为了减少各处理机同时访问同一存储器模块的冲突，存储器模块数m应等于或略大于处理机数 p。每台处理机自带局部存储器，不仅可以减少访主存信息量，降低访主存冲突概率，也可以减少处理机---存储器互连网络的冲突。如果再自带专用Cache就可以进一步减少这类冲突。处理机间通过中断信号互连网络，由一台处理机向另一台处理机发生中断信号来实现处理机间的进程同步。多数多处理机采用非对称互连。紧耦合多处理机常用于并行执行作业中的多个任务，以提高系统的速度性能。因此各处理机一般是同构形的。
同构/异构--PE类型相同/不同；对称/非对称—每个PE与部分/全部的I/O通道连接。常见结构：同构对称式和异构非对称式多机系统。
互连网络：实现PE←→PEM、PE←→I/O通道、 PE←→中断信号间的连接。互连网络控制—分布式控制(消息传递机制)。思考1：为什么每个PE可自带小容量局部存储器？思考2：为什么每个PE可自带一个Cache？系统规模：PE数量不能很多。为什么？

并行处理机和多处理机系统的概念、并行处理机与多处理机

并行处理机和多处理机系统的概念、并行处理机与多处理机系统的区别、多处理机运行过程。

多处理机性能模型SIMD 计算机的概念SIMD 计算机处理任务的性能计算。

并行处理机与多处理机系统的区别：§并行处理机的并行性在于指令内部，而多处理机的并行性在于指令外部。

§并行处理机把同种操作集中在一起，由指令直接启动各个PE同时工作。

多处理机用专门的指令来表示并发关系，一个任务开始执行时能够派生出与它同时执行的另一些任务，如果任务数多于处理机数，多余的任务进入排队器等待。

§并行处理机只有一个CU，自然同步。

多处理机执行时间可能互不相同它们的工作进度不会也不必保持相同。

多处理机性能模型：当多处理机系统以峰值速度运行时，所有处理机都在做着有用的工作，没有一台处理机处于空闲状态。

N台处理机对系统性能都有贡献，系统的处理速度随N的增加而增加。

但以下原因引起系统不能达到峰值性能：……( 请复习教材347 页)典型例子：试在含一个PE 的SISD 机和在含8 个PE 的且连接成一个线性环的SIMD机上计算假定完成每个加法用30ns ，乘法50ns ，沿双向环在相邻PE 间移数需要10ns 。

（ 1 ）SISD 计算机上计算S 需要多少时间？（ 2 ）SIMD 计算机上计算S 需要多少时间？（ 3 ）SIMD 上计算S 相对于SISD 计算机的加速比是多少？解：(1) 在SISD 机上，无需移数，所有运算是串行的，需要8 次加法，7 次乘法，因此：T0=8x30+7x50=590ns(2) 在SIMD 机上，首先将8 个加法分配到8 个处理机上，然后在4 个处理机上执行4 次乘法，需移数1 次（ 4 个处理机同时），然后再执行 2 次乘法，需移数2 次（同时），最后再执行一次乘法（移数 4 次），因此所需T8=1x30+3x50+(1+2+4)x10=250ns(3) 加速比S=T0/T8=590/250=2.36在SIMD 上计算过程说明如下：1 ：在8 个PE 上执行加法，结果在8 个PE 中2 ：在PE2 、PE4 、PE6 、PE8 上执行乘，需要将PE1 、PE3 、PE5 、PE7 的运算结果分别移到PE2 、PE4 、PE6 、PE83 ：在PE4 、PE8 上执行乘法，需要将PE2 、PE6 的运算结果分别移到PE4 、PE84 ：在PE8 上执行一次乘法，需要将PE4 的运算结果移到PE8 。

计算机基础知识点归纳

计算机基础知识点归纳一、计算机的组成运算器和控制器等组成CPU ，CUP是硬件的核心，用于数据的加工处理，能完成各种算数、逻辑运算及控制功能。

存储器分为内存和外存，输入设备和输出设备合称外设。

CPU负责获取程序指令，对指令进行译码并执行。

功能包括：程序控制、操作控制、时间控制、数据处理以及对系统内部和外部的中断做出相应和相应的处理。

CPU主要由运算器、控制器、寄存器组和内部总线等部件组成。

运算器由算数逻辑单元（ALU）、累加寄存器（AC）、数据缓冲寄存器（DR）和状态条件寄存器（PSW）等组成，它是数据加工处理部件，完成计算机的算数和逻辑计算。

运算器是执行单元，接收控制器的命令进行动作。

控制器由程序计数器（PC）、指令寄存器（IR）、指令译码器、时序产生器和操作控制器组成，它控制整个CPU工作，保证程序正确执行且处理异常。

控制器包括指令控制逻辑、时序控制逻辑、总线控制逻辑和中断控制逻辑等几个部分。

指令控制逻辑完成取指令、分析指令和执行指令的操作；时序控制逻辑为每条指令按时间顺序提供应有的控制信号；总线逻辑是为多个功能部件服务的信息通路的控制电路；中断控制逻辑用于控制各种中断请求并根据优先级进行排队，逐个交给CPU处理。

寄存器可分为专用寄存器和通用寄存器。

运算器和控制器间的是专用寄存器，作用是固定的。

多核CPU即在一个单芯片上继承两个甚至多个处理器内核，CPU 所有计算，接收/存储命令、处理数据都由内核完成。

多核的主要优点是满足用户同时进行多任务处理的要求。

二、进制转换R转10进制：按权展开法 R的k次方求和（k…… 3 2 1 0 . -1 -2）10转R：短除法除以R 记住余数余数逆序排上去10 进制小数转: 主要是小数部分乘以2，取整数部分依次从左往右放在小数点后，直至小数点后为0。

Eg:0.125: 0.125*2 = 0.25 整数部分0 再将小数部分0.25乘以2，得0.5，然后取整数部分0 再将小数部分0.5乘以2，得1，然后取整数部分1 直到小数部分全为0 整数部分顺序排列得到结果 0.001三、数据表示数值在计算机中的表示的形式称为机器数，特点是二进制计数制，机器数对应的实际数称为数的真值。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

并行处理机和多处理机★1. 设a 为一个计算机系统中n 台处理机可以同时执行的程序代码的百分比，其余代码必须用单处理机顺序执行。

每台处理机的执行效率为xMIPS,并假设所有处理机的处理能力相同。

那么当n=16,x=4MIPS 的情况下，a 为多少的时候系统的性能能够达到40MIPS? A.0.84 B.0.88 C.0.92 D.0.96 【答案】D ★2. 设a 为一个计算机系统中n 台处理机可以同时执行的程序代码的百分比，其余代码必须用单处理机顺序执行。

每台处理机的执行效率为xMIPS,并假设所有处理机的处理能力相同。

那么当n=16,a=0.92的情况下，x 为多少的时候系统的性能能够达到40MIPS? A. 4MIPS B. 4.5MIPS C. 5MIPS D. 5.5MIPS 【答案】D ★3. 假设一台4处理机带有共享存储器的计算机来执行一个混和程序。

此多处理机有4种运行方式。

与1,2,3,4四台处理机处于活动状态相对应。

设i f 为i 台处理机用于执行上述程序的时间百分数。

已知1.0,2.0,3.0,4.04321====f f f f ；R1=4MIPS ，R2=8MIPS ，R3＝11MIPS ，R4=15MIPS ，试问上述混合程序的调和均值执行时间T 为多少 A. 0.25MIPS B. 0.375MIPS C. 0.5MIPS D. 以上都不对【答案】D ★★4. 假定有一个处理机台数为32的共享存储器多处理机系统。

假设典型处理机每条执行执行时间对全局存储器进行访问的平均次数为1.6。

共享存储器的平均存储时间为s μ1使用本地存储器的单处理机的速率为2MIPS 速率，问这个多处理机系统的有效MIPSA.15.24B.14.6C.13.5D.以上均不对【答案】A ★★★5. 在有n n n ⨯⨯个节点的三维网格中，求n n n ⨯⨯个数据相加的和，假设所有的数据已经被平均分配到了各个节点中，加法运算时间忽略不计，数据传递操作一次需要单位时间，问最小时间开销是多少？ A ．n/2 B ．n C ．3n/2 D ．2n 【答案】C ★6. 一台向量计算机只能以下述两种方式中的一种运行：向量方式，执行速度是10MFLOPS ；另一种是标量方式，执行速度Rs 为1MFLOPS 。

设a 是该计算机的典型程序代码中可向量化的百分比。

若要使R a 达到7.5MFLOPS ，问向量化百分比a 应有多大（Ra 使平均执行速度） A ． B ． C ． D ．【答案】C ★7. 设a 为一个计算机系统中n 台处理机可以同时执行的程序代码的百分比，其余代码必须用单处理机顺序执行。

而单个节点机的处理效率是4MIPS,那么在a=0.8的条件下，要让系统的效率达到20MIPS,则至少需要多少台节点机？ A.8 B.16 C.32D.以上均错误【答案】D ★8. 设a 为一个计算机系统中n 台处理机可以同时执行的程序代码的百分比，其余代码必须用单处理机顺序执行。

而单个节点机的处理效率是4MIPS,那么在a=0.8的条件下，要让系统的效率达到10MIPS,则至少需要多少台节点机？ A.4B.8C.16D.20【答案】C ★★9. 假定有一个处理机台数为p 的共享存储器多处理机系统。

设m 为典型处理机每条执行执行时间对全局存储器进行访问的平均次数。

设t为共享存储器的平均存储时间，x为使用本地存储器的单处理机MIPS 速率，再假定在多处理机上执行n条指令。

现在假设p=32,m=0.4,t=1μs,要让多处理机的有效性能达到56MIPS，需要每台处理机的MIPS效率是多少？A.2B.4C.5.83D.40【答案】B★★10.设有一个4个处理器的SIMD系统，假设在系统中访存取指和取数的时间可以忽略不计；加法与乘法分别需要2拍和4拍；在SIMD系统中处理器（机）之间每进行一次数据传送的时间为1拍；在SIMD系统中，PE之间采用线性环形互连拓扑，即每个PE与其左右两个相邻的PE直接相连。

求利用此系统计算表达式])[][(41iBiASi⨯=∑=所需的节拍数。

A. 23B. 12C. 11D. 10【答案】C ★11.设计一种采用加、乘和数据寻径操作的算法，计算表达式∑===321*iiiiBAs。

假设加法和乘法分别需要2个和4个单位时间，从存储器取指令、取数据、译码的时间忽略不计，所有的指令和数据已经装入有关的PE。

现有一台串行计算机，有一个加法器，一个乘法器，问最短多少单位时间计算出s？A. 192nsB. 130nsC. 128nsD. 以上结果都不对【答案】B★★12.设有一个4个处理器的MIMD系统，假设在系统中访存取指和取数的时间可以忽略不计；加法与乘法分别需要2拍和4拍；在MIMD系统中处理器（机）之间每进行一次数据传送的时间为1拍；在MIMD系统中，每个PE都可以和其它PE有直接的的通路。

求利用此系统计算表达式])[][(41iBiASi⨯=∑=所需的节拍数。

A. 23B. 12C. 11D. 10【答案】D ★★13. 试确定在具有8个PE 的MIMD 计算机系统中，计算下列表达式所用时间()∏=+=81i i i B A S其中，加法需用30ns ，乘法需用50ns 。

，数据由一个PE （计算单元）传送到另一个PE 需要10ns ，在MIMD 计算机中PE 间以全互连方式连接A. 250nsB. 210nsC. 200nsD. 180ns 【答案】B ★★★14. 设计一种采用加、乘和数据寻径操作的算法，计算表达式∑===321*i i ii B A s 。

假设加法和乘法分别需要2个和4个单位时间，从存储器取指令、取数据、译码的时间忽略不计，所有的指令和数据已经装入有关的PE 。

现有一台8个PE 的SIMD 计算机，8个PE 连成双向环结构，每个PE 可以用一个单位时间把数据直接送给它的相邻PE 。

每个PE 可以在不同时刻执行加法或乘法。

求最短求出s 的需要多少单位时间。

A. 70ns B. 64ns C. 62ns D. 50ns 【答案】D★★15. 什么是集中式共享多处理机？什么是分布式共享多处理机【答案】集中式共享多处理机：通过大容量的cache 和总线互联使各处理机共享个单独的集中式存储器的多处理机。

分布式共享多处理机：采用非集中式，存储器分布到各个处理机上的多处理机 ★★16. 简SIMD 计算机的分布式存储器与共享存储器的异同。

【答案】SIMD 计算机的分布式存储器与共享存储器的相同点都存在互联网络。

不同点式在共享内存方案中，共享的多体并行存储器通过对准网络与各处理单元相连。

在分布内存方案中，每个处理单元有自己的本地存储器，处理单元有自己的本地存储器，处理单元之间的数据通过数据寻径网络完成。

★17. 试分析与比较SIMD 计算机与向量计算机的相同与不同【答案】SIMD 计算机和向量计算机的相同点是两种计算机都能对大量数据进行向量处理，特别适用于高速数值计算。

不同点是SIMD 计算机获得高处理速度主要原因是采用资源重复的并行措施，多个处理单元并行工作，向量计算机依靠的是多功能流水线部件时间重叠提高速度；另一区别是SIMD 计算机有它的互联网络。

★18. 何谓SMP ？它的主要特点是什么？【答案】SMP 成为共享存储型多处理机，也成为对称型多处理机。

★★19. 何谓机群系统？它的主要特点是什么？【答案】机群系统是利用高速通用网络将一组高性能工作站或高档PC 机，按某种结构连接起来，并再并行程序设计以及可视化人机交互集成开发环境支持下，统一调度，协调处理，实现高效并行处理的系统。

特点：1. 系统开发周期短2. 用户投资风险小3. 系统价格低4. 节约系统资源5. 系统扩展性好6. 用户编程方便★★20. 试在含一个PE 的SISD 机和在含n 个PE 且连接成一线性环的SIMD 机上计算下列求内积的表达式：其中n=2k∑=∙=ni i i B A s 1假设完成每次ADD 操作需要2个单元时间，完成每次MULTIPLY 操作需要4个单位时间，沿双向环在相邻PE 间移数需1个单位时间(1)SISD 计算机上计算s 需要多少时间 (2)SIMD 计算机上计算s 需要多少时间(3)SIMD 机计算s 相对于SISD 计算的加速比是多少？【答案】 (1)4n+2(n-1) (2)124-++n k(3)()nk n n ++-+23124 ★21. 如果一台SIMD 计算机和一台流水线处理机具有相同的计算性能，对构成它们的主要部件分别有什么要求？【答案】一台具有n 个处理单元的SIMD 计算机与一台具有一条n 级流水线并且时钟周期为前者1/n 的流水线处理机的计算性能相当，两者均是每个时钟周期产生n 个计算结果。

但是，SIMD 计算机需要n 倍的硬件（n 个处理单元），而流水线处理机中流水线部件的时钟速率要求比前者快n 倍，同时还需要存储器的带宽也是前者的n 倍。

★★22. 今有K 对向量，其中第i 对由行向量Ri 和列向量Ci 组成，每个维数为N =2n ,可按下式计算第i 对向量的内积：下面是完成IP[i]（i = 1，2，…，K ）的算法。

1. 忽略初始化、下标修正和测试等所需的时间，试计算在单处理机上实现上述算法总共需多少时间，并表达成K 和N 的函数，假定完成乘法与加法需用相同的单位时间。

2. 为加速上述计算，可采用SIMD 机来发掘计算中的并行性，试求出下列两种不同的情况下的计算时间。

i. 用P=N 个处理单元PE 逐对地计算每对Ri 、Ci 的IP[i]。

（假设PE 间的数据传输不花时间）ii. 将一对向量分配给每个PE ，由此PE 来计算其内积。

在这种情况下P=K 【答案】1. 计算一对向量需要做N 次乘法，N 次加法，共需2N 个单位时间，所以计算K 对向量的内积需要2KN 个单位时间。

2. (i)每个IP[I]经过一个乘法时间算出，经过n 次加法求得最后的结果。

所以需要K(1＋n)个单位时间(ii)每个IP[I]经过N 个乘法时间算出，再经过N 次加法求得每个IP[I]，所以共需要2N 个单位时间★★23. 假定有一个处理机台数为p 的共享存储器多处理机系统。

设m 为典型处理机每条执行执行时间对全局存储器进行访问的平均次数。

设t 为共享存储器的平均存储时间，x 为使用本地存储器的单处理机MIPS 速率，再假定在多处理机上执行n 条指令。

请根据以上参数，确定多处理机的有效MIPS 速率。

【答案】px/(1+mtx) ★★24. 设有一个向量()1510,,,A A A A =，要计算其累加和∑=150i S iA ＝。