第二章多机系统结构1

合集下载

(自考02325李学干版)计算机系统结构课后习题

第二章数据表示与指令系统1.数据构造和机器的数据表示之间是什么关系？确立和引入数据表示的基来源则是什么？答：数据表示是能由硬件直接辨别和引用的数据种类。

数据构造反应各样数据元素或信息单元之间的构造关系。

数据构造要经过软件映象变换成机器所拥有的各样数据表示实现，所以数据表示是数据构造的构成元素。

不一样的数据表示可为数据构造的实现提供不一样的支持，表此刻实现效率和方便性不一样。

数据表示和数据构造是软件、硬件的交界面。

除基本数据表示不可以少外，高级数据表示的引入依照以下原则：（1）看系统的效率有否提升，能否养活了实现时间和储存空间。

（2）看引入这类数据表示后，其通用性和利用率能否高。

2.标记符数据表示与描绘符数据表示有何差异？描绘符数据表示与向量数据表示对向量数据构造所供给的支拥有什么不一样？答：标记符数据表示与描绘符数据表示的差异是标记符与每个数据相连，合存于同一储存单元，描绘单个数据的种类特征 ; 描绘符是与数据分开寄存，用于描绘向量、数组等成块数据的特色。

描绘符数据表示为向量、数组的的实现供给了支持，有益于简化高级语言程序编译中的代码生成，能够比变址法更快地形成数据元素的地点。

但负阶，最小为 0)最大阶(2^p-1)最小尾数值(rm^(-1))最大尾数值(1-rm^(-m'))可表示的最小值可表示的最大值阶的个数(2^p)可表示的尾数的个数可表示的规格化数的个数note:2^6-12^6-12^6-11/21/81/161-2^(-48)1-8^(-16) ，即(1-2^(-48)) 1-16^(-12)，即(1-2^(-48))1/21/81/162^63*(1-2^(-48))8^63*(1-8^(-16))16^63*(1-16^(-12))2^62^62^62^48*(2-1)/28^16*(8-1)/816^12*(16-1)/16 2^6*2^48*(2-1)/22^6*8^16*(8-1)/82^6*16^12*(16-1)/16描绘符数据表示其实不支持向量、数组数据构造的高效实现。

第2章多机系统结构

d.节点内的网络接口是松散耦合到I/O总线上的，而MPP的网
络接口是连到处理机接点的存储总线上的，可谓是紧耦合式的
2019/2/15
12
工作站机群COW
e.一个完整的OS系统驻留在每个节点之中，而MPP中通常只
是一个微核，COW的OS是工作站的UNIX，加上一个附加的软件层以支持单一系统映象、并行度、通信及负载平衡等 f.如今，MPP和COW之间的界线越来越模糊，如：IBM SP2虽视为MPP，但它却有机群结构 g.机群有性能价格比的优势，在发展可扩放并行机方面呼声
2019/2/15
2
按通信方式：
多处理机系统——通过共享存储器的共享变量相互通信 (无协议）多计算机系统——通过节点间消息传递实现通信（协议）按耦合度：紧耦合——物理位置紧密(共享存储、宽频带低延迟）松耦合——物理位置分散（分布存储）按控制方式：主从式——一台处理机为主机，运行操作系统，其它为从机。从机通过中断和主机交换信息均衡式——各处理机地位均等
了一个共享的存储器，对用户而言，形成了一个单地址的编址空间比MPP编程容易
2019/2/15
10
工作站机群COW
Cluster of Workstation
如：Berkeley NOW, Alpha FARM, Digita总线 IOB——I/O总线
2019/2/15
3
一般多处理机多为紧耦合系统、主从结构、
专用机多计算机多为松耦合系统，均衡结构、通用机但现在多计算机系统已经发展为紧耦合
2019/2/15
4
也可以从四个方面讨论并行计算机模型
并行计算机结构模型并行计算机访存模型并行计算机性能模型

计算机系统结构--向量处理机

如果程序的90％是向量运算，10％是标量运算。则向量平衡点为0.9。硬件利用率最高。向量处理机的向量平衡点必须与用户程序的向量化程度相匹配。 IBM向量计算机的设计思想与上述方法不同，它维持较低的向量与标量比例，定在3～5的范围之间。这种做法能够适应通用应用问题对标量和向量处理要求。
6.2.1 存储器－存储器结构
向量处理机中有多个高速流水线运算部件，存储器的访问速度是关键采用多个存储体交叉和并行访问来提高存储器速度，例如： CRAY-1有64个存储体，每个处理机访问4个存储体 STAR-100采用32个存储体交叉，每个存储体并行读出8个64位数据我国研制的YH-1向量计算机有37个存储体
把存储器-存储器结构中的缓冲栈改为向量寄存器，运算部件需要的操作数从向量寄存器中读取，运算的中间结果也写到向量寄存器中。向量寄存器与标量寄存器的主要差别是：一个向量寄存器能够保存一个向量，例如：64个64位寄存器。连续访问一个向量的各个分量。需要有标量寄存器和地址寄存器等。
采用寄存器-寄存器结构的主要优点：降低主存储器的流量。例如：采用寄存器-寄存器结构的 CRAY-1与采用存储器-存储器结构的 STAR-100比较，运算速度高3倍多，而主存流量低2.5倍。 STAR-100的主存储器流量： 32×8W/1.28us=200MW/S CRAY-1的主存储器流量： 4W/50ns=80MW/S
6.3 向量处理方式
要根据向量运算的特点和向量处理机的类型选择向量的处理方式。有三种处理方式： 1．横向处理方式，又称为水平处理方式，横向加工方式等。向量计算是按行的方式从左至右横向地进行。 2．纵向处理方式，又称为垂直处理方式，纵向加工方式等。向量计算是按列的方式自上而下纵向地进行。 3．纵横处理方式，又称为分组处理方

第二章 PLC的基本组成及工作原理

2.2 PLC的工作原理
继电器控制与 PLC控制的比较：
➢为了消除二者之间由于运行方式不同而造成的差异，考虑到继电器控制装置各类触点的动作时间一般在 100ms以上，而PLC扫描用户程序的时间一般均小于100ms。这样在对于I/O响应要求不高的场合， PLC与继电器控制装置的处理结果上就没有什么区别了。
2.1 PLC的基本组成
3)输入/输出模块
（1）输入接口作用：将按钮、行程开关或传感器等产生的信号，转换成数字信号送入主机。
内内1
内
内
.
内
输入n
内
COM
2.1 PLC的基本组成
3)输入/输出模块
（2）输出接口作用：将主机向外输出的信号转换成可以驱动外部执行电路的信号，以便控制接触器线圈等电器通断电；另外输出电路也使计算机与外部强电隔离。
并通过显示器显示出程序的内容和存储地址。（ 2 ）检查、校验用户程序。（ 3 ）接收现场数据。（ 4 ）执行用户程序。（ 5 ）故障诊断。
注意：PLC通常以字而不是以字节为单位存储和处理数据。
描述PLC性能的几个术语
位：二进制的一位，仅有1、0 数字：4位二进制数构成一个数字字节：2个数字或8位二进制数构成一个字节字：两个字节构成一个字。
• 继电器输出特点：低速大功率，用于用于直流、交流负载（隔离、功率放大）。
• 晶体管集电极输出特点：高速小功率，用于直流负载。
• 双向可控硅（晶闸管的一种）输出特点：高速大功率，用于交流负载。
2.1 PLC的基本组成
3)输入/输出模块-继电器输出
继电器输出
PLC
内
内
部
部
电
电J

02325计算机系统结构复习资料

第一章计算机系统结构的基本概念从处理数据的角度看，并行级别有位串字串，位并字串，位片串字并，全并行。

位串字串和位并字串基本上构成了SIMD。

位片串字并的例子有：相联处理机STARAN，MPP。

全并行的例子有：阵列处理机ILLIACIV。

从加工信息的角度看，并行级别有存储器操作并行，处理器操作步骤并行，处理器操作并行，指令、任务、作业并行。

存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的，采用单体多字、多体单字或多体多字的交叉访问主存系统，进而采用按内容访问方式，位片串字并或全并行方式，在一个主存周期内实现对存储器中大量字的高速并行操作。

例子有并行存储器系统，以相联存储器为核心构成的相联处理机。

处理器操作步骤并行是指在并行性概念中引入时间因素，让多个处理过程在时间上错开，轮流重复地执行使用同一套设备的各个部分，加快硬件周转来赢得速度。

例子有流水线处理机。

处理器操作并行是指一个指令部件同时控制多个处理单元，实现一条指令对多个数据的操作。

擅长对向量、数组进行处理。

例子有阵列处理机。

指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。

例子有多处理机，计算机网络，分布处理系统。

并行性的开发途径有时间重叠(Time Interl eaving )，资源重复(Resou rceReplication)，资源共享(ResourceSharing)。

时间重叠是指在并行性概念中引入时间因素，让多个处理过程在时间上错开，轮流重复地执行使用同一套设备的各个部分，加快硬件周转来赢得速度。

例子有流水线处理机。

资源重复是指一个指令部件同时控制多个处理单元，实现一条指令对多个数据的操作。

例子有阵列处理机，相联处理机。

资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率，从而提高系统性能。

例子有多处理机，计算机网络，分布处理系统。

SISD:一个指令部件控制一个操作部件，实现一条指令对一个数据的操作。

微机原理课件第二章 8086系统结构

但指令周期不一定都大于总线周期，如MOV AX，BX
操作都在CPU内部的寄存器，只要内部总线即可完成，不需要通过系统总线访问存储器和I/O接口。
2021/8/17
17
• 8086CPU的典型总线时序，充分体现了总线是严格地按分时复用的原则进行工作的。即：在一个总线周期内，首先利用总线传送地址信息，然后再利用同一总线传送数据信息。这样减少了CPU芯片的引脚和外部总线的数目。
• 执行部件（EU）
• 功能：负责译码和执行指令。
2021/8/17
5
• 联系BIU和EU的纽带为流水指令队列
• 队列是一种数据结构，工作方式为先进先出。写入的指令只能存放在队列尾，读出的指令是队列头存放的指令。
2021/8/17
6
•BIU和EU的动作协调原则 BIU和EU按以下流水线技术原则协调工作，共同完成所要求的任务： ①每当8086的指令队列中有空字节，BIU就会自动把下一条指令取到指令队列中。 ②每当EU准备执行一条指令时，它会从BIU部件的指令队列前部取出指令的代码，然后译码、执行指令。在执行指令的过程中，如果必须访问存储器或者I／O端口，那么EU就会请求BIU，完成访问内存或者I／O端口的操作； ③当指令队列已满，且EU又没有总线访问请求时，BIU 便进入空闲状态。（BIU等待，总线空操作） ④开机或重启时，指令队列被清空；或在执行转移指令、调用指令和返回指令时，由于待执行指令的顺序发生了变化，则指令队列中已经装入的字节被自动消除，BIU会接着往指令队列装入转向的另一程序段中的指令代码。（EU等待）
•CF（Carry Flag）—进位标志位，做加法时最高位出现进位或做减法时最高位出现借位，该位置1，反之为0。

计算机系统结构(第三版)张晨曦课后答案

m
平均时钟周期数 1 2 4 2
求该计算机的有效 CPI、MIPS 和程序执行时间。
后
解： CPI =
∑ ( IC × CPI ) / IC
i i
CPI =
f 400 ×10 6 = = 225.225MIPS CPI ×10 6 1.776 ×10 6 程序执行时间=（ 45000 × 1 + 75000 × 2 + 8000 × 4 + 1500 × 2 ）／400=575⎧s MIPS速率 =
3
按照同样的逐层递推关系，不难求得第四级等效程序的总的执行时间为：
1.2 传统存储程序计算机的主要特征是什么？存在的主要问题是什么？目前的计算机系统是如何改进的？存储程序计算机在体系结构上的主要特点： (1) 机器以运算器为中心。 (2) 采用存储程序原理。程序(指令)和数据放在同一存储器中，并且没有对两者加以区分。指令和数据一样可以送到运算器进行运算，即由指令组成的程序自身是可以修改的。 (3) 存储器是按地址访问的、线性编址的空间。 (4) 控制流由指令流产生。 (5) 指令由操作码和地址码组成。操作码指明本指令的操作类型，地址码指明操作数和操作结果的地址。 (6) 数据以二进制编码表示，采用二进制运算。传统存储程序计算机体系结构存在的主要问题及其改进：（1）分布的 I/O 处理能力存储程序计算机以运算器为中心、所有部件的操作都由控制器集中控制，这一特点带来了慢速输入输出操作占用快速运算器的矛盾。为了克服这一缺点，人们先后提出各种输入/输出方式。（2）保护的存储器空间把指令和数据放在同一存储器中有优缺点。现在绝大多数计算机都规定：在执行过程中不准修改程序。（3）存储器组织结构的发展按地址访问的存储器具有结构简单、价格便宜、存取速度快等优点。但是在数据

第二章(1)计算机数控系统

(四)插补计算
其主要功能是： (1)根据操作面板上“进给修调”开关的设定值，计算本次插补周期的实际合成位移量： (2)将ΔLi按插补的线形(直线、圆弧等)和本插补点所在的位置分解到各个进给轴，作为各进给轴的位置控制指令。
CNC装置的工作过程
(五)位置控制处理
位置控制数据转换流程如图3—18所示。位置控制处理主要进行各进给轴跟随误差(Δx3、Δy3)的计算，并进行调节处理，其输出为位移速度控制指令(Ux,Uy)。
CNC装置的硬件结构
(2)多机系统。
是指整个CNC装置中有两个或两个以上的CPU，也就是系统中的某些功能模块自身也带有CPU，根据这些CPU间的相互关系的不同又可将其分为： ①主从结构系统，在该系统中只有一个CPU(通常称为主CPU)对系统的资源 (系统存储器，系统总线)有控制和使用权，而其他带有CPU的功能部件(通常称之为智能部件)，则无它只能接受主CPU的控制命令或数据，或向主CPU 发出请求信息以获得所需的数据。只有一个CPU处于主导地位，其他CPU 处于从属地位的结构，称之为主从结构。 ②多主结构系统：在该系统中有两个或两个以上的带CPU的功能部件对系统资源有控制或使用权。功能部件之间采用紧耦合(即均挂在系统总线上，集中在一个机箱内)，有集中的操作系统，通过总线仲裁器(软件和硬件)来解决争用总线问题，通过公共存储器来交换系统信息。 ③分布式结构系统：该系统有两个或两个以上的带有CPU的功能模块，每个功能模块有自己独立的运行环境(系统总线、存储器、操作系统等)，功能模块间采用松耦合，即在空间上可以较为分散，各模块间采用通信方式交换信息。
CNC系统的组成
加工程序
C N C 装置
可编程控制器
主轴驱动装置进给驱动装置

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2013-8-8
11
工作站机群COW
机群性：是低成本的变形的MPP
COW的重要界限及特征：
a.每个节点都是完整的工作站(不包括监视器、键盘、鼠标等) 有时也称“无头工作站”，节点也可以是一台PC或SMP
b.各节点通过一种低成本的商品网络(如以太网、FDDI和ATM
开关等)互连 c.各节点内总是有本地磁盘，而MPP无
d.节点内的网络接口是松散耦合到I/O总线上的，而MPP的网
络接口是连到处理机接点的存储总线上的，可谓是紧耦合式的
2013-8-8
12
工作站机群COW
e.一个完整的OS系统驻留在每个节点之中，而MPP中通常只
是一个微核，COW的OS是工作站的UNIX，加上一个附加的软件层以支持单一系统映象、并行度、通信及负载平衡等 f.如今，MPP和COW之间的界线越来越模糊，如：IBM SP2虽视为MPP，但它却有机群结构 g.机群有性能价格比的优势，在发展可扩放并行机方面呼声
2013-8-8
3
一般多处理机多为紧耦合系统、主从结构、
专用机多计算机多为松耦合系统，均衡结构、通用机但现在多计算机系统已经发展为紧耦合
2013-8-8
4
也可以从四个方面讨论并行计算机模型
并行计算机结构模型并行计算机访存模型并行计算机性能模型
并行计算机Cache一致性
2013-8-8
2013-8-8
2
按通信方式：
多处理机系统——通过共享存储器的共享变量相互通信 (无协议）多计算机系统——通过节点间消息传递实现通信（协议）按耦合度：紧耦合——物理位置紧密(共享存储、宽频带低延迟）松耦合——物理位置分散（分布存储）按控制方式：主从式——一台处理机为主机，运行操作系统，其它为从机。从机通过中断和主机交换信息均衡式——各处理机地位均等
了一个共享的存储器，对用户而言，形成了一个单地址的编址空间比MPP编程容易
2013-8-8
10
工作站机群COW
Cluster of Workstation
如：Berkeley NOW, Alpha FARM, Digital Tracluster 等 LD——本地磁盘 MB——存储总线 IOB——I/O总线
2013-8-8
7
高速缓存、处理机
对称多处理机SMP
Symmetric Multiprocessor
IBM R50 SGI Power Challenge DEC Alpha服务器8400和曙
光一号使用商品化的微处理器(带有片上或片外的高速缓存)，主要用于商务，如数据库、在线处理事务、数据仓库等对称性：每个处理器可等同地访问SM、I/O及OS服务，有利于开发高并行度共享存储：使系统中的PE不能太多，总线与交叉开关也难以扩展
2013-8-8
25
全高速缓存存储访问模型COMA
是NUMA的一种特例
Cache-only Memory Access
DIR：目录
2013-8-8
26
全高速缓存存储访问模型COMA
特点：
(1) 各处理器中无存储层次结构，全部高速缓存构成了全局地址空间
(2) 利用分布的高速缓存目录D进行远程高速缓存的访问
2013-8-8
18
小结
e.地址空间 MPP ：多地址空间 COW：多地址空间其余：单地址空间 f.M系统 PVP ：集中共享 SMP：集中共享 DSM：分布共享 MPP ：分布共享 COW：分布共享 g.访存模型 PVP、SMP：UMA MPP、COW：NORMA DSM：NUMA
2013-8-8
2013-8-8
33
在粗粒度（Coarsegrain）情况下，R/C
比值比较大，每个单位计算只需要少量的通信。在细粒度（Finegrain）情况下，R/C比值比较小，每个单位计算有很大的通信量和其它的开销。细粒度并行性需要许多台处理机，而粗粒度并行性只需较少台数的处理机。
2013-8-8
31
小结
1. 分布的存储器从编程的观点看可以是共享的，也可以非共享的 2. 共享存储结构多处理机可同时支持共享存储及消息传递编程模型 3. 共享存储的编程模型可同时执行共享存储结构和分布式存储结构
2013-8-8
32
§2.4并行计算机性能模型
粒度概述：粒度是衡量软件进程所含计算量的尺度设R代表程序的执行时间，C代表用于通信的开销，用R/C比值表示每一单位计算的开销，即衡量任务粒度（Task Granularity）大小的尺度。
2013-8-8
8
大规模并行处理机MPP
Massively Parallel Processing
Intel Paragon, IBM SP2,Intel TFLOPS
曙光-1000超大型计算机系统特性： a.处理节点采用商品微处理器 b.有物理上的分布式存储器 c.采用高通信带宽及低延迟的互连网络(专门定制) d.能扩放至成百上千个处理器 e.是一种异步的MIMD机器，程序有多个进程构成，每个都有其私有空间，由进程传递消息主要应用：科学计算、工程模拟、信号处理等以计算为主的领域
34
细粒度并行性：把一个程序尽可能地分解
成能并行执行的小任务。在极端情况下，一个小任务只完成一个操作。通常，一个小任务包含几条指令。
2013-8-8
35
假设：
（1）每个任务的执行时间为R个单位。（2）当两个任务不在同一台处理机上时，其通信所需的额外开销为C个单位时间。当两个任务在同一台处理机上时，通信所需的额外开销为0。
2013-8-8
29
非远程存储访问模型NORMA
在一个分布存储的多计算机系统中，如果所有存储器都是私有特点：的，仅能由其处理器所访问，就称为NORMA。 (1)所有M皆为私有
(2)绝大多数NORMA不支持远程 M的访问 (3)在DSM中，NORMA消失
2013-8-8
30
小结
2013-8-8
(3) COMA中的高速缓存容量一般都大于2级高速缓存的容量 (4) 使用COMA时，数据开始时可任意分配，因为在运行时它最终被
迁移到要用到它的地方
实例：
瑞典计算机科学研究所的DDM
注意：这里Cache和其它计算机结构的Cache的功能的差异
Kendall Square Research 公司的KSR-І等
2013-8-8
20
均匀存储访问模型UMA
Uniform Memory access
特点：
(1) (2) (3) (4)
2013-8-8
物理存储器被所有处理器均匀共享所有处理器访问任何存储字要相同的时间(均匀) 每台处理器可带有高速缓冲cache 外设也可以一定形式共享
21
均匀存储访问模型UMA
第二章并行计算机模型
§2.1 概述
以MIMD模式运行的计算机系统包含多个处理机或计算机的单一计算机系统通过互连网将各处理机、计算机或存储单元相连接
2013-8-8
1
基本特性：单处理机的能力和处理机阵列大小的乘积决定并行计算机系统的能力互连网络决定解决问题的类型和系统的适应能力控制方式分为集中式和分布式
很高
2013-8-8
13
公用结构
SMP 、MPP、DSM 、COW 等并行结构渐趋一致 ,DSM 是SMP 与 MPP的自然结合,MPP与COW的界线逐渐不清，它们最终趋于一致，形成当代并行机的公用结构。其三种不同的共享结构如下图：
2013-8-8
14
shell结构
系统中大量的节点通过高速网络连接，节点通常遵循shell结构(Shell Architecture)，其中一个专门设计定制的电路(叫做shell)，将商品微处理器及其余的节点，包括板级cache、局存、NIC及磁盘连接起来。在一个节点内可有不止一个处理器。这种Shell结构的优点是当处理器芯片更新换代时，只要改变shell。
5
§2.2并行计算机结构模称多处理机SMP 大规模并行处理机MPP 分布共享存储多处理机DSM 工作站集群COW
通用结构
2013-8-8
6
并行向量处理机PVP
Parallel Vector Processor，典型的并行向量处理机的结构 1.性能向量处理机 2.瓶颈 3.扩展 4.改进共享存储器 5.可行性从5个方面对结构进行分析 Cray C-90 ,Cray T-90 , NEC SX-4 和我国的银河-І等都是PVP，这样的系统包含少量的高性能的向量处理器，每个至少具有 1Gflops的处理能力，系统中使用了高带宽的交叉开关网络，存储器可达每秒兆字节的速度。这样的机器通常无cache，使用大量的向量寄存器及指令缓冲器。
Tightly Coupled System
这种系统由于高度共享资源而称为紧耦合系统对称多处理机SMP: Symmetric Multiprocessor 所有处理机都能等同地访问所有I/O设备,能同样地执行
程序(如OS内核,I/O内核,I/O服务程序等) 非对称多处理机: 只有一台或一组处理器(称为主处理器)，它能执行OS 并能操纵I/O，而其余处理器无I/O能力(称为从处理器)，只在主处理器监控之下执行用户代码。 UMA适用于通用或分时应用。
19
§2.3并行计算机访存模型
从系统访问存储器模式的角度来讨论多处理机，与上面所讨论的模型是并行计算机系统的两个方面。分类：
均匀存储访问模型UMA 非均匀存储访问模型NUMA
全高速缓存存储访问模型COMA
高速缓存一致性非均匀存储访问模型CC-NUMA 非远程存储访问模型NORMA 小结