第6章并行计算机的同步与通信

合集下载

计算机组成原理第六章课件白中英版

16÷（4×0.2×10-6）bps＝20×106 bps＝2.5 MB/S
66MHz的Pentium，基本非流水线总线周期
64÷2×66×106 bps＝264 MB/S
66MHz的Pentium，2-1-1-1猝发读周期
32÷5×66×106 B/S＝422.4 MB/S
【例1】(1)某总线在一个总线周期中并行传送4个字节的数据，假设一个总线周期等于一个总线时钟周期，总线时钟频率为33MHz，则总线带宽是多少?
STROBE*（选通）信号
•输出低有效，才能使打印机接收数据
ACK*（响应）信号
•打印机接收数据结束回送负脉冲响应信号
BUSY（忙状态）信号
•打印机忙于处理接收到的数据，不能接收新的数据
6.3.3 总线数据传送模式
读数据传送：数据由从设备到主设备写数据传送：数据由主设备到从设备猝发传送（数据块传送）
演示
每个数据位都需要单独一条传输线。二进制数 “0”或“1”在不同的线上同时进行传送
串行通信
串行通信：将数据分解成二进制位用一条信号线，一位一位顺序传送的方式
串行通信的优势：用于通信的线路少，因而在远距离通信时可以极大地降低成本
通信协议（通信规程）：收发双方共同遵守
解决传送速率、信息格式、位同步、字符同步、数据校验等问题
发送8位数据：59H＝01011001B，偶校验、两个停止位
6.3.1 总线的仲裁
主设备(Master)：控制总线完成数据传输从设备(Slave)：被动实现数据交换总线仲裁：决定当前控制总线的主设备
•集中仲裁：中央仲裁器负责 •分布仲裁：比较各个主设备仲裁号决定
某一时刻，只能有一个主设备控制总线，其它设备此时可以作为从设备

计算机组成原理(简答题)

计算机组成原理(简单题)第一章概论1、计算机的应用领域：科学计算、数据处理、实时控制、辅助设计、通信和娱乐。

2、计算机的基本功能：存储和处理外部信息，并将处理结果向外界输出。

3、数字计算机的硬件由：运算器、控制器、存储器、输入单元和输出单元。

4、软件可以分成系统软件和应用软件。

其中系统软件包括：操作系统、诊断程序、编译程序、解释程序、汇编程序和网络通信程序。

5、计算机系统按层次进行划分，可以分成，硬件系统、系统软件和应用软件三部分。

6、计算机程序设计语言可以分成：高级语言、汇编语言和机器语言。

第二章数据编码和数据运算1、什么是定点数？它有哪些类型？答：定点数是指小数点位置固定的数据。

定点数的类型有定点整数和定点小数。

2、什么是规格化的浮点数？为什么要对浮点数进行规格化？答：规格化的浮点数是指规定尾数部分用纯小数来表示，而且尾数的绝对值应大于或等于1/R并小于等于1。

在科学计数法中，一个浮点数在计算机中的编码不唯一，这样就给编码带来了很大的麻烦，所有在计算机中要对浮点数进行规格化。

3、什么是逻辑运算？它有哪些类型？答：逻辑运算时指把数据作为一组位串进行按位的运算方式。

基本的逻辑运算有逻辑或运算、逻辑与运算和逻辑非运算。

4、计算机中是如何利用加法器电路进行减法运算的？答：在计算机中可以通过将控制信号M设置为1，利用加法器电路来进行减法运算。

第三章存储系统1、计算机的存储器可以分为哪些类型？答：计算机的存储器分成随机存储器和只读存储器。

2、宽字存储器有什么特点？答：宽字存储器是将存储器的位数扩展到多个字的宽度，访问存储器时可以同时对对个字进行访问，从而提高数据访问的吞吐量。

3、多体交叉存储器有什么特点？答：多体交叉存储器是由对个相互独立的存储体构成。

每个存储器是一个独立操作的单位，有自己的操作控制电路和存放地址的寄存器，可以分别进行数据读写操作，各个存储体的读写过程重叠进行。

4、什么是相联存储器？它有什么特点？答：相联存储器是一种按内容访问的存储器。

微机第6章并行通信和串行通信

(2)同步传送：5~8位/字符，内部或外部同步可自动插人同步字符
(3)异步传送：5~8位/字符，时钟速率为通信波特率的1、16或64倍
(4)可自动产生、检测和处理终止字符，可产生1、1.5或2位的停止位
(5)波特率在同步方式时为0～64Kbps，异步方式时为0～19.2Kbps
(6)全双工、双缓冲器发送器和接收器
3. 信号传输方式（续）
常用的调制方式有三种：调幅、调频和调相，分别如下图所示。
4. 调制解调器
• 调制（Modulating）
– 把数字信号转换为电话线路传送的模拟信号
• 解调（Demodulating）
– 将电话线路的模拟信号转换为数字信号
• 调制解调器MODEM
– 具有调制和解调功能的器件合制在一个装置
与并行相比串行通信的特点
将数据分解成二进制位用一条信号线，既传送数据信息，又传送控制信息
要求数据格式固定，分为异步和同步数据格式
串行通信中对信号的逻辑定义与TTL不兼容，需进行逻辑关系和逻辑电平转换
串行传送信息的速率需要控制，要求双方约定通信传输的波特率
6.4 可编程并行通信接口芯片8255A
3．端口C的使用较特殊，除工作在方式0作为数据端口之外，当工作在方式1和方式2时，它的大部分引脚被用作联络信号，端口C还可以进行按位置位 /复位操作
二．8255A的编程结构
8255A由以下几部分组成：见图 1．三个数据端口A，B，C 这三个端口均可看作是I/O 口，但它们的结构和功能也稍有不同。 A口：是一个独立的8位I/O 口，它的内部有对数据
字符速率与波特率两者关系
字符速率：每秒钟传输的字符数。波特率：指单位时间内传送二进制数据的位数。单位为：b/s

微机原理与接口技术_第6章 IO接口

三、I/O端口编址（续） 2.I/O独立编址(续)
缺点：专用I/O指令增加指令系统复杂性，且I/O指令类型少，程序设计灵活性较差；要求处理器提供MEMR#/MEMW#和IOR#/IOW#两组控制信号，增加了控制逻辑的复杂性。

三、I/O端口编址（续）
PC系列微机I/O端口访问 1.I/O端口地址空间
程序控制方式
程序控制方式是指CPU与外设之间的数据传送由程序控制完成。程序控制方式又分为无条件传送和条件传送两种 1.无条件传送方式（同步传送）特点：输入时假设外设已准备好，输出时假设外设空闲。要求：输入接口加缓冲器，输出接口加锁存器。应用：对简单外设的操作。
1. 无条件传送方式（同步传送）输入接口的设计要求:
寻址确定输入端口地址 AB、M/ IO、ALE、DT/R 等待数据输入等待数据输入输入缓冲器读入数据输入缓冲器 DB CPU
一、 I/O 接口的功能（续）
3. I/O接口应具有的功能（解决的方案）
1）设置数据缓冲器以解决两者速度差异所带来的不协调问题；输出时： CPU DB 锁存器输出设备数据线
以上三类信息分别通过各自的寄存器和相应的控制逻辑来完成信息的传送。通常将这类寄存器和相应的控制逻辑称为I/O端口。CPU与一个外设之间通常有三个端口。数据端口 (输入/输出)；状态端口；控制端口。
二、I/O接口的一般结构（续） I/O接口组成：接口由接口硬件和接口软件组成。 1.接口硬件
接口

这类接口面对总线，因此要使用三态输出器件；对于输入信号有记忆功能的一般使用三态门；对于输入信号无记忆功能的一般还要增加锁存功能；
1. 无条件传送方式（同步传送）

第6章6.2节 UART串行接口

4. 多机通信
图6-9多机通信连接图
6．2．4 串行口应用举例
例1、用两片8位串入并出移位寄存器74HC164扩展16位输出接口。图6-10是利用74HC164扩展的16位发光二极管接口电路。编程使这16个发光二极管交替为间隔点亮状态，循环交替时间为2秒钟。。
解：
图6-10 利用串行口扩展输出接口
发送操作：数据写入发送缓冲寄存器SBUF （99H），串行口即把数据以设定的波特率从 TXD端送出（低位在前பைடு நூலகம்，发送完后置中断标志TI=1。 MOV TMOD, #data MOV SBUF, #data JNB TI, $ CLR TI RET
接收操作：REN是串行口接收器允许接收控制位。当RI=0，软件置REN为1时，即开始从RXD端以设定的波特率输入数据（低位在前），当接收到数据时，置中断标志RI=1。
图6-7
通信方式示意图
4. 通信协议计算机之间进行数据传输时的一些约定，包括通信方式、帧格式、波特率、命令码的约定等。
6．2．2 80C51串行口简介 80C51串行口简介
1. 串行口结构与工作原理
80C51的串行口是一个可编程的全双工串行通信接口，通过软件编程它可以做通用异步接收和发送器UART（Universal Asynchronous Receiver／Transmitter），也可做同步移位寄存器用。其帧格式可设置8位、10位或11位，并能设置不同的波特率。
6．2 UART串行接口 UART串行接口
教学目的：了解80C51系列单片机UART串行接口的结构、原理及应用；能够采用查询方式进行串行通信。教学重点：1. UART串行接口的工作原理； 2. UART串行接口的4种工作方式的编程、应用。教学难点：1 .多机通信方式 2. 波特率值的设置

全站仪的数据通信

• 图６-３是Ｌｅｉｃａ全站仪使用的ＵＳＢ接口数据线，实际上就是串行接口与ＵＳＢ接口的转换。
上一页下一页返回
6．１数据通信的概念
• ６.１.３数据通信参数
• 串口通信参数指的是比特率、数据位、奇偶校验位和停止位。为了实现全站仪与计算机之间正常通信，全站仪与计算机两端的通信参数设置必须一致。
上一页下一页返回
６．２全站仪与计算机的数据通信
• （１１）选取需在文本文件中存储的数据（执行“编辑”→“全选” 命令后，单击左键或者在窗口内按住左键下拉并找到文件）。
• （１２）执行“编辑”→“复制”命令后，单击，将所选数据复制至剪贴板。
• （１３）执行“文件”→“退出”命令后单击，在提示“已处于连接状态，确实要断开吗？”和“保存会话结果‘***’？”时，分别单击“是”按钮退出连接操作并存储超级终端过程文件。
• （１４）执行“开始”→“程序”→“附件”→“写字板”命令，单击左键。
• （１５）在“写字板”下执行“编辑”→“粘贴”命令后单击，将剪贴板中的复制数据粘贴到写字板下。
• （１６）执行“文件”→“另存为”命令后单击，输入文件名，将“ 存为类型”框设为“文本文档”，然后保存。
上一页下一页返回
６．２全站仪与计算机的数据通信
位地在一条信号线上传送的。这种方式传输速度慢，但设备要求简单，价格低廉，由于是在一条线上传输，每一个二进制数无论传输快慢，最终均能组成完整而准确的信息，信号质量高，是常用的信息交换方法。串行通信适用于对通信速度要求不是很高的设备，如数字化仪、全站仪、ＧＰＳ以及鼠标等。 • 串行通信有两种工作方式，即同步传输和异步传输。同步传输是指每一个数据位都以相同的时间间隔发送，而接收时也以发送相同的时间间隔接收每一位信息。同步传输较异步传输速度快，但是由于同步传输要求使用时钟来实现发送端与接收端的同步，故硬件较复杂。全站仪传输数据量不大，常采用串行异步传输方式。

第6章作业参考答案

2.30 对8251A芯片的偶地址端口进行读操作时，可从状态寄存器中读出状态信息。（×）
9
三、简答题
3.1 8255A的方式选择控制字和端口C置0/置1控制字都是写入控制端口的，8255A是怎样识别的？解：通过最高位识别，D7=1，为方式选择控制字；D7=0，为端口C置0/置1控制字。
率因子为16，则波特率为
。（A）
A. 1200 B. 2400 C. 9600
D. 19200
5
二、判断对错，对的打“√”，错的打“χ”
2.1 锁存器即可作为输出接口，又可作为输入接口使用。（×）
2.2 CPU送给8255A的控制字，以及输入数据和输出数据都通过 8255A内的数据总线缓冲器传送。（ √ ）
B. -5V~+5V
C. -15V~+15V D. 0~+15V
1.16 异步串行通信中，常采用波特率的16倍频作为接收时钟，
其目的是
。（B）
A. 提高采样精度 B. 识别正确的起始位 C. 提高接收速率 4
1.17 在异步串行输入/输出接口中，实现并行数据与串行数据的转换的主要功能部件是。（A）
2.6 利用8255A的C口按位置位/复位功能，一次可使C口的几位同时置1或置0。（×）
2.7所谓并行接口和串行接口，顾名思义，就是指I/O接口与
CPU和外设之间的通信方式都是一个为并行，一个为串行。（×）
6
2.8 8255A工作于方式2时，C口的8条线均不能用于输入/输出。（×）
3
1.12 两台PC机通过其串行口直接通信时，通常只使用
三
根信号线。（A）
A. TXD、RXD和GND

第6章(1)计算机网络概述

28
网络体系结构：指计算机网络的各个层和在各层上使用的全部协议。
网络体系结构定义了一个框架，它使这些用不同媒介连接起来的不同设备和网络系统在不同的应用环境下可实现互操作，并满足各种业务的需求。任何厂商的任何产品、以及任何技术只要遵守这个空间的行为规则，就能够在其中生存并发展。
网络体系结构采用分层处理方法解决问题，把复杂的网络互联问题划分为若干个较小的、单一的问题，在不同层上予以解决。
29

接口：
每层都是建筑在它的前一层的基础上，每层间有相应的通信协议，相邻层之间的通信约束称为接口。接口用于说明上层如何使用下层的服务。

服务：
在分层处理后，相似的功能出现在同一层内，每一层仅与其相邻上、下层通过接口通信，该层使用下层提供的服务，并向上层提供服务。
服务用于说明某一层为上一层提供一些什么功能。
上、下层之间的关系是下层对上层服务，上层是下层的用户。
30
相关国际机构简介：在计算机网络标准领域中，有各种类型的组织参与标准的指定和推广。
1.国际标准领域：国际标准组织 ISO (International Organization for Standardization) 各国标准化团体组成的世界性的联合会。位于瑞士的日内瓦，有100多个国家加入。美国国家标准化协会 ANSI (American National Standards Institute) 国家性民间组织，ANSI标准常常被ISO采纳为国际标准电子及电气工程师协会 IEEE (Institute of Electrical and Electronics Engineers) 国际性的电子技术与信息科学工程师的协会，是世界上最大的专业技术组织之一，拥有来自175个国家的36万会员(到2005年)。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

存储转发store-and-forward 问题：延迟大，缓存多
转发部件
15
互连网络的消息传递通信方式
电路交换circuit switching
问题：冲突多，利用率低
16
互连网络的消息传递通信方式
虚拟切换virtual cut-through
问题：缓存多
flits
17
互连网络的消息传递通信方式
21
解：（1）
任务在单个核的计算机上运行时间为12秒；在双核计算机上的运行时间为1+10/2+1 =
7秒，加速比为12/7 = 1.71；在4核计算机上的运行时间为1+10/4+1 =
4.5秒，加速比为12/4.5 = 2.67；在8核计算机上的运行时间为1+10/8+1 =
3.25秒，加速比为12/3.25 = 3.69；在16核计算机上的运行时间为1+10/16+1
当一个线程拥有一个锁而被切换出去时其他的线程如果需要同一个锁的话都不能运行下去
其他线程都围着拥有锁的线程团团转
死锁Deadlock
锁的拥有和依赖关系形成一个环
10
死锁及其解决
死锁的原因
对资源（锁）的访问是独占的线程在已经持有一个资源时继续请求其他资源所有线程都不放弃已经持有的资源线程对资源的请求形成一个环
CPU 0读，CPU 1读，CPU 2读，CPU 1替换，CPU 0写
试写出每次访问后该块的有效指示位段的变化情况，假设一致性操作采用写无效策略。
事件初始 CPU 0读 CPU 1读 CPU 2读 CPU 1替换 CPU 0写
指示状态位段 0000 0001 0011 0111 0101 0001
32
例6-4
在一个共享L2 cache的双核处理器芯片中，两个L1 cache通过片内总线与L2 cache连接，并采用MESI协议保持一致性。假设L1 cache各有4个块，采用全相联地址映像和LRU替换策略，每个块的初始状态都是无效的。在以下读访问块地址序列下，试画出两个L1 cache中块的分配情况，并标出每个块的状态。
线程之间对共享变量的不同的读-写和写-写访问顺序导致不同的程序执行结果
源自线程间的数据相关性
并行计算机的通信方式
共享存储器互连网络的消息传递
3
共享存储器通信
共享变量最简单的通信方式没有同步功能
信号（signal）一个二进制变量可以表示条件、状态、锁和其它同步信息不能传递数据内容
常见的互斥机制
锁信号量临界区
5
共享存储器通信
锁
一种互斥变量一次只能被一个线程获得
信号量
通过PV操作在线程间传递同步信息
原子操作
P操作将一个变量减1
减后的变量小于0时线程被阻塞
V操作将一个变量加1
加后的变量大于或等于0时释放一个线程
6
共享存储器通信
临界区
短小的、不能被中断的程序段进入的线程数量是有限制的通常只允许一个线程进入临界区可以采用锁机制来实现
输带宽通信延迟
发送的时间开销信号传输时间传输持续时间接收方的时间开销通信延迟隐藏能力通信时间与计算时间或者其他通信时间的重叠程度
20
例6-2
1个计算任务在单个核的计算机上运行的启动时间为1 秒，运算时间为10秒，数据结果汇总的时间为1秒。如果将该计算任务放在多核处理器的计算机上运行，将运算部分分解成多个线程并行执行。
读写锁多读单写锁
限制写操作只能由一个线程执行
用于对共享变量的读写操作自旋锁
非阻塞的锁用于多处理机系统和多核系统
9
阻塞型锁机制的问题
优先级的颠倒priority inversion
当一个低优先级的线程占用了一个锁之后，需要同一个锁的高优先级线程就只能等待。
护航Convoying
RH 修改
RME WH
WH
旨在修改的读
WH
填充 cache 行
SHR
共享 RH
SHR
独占 RH
31
例6-3
设单总线连接的两个CPU中采用MESI协议进行一致性操作，初始时某cache块都在无效状态，然后两个CPU对该存储块分别进行如下操作：
CPU A读，CPU B读，CPU A写，CPU B读，CPU B写
试写出每次访问后两个块的状态变化情况。
事件初始 CPU A读 CPU B读 CPU A写 CPU B读 CPU B写
状态A 无效独占共享修改共享无效
状态B 无效（I）无效（I）共享（S）无效（I）共享（S）修改（M）
说明数据未装入读操作cache失效，装入读操作cache失效，装入后共享写操作命中读操作失效，装入写操作命中
虫孔寻径wormhole
问题：死锁和活锁
18
互连网络的消息传递通信方式
虫孔寻径与存储转发的比较
N1 N2 N3 N4
结点序列
N1 N2 N3 N4
结点序列
(a) 存储转发
时间
图 10-4
(b) 虫孔寻径多机系统数据通信方式的例子
时间
19
互连网络的消息传递通信方式
衡量指标通信带宽
单位时间能够传输的数据量取决于处理器的通信处理吞吐率、存储器的吞吐率和互连网络的传
总线监测
每个处理器的cache中设置一个监测部件
监测总线上的写操作根据监测的情况改变本地cache块的状态
无效、修改、独占、共享
监测条件
主存中有一个单元被其他处理器所修改而这个单元在本地cache中也有一个副本
对于写更新方法
拥有数据最新版本的cache需向其他cache提供数据块内容阻止其他处理器从共享存储器的读操作
第6章并行计算机的同步与通信
计算机系统结构胡越明计算机系
1
Agenda
6.1 并行计算机系统的通信 6.2 Cache与存储器数据一致性 6.3 并行计算机的同步 6.4 并行计算机程序设计
2
6.1 并行计算机系统的通信
并行计算机对程序的要求
代码的可重入并行线程之间的竞态现象
cpu1 cpu2
cache1 cache2
Main memory
28
总线监测
写无效方式多次写操作时只需一次invalidate 对于整个cache数据块进行
写更新方式对于数据块中的个别字进行读操作的命中率高所有写操作通过总线写入所以相关的其他cache中
写操作的开销较大
29
7锁ຫໍສະໝຸດ 两个基本的原子操作Acquire
原子地等待锁的状态变成打开的状态将打开的锁状态变成关闭的状态
这时该线程获得了锁
Release
原子地将锁的状态从关闭状态变成打开的状态
这时线程释放了锁
8
锁的类型
互斥量用PV操作上锁和解锁有阻塞可以加上时间属性
递归锁可以递归地获得的锁用于递归程序
B 核块地址 B核L1 cache
操作
0 0E
I I I 装入
2 0S 2E
I I 装入
7 0S 2E 7E
I 装入
8 0S 2E 7S 8E 装入
9 9E 2E 7S 8S 替换
2 9E 2E 7S 8S 命中
0 9E 2E 0S 8S 替换
34
目录表法
全映射
每个快表目录项包含N个指示位段
N为系统中处理器的个数
30
MESI协议
RH: 读命中 RM S: 读失效，共享 RM E:读失效，独占 WH: 写命中 WM: 写失效 SHR: 读时检测命中 SHW :写时检测命中或
旨在修改的读浊行复制回来
无效事务
无效
SHW RMS
S H W (burst) WM
SHR SHW
SHW
A核：1，0，6，7，8，0，1 B核：0，2，7，8，9，2，0
33
解
A核块地址 A核L1 cache
操作
1 1E
I I I 装入
0 1E 0S
I I 装入
6 1E 0S 6E
I 装入
7 1E 0S 6E 7S 装入
8 8S 0S 6E 7S 替换
0 8S 0S 6E 7S 命中
1 8S 0S 1E 7S 替换
= 2.63秒，加速比为12/2.63 = 4.56。
22
解：（2）
任务在单个核的计算机上没有通信时间，运行时间为12秒；
在双核计算机上的通信时间为10.1，运行时间为
1+10/2+1+0.1 = 7.1秒，加速比为12/7.1 = 1.69；
在4核计算机上的通信时间为60.1=0.6，运行时间为
1+10/4+1+0.6 = 5.1秒，加速比为12/5.1 = 2.35；
在8核计算机上的通信时间为280.1=2.8，运行时间为
1+10/8+1+2.8 = 6.05秒，加速比为12/6.05 = 1.98；
在16核计算机上的通信时间为1200.1=12，运行时间为
1+10/16+1+12 = 14.63秒，加速比为12/14.63 = 0.82，即比单核
数据包
数据传输的物理单位
寻径信息序号数据内容校验位协议号时间戳
• 存储转发
• store-and-forward
• 电路交换
• circuit switching
• 虚拟切换
• virtual cut-through