北京工业大学 计算机系统结构 复习
计算机系统结构复习资料

1.6某台主频为400MHz 的计算机执行标准测试程序,程序中指令类型、执解:(1)CPI =(45000×1+75000×2+8000×4+1500×2) / 129500=1.776 (2)MIPS 速率=f/ CPI =400/1.776 =225.225MIPS(3)程序执行时间= (45000×1+75000×2+8000×4+1500×2)/400=575s1.7 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解 由题可知: 可改进比例 = 40% = 0.4 部件加速比 = 10根据Amdahl 定律可知:()5625.1104.04.011=+-=系统加速比采用此增强功能方法后,能使整个系统的性能提高到原来的1.5625倍。
1.8 计算机系统中有三个部件可以改进,这三个部件的部件加速比为:部件加速比1=30; 部件加速比2=20; 部件加速比3=10(1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10?(2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少?解:(1)在多个部件可改进情况下,Amdahl 定理的扩展:∑∑+-=iii n S F F S )1(1已知S 1=30,S 2=20,S 3=10,S n =10,F 1=0.3,F 2=0.3,得:)()(10/20/0.330/0.30.30.3-111033F F +++++=得F 3=0.36,即部件3的可改进比例为36%。
(2)设系统改进前的执行时间为T ,则3个部件改进前的执行时间为:(0.3+0.3+0.2)T = 0.8T ,不可改进部分的执行时间为0.2T 。
2022年北方工业大学计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案)

2022年北方工业大学计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案)一、选择题1、以下说法不正确的是( )A.线性流水线是单功能流水线B.动态流水线是多功能流水线C.静态流水线是多功能流水线D.动态流水线只能是单功能流水线2、下列说法正确的是()A."一次重叠"是一次解释一条指令B."一次重叠"是同时解释相邻两条指令C.流水方式是同时只能解释两条指令D."一次重叠"是同时可解释很多条指令3、下列关于虚拟存贮器的说法,比较正确的应当是( )A.访主存命中率随页面大小增大而提高B.访主存命中率随主存容量增加而提高C.更换替换算法能提高命中率D.在主存命中率低时,改用堆栈型替换算法,并增大主存容量,可提高命中率4、"一次重叠"中消除"指令相关"最好的方法是( )。
A.不准修改指令B.设相关专用通路C.推后分析下条指令D.推后执行下条指令5、指令间“一次重叠”说法有错的是( )A.仅“执行k”与“分析k+1”重叠B."分析k”完成后立即开始“执行k”C.应尽量使“分析k+1”与“执行k”时间相等D.只需要一套指令分析部件和执行部件6、CRAY-I的流水线是( )A.多条单功能流水线B.一条单功能流水线C.多条多功能流水线D.一条多功能流水线7、Cache存贮器常用的地址映象方式是( )。
A.全相联映象B.页表法映象C.组相联映象D.段页表映象8、计算机系统的层次结构按照由高到低的顺序分别为()。
A.高级语言机器级,汇编语言机器级,传统机器语言机器级,微程序机器级B.高级语言机器级,应用语言机器级,汇编语言机器级,微程序机器级C.应用语言机器级,传统机器语言机器级,汇编语言机器级,操作系统机器级D.应用语言机器级,操作系统机器级,微程序机器级,传统机器语言机器级9、微指令由()直接执行。
系统结构复习提纲

复习提纲第一章:1计算机系统结构的属性2透明性概念及分析(从计算机系统结构的角度(或者从汇编语言程序员的角度)、系统程序员、应用程序员等分别分析)透明——本来存在的事物或属性,从某个角度上看不到,称对他是透明的。
3计算机系统结构、计算机组成、计算机实现三者的关系计算机组成是计算机系统结构的逻辑实现;计算机实现是计算机组成的物理实现。
一种系统结构可以有多种组成;一种组成可以有多种实现。
同一系列机中各种型号的机器具有相同的系统结构,但采用不同的组成和实现技术,因而具有不同的性能和价格。
4实现软件移植的方法(三种)1. 统一高级语言方法:采用同一种不依赖于任何具体机器的高级语言编写系统软件和应用软件。
这种方法可以解决结构相同或完全不同的各种机器上的软件移植。
困难:至今还没有这样一种高级语言。
短期内很难实现。
2. 采用系列机思想所谓系列机是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。
实现方法:在系统结构基本不变的基础上,根据不同性能的要求和当时的器件发展情况,设计出各种性能、价格不同的计算机系统。
一种系统结构可以有多种组成,一种组成可以有多种物理实现。
优点:系列机之间软件兼容,可移植性好;插件、接口等相互兼容;便于实现机间通信;便于维修、培训;有利于提高产量、降低成本。
缺点:限制了计算机系统结构的发展3. 采用模拟与仿真方法模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。
例如在A计算机上要实现B计算机的指令系统,通常采用解释的方法来完成,即B机器的每一条指令用一段A 机器的指令进行解释执行,A机称为宿主机,被模拟的B机称为虚拟机。
三种方法比较:(1)采用统一高级语言最好,是努力的目标(2)系列机是暂时性方法,也是目前最好的方法(3)仿真的速度低,芯片设计的负担重,目前用于同一系列机内的兼容,1/10~1/2的芯片面积用于仿真5模拟与仿真的区别(解释所用的语言不同)模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统,如果宿主机本身采用微程序控制,则对B机器指令统每条指令的解释执行可直接由A机器的一段微程序解释执行。
计算机系统结构考点总结

计算机系统结构考点总结计算机系统结构是计算机科学与技术领域的重要分支,涉及计算机硬件和软件的组成及其相互关系。
为了帮助大家更好地掌握这一领域的核心知识,本文将针对计算机系统结构的考点进行详细总结。
一、计算机系统结构基本概念1.计算机系统结构的定义及发展历程2.计算机系统结构的分类:冯·诺伊曼结构、哈佛结构、堆栈式结构等3.计算机系统性能指标:指令周期、CPU时钟周期、主频、缓存命中率等二、中央处理器(CPU)1.CPU的组成:算术逻辑单元(ALU)、控制单元(CU)、寄存器组等2.指令集架构:复杂指令集计算机(CISC)、精简指令集计算机(RISC)3.CPU缓存:一级缓存、二级缓存、三级缓存及其工作原理4.多核处理器:核数、并行计算、线程级并行等三、存储系统1.存储器层次结构:寄存器、缓存、主存储器、辅助存储器等2.主存储器:DRAM、SRAM、ROM等3.磁盘存储器:硬盘、固态硬盘、光盘等4.存储器管理:分页、分段、虚拟存储器等四、输入输出系统1.I/O接口:并行接口、串行接口、USB、PCI等2.I/O设备:键盘、鼠标、显示器、打印机等3.I/O控制方式:程序控制、中断、直接内存访问(DMA)等4.I/O调度策略:先来先服务(FCFS)、最短作业优先(SJF)、扫描算法等五、总线与通信1.总线分类:内部总线、系统总线、I/O总线等2.总线标准:ISA、PCI、PCI Express等3.通信协议:TCP/IP、UDP、串行通信等4.网络拓扑结构:星型、总线型、环型、网状等六、并行计算与分布式系统1.并行计算:向量机、SIMD、MIMD等2.分布式系统:分布式计算、分布式存储、负载均衡等3.并行与分布式编程:OpenMP、MPI、MapReduce等4.并行与分布式算法:排序、搜索、分布式锁等通过以上考点的总结,相信大家对计算机系统结构有了更加全面和深入的了解。
大学计算机系统结构复习提纲考试重点内容

计算机系统结构复习提纲第一章计算机系统结构导论了解:计算机的概念、功能;计算机组成;计算机系统结构、计算机组成、计算机实现所包含的内容;系列机和兼容机的概念;计算机系统设计步骤。
掌握:计算机的层次结构(选择);计算机系统结构的定义(实质)(选择);计算机系统结构、计算机组成、计算机实现三者之间的区别和联系(简答、选择);软、硬件取舍原则(简答、选择);解决软件可移植性的方法(选择、填空);透明性的定义和判断(选择);CPU性能公式;Amdahl定律(计算);程序访问的局部性原理(简答);并行性的概念和分类(简答、选择、填空);Flynn分类(选择、填空);冯氏分类法(选择、填空);系统结构中开发并行性的途径(填空、选择、简答)和耦合度(填空、选择);计算机系统设计思路(填空)。
第二章指令系统掌握:指令系统的优化设计的两个截然相反的方向;RISC的基本原则(简答、选择);RISC采用的基本技术(简答、选择);重叠寄存器窗口(选择)第五章流水线结构了解:重叠需解决问题;流水线特点;超标量处理机、超流水线处理机、超标量超流水线处理机、向量处理机及其特点掌握:重叠和顺序解释的异同(简答、选择);重叠和流水概念及工作原理(选择);一次重叠、二次重叠的概念(选择);先行控制方式;重叠对组成的要求(简答、选择);几种相关的判断及解决方法(选择、填空);流水线分类(选择、填空);解决影响流水线瓶颈的方法(选择、填空);流水线性能分析(会画时空图及计算);流水线的相关处理(选择、填空)、异步流水线和同步流水线及可能出现的相关(选择、填空);向量流水线的处理方式(选择、填空);向量处理机并行操作条件(选择、填空)及采用链接技术的条件(选择);指令级高度并行的超级处理机(填空、选择)第六章阵列处理机了解:并行处理机的两种构形、特点;;并行处理机多级互连网络交换开关分类、控制方式;阵列处理机算法;掌握:并行处理机的定义(选择);构成;IlliacIV 阵列处理机结构特点(选择、填空);互连网络的设计目标(选择、简答);应抉择的几个问题(选择、填空);操作方式(选择、填空);单级互连网络及其函数(计算、选择);多级互连网络的几个关键要素(选择、填空);控制方式(选择、填空);交换函数和互连函数、控制信号;STARAN交换网络(计算)、第七章多处理机了解:多处理机需要解决的技术问题;多处理机的任务粒度划分和性能;掌握:多处理机耦合度(填空);多处理机定义以及硬件结构;机间互连形式及采用算法(选择、填空);多处理机的存储器组织中两种编址方式各适应那种场合(简答、选择);Delta网络;多处理机的cache一致性问题(选择、填空);表达式的树形流程图及计算;程序并行性分析(选择、填空);FORK、JOIN 语句;多处理机上并行执行的程序及时间资源图;多处理机的操作系统分类(选择、填空);第八章数据流机了解:数据流程序图;控制驱动的控制流方式的特点;掌握:数据驱动方式及其特点(简答、选择);数据令牌的概念(简答);数据流是一种什么样的计算模型(简答、填空);数据流计算模型分类(填空);两种数据流计算机结构的特点(选择、填空)。
2022年北京工业大学耿丹学院计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案)

2022年北京工业大学耿丹学院计算机科学与技术专业《计算机系统结构》科目期末试卷A(有答案)一、选择题1、设16个处理器编号分别为0,1,2,...,15用Cube,互联函数时,第10号处理机与第()号处理机相联。
A.11B.8C.14D.22、从计算机系统结构上讲,机器语言程序员所看到的机器属性是()A.计算机软件所要完成的功能B.计算机硬件的全部组成C.编程要用到的硬件组织D.计算机各部件的硬件实现。
3、多处理机的各自独立型操作系统()。
A.要求管理程序不必是可再入的B.适合于紧耦合多处理机C.工作负荷较平衡D.有较高的可靠性4、高级语言程序经()的()成汇编语言程序。
A.编译程序,翻译B.汇编程序,翻译C.汇编程序,解释D.编译程序,解释5、目前,MO由()实现,M1用()实现,M2至M5大多用()实现。
A.软件,固件,硬件B.固件,软件,硬件C.硬件,软件,固件D.硬件,固件,软件6、对系统程序员不透明的应当是( )。
A.Cache存贮器XB.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器7、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。
A.计算机软件所要完成的功能B.计算机硬件的全部组成C.编程要用到的硬件组织D.计算机各部件的硬件实现8、汇编语言程序经()的()成机器语言程序。
A.编译程序,翻译B.汇编程序,翻译C.汇编程序,解释D.编译程序,解释9、与全相联映象相比,组相联映象的优点是( )A.目录表小B.块冲突概率低C.命中率高D.主存利用率高10、开发并行的途径有(),资源重复和资源共享。
A.多计算机系统B.多道分时C.分布式处理系统D.时间重叠11、()属于MIMD系统结构。
A.各处理单元同时受同一个控制单元的管理B.各处理单元同时接受同一个控制单元送来的指令C.松耦合多处理机和多计算机D.阵列处理机12、推出系列机的新机器,不能更改的是( )A.原有指令的寻址方式和操作码B.系统总线的组成C.数据通路宽度D.存贮芯片的集成度13、费林按指令流和数据流的多倍性把计算机系统分类,这里的多倍性指()。
北工大嵌入式系统复习讲义

寄存器读(从寄存器Bank) 移位及ALU操作
寄存器写(到寄存器Bank)
• PC指向正被取指的指令,而非正在执行的指令
北工大嵌入式系统复习
• 三级流水线: Fetch Decode
Execute
Fetch Decode Execute
Fetch Decode Execute
北工大嵌入式系统复习
指令流水线(Pipeline)
工作模式
• 工作模式的类型 • 用户模式:程序不能访问受操作系统保护的资源,也不能改变模式 • 特权模式:除User之外的其他6种,处理异常和监控调用,可自由访问系
统资源和改变模式
• 异常模式:除系统模式外其他5中特权模式,处理异常和中断 • 系统模式:不能通过异常进入,操作系统的任务可以访问所需系统和用户
北工大嵌入式系统复习
程序状态寄存器
• CPSR – 当前程序状态寄存器,包括代码标志状态和当前模式位 • 5个SPSRs--(程序状态保存寄存器) 当异常发生时保存CPSR状态
北工大嵌入式系统复习
程序状态寄存器
• ARM7TDMI 包含当前程序状态寄存器 (CPSR), 加 上5个程序状态保存寄存器SPSR,当异常发生时, 用于保存CPSR的状态
53任务管理tcb链表53任务管理任务的状态睡眠状态等待状态中断状态运行状态就绪状态任务状态没有tcb具备了运行的充分条件运行态任务需要等待一段时间或事件把cpu的使用权让出一个正在运行的任务一旦响应中断申请就会中止运行而去执行中断服务程序处于就绪状态的任务如果获得了cpu的使用权任务的状态转换睡眠状态等待状态中断状态运行状态就绪状态任务开始任务开始退出中断退出中断任务切换任务切换cpucpu使用权被剥夺使用权被剥夺53任务管理什么是任务
计算机系统结构复习汇总

…
PUn DSn
…
MMm
„
(d)MIMD 计算机
(c)MISD 计算机
1.3 定量分析技术
1.3.1 计算机系统设计的定量原理
4个定量原理: 1. 以经常性事件为重点
对经常发生的情况采用优化方法的原则进行选
择,以得到更多的总体上的改进。
优化是指分配更多的资源、达到更高的性能或
者分配更多的电能等。
▲
13/79
1.2 计算机系统结构的概念
1.2.3 计算机组成和计算机实现
1. 计算机系统结构:计算机系统的软、硬件的界面 即机器语言程序员所看到的传统机器级所具有的
属性。
2. 计算机组成:计算机系统结构的逻辑实现 包含物理机器级中的数据流和控制流的组成以 及逻辑设计等。 着眼于:物理机器级内各事件的排序方式与控 制方式、各部件的功能以及各部件之间的联系。
单指令流多数据流(SIMD) 多指令流单数据流(MISD) 多指令流多数据流(MIMD)
4类计算机的基本结构
IS:指令流,DS:数据流,CS:控制流, CU:控制部件,PU:处理部件,MM和SM:存储器。
▲
19/79
SM PU1 PU2 DS1 MM1 DS2 MM2
IS CS DS
CU
CS
…
例如:若系统改进后,可改进部分的执行时间是2秒, 而改进前其执行时间为5秒,则部件加速比为5/2。
▲
23/79
1.3 定量分析技术
改进后程序的总执行时间
总执行时间改进后 = 不可改进部分的执行时间 + 可改进部分改进后的执行时间
总执行时间改进后 = (1-可改进比例)×总执行时间改进前
+ 可改进比例×总执行时间改进前 部件加速比
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机系统结构概念点,不含计算方法,仅有部分提示,整理内容仅供参考计算机系统结构:指机器语言程序的设计者或是编译程序设计者所看到的计算机系统的概念性结构与功能特性。
透明性:一种本来存在,有差异的事物和属性,从某种角度上看又好像不存在的现象,被称为是“透明性”(例如,高级程序员看不到各种不同类型机器的差异性,就是一个明显的例证。
)计算机系统结构:数据表示;寄存器定义;指令系统;中断系统;存储系统;输入输出结构;机器工作状态;信息保护计算机组成:数据通路的宽度;专用部件的设置;各功能部件;控制机构的组成方式;缓冲技术;可靠性技术的采用和方式的选择计算机实现:逻辑设计的物理实现FLYNN分类法:单指令流单数据流( SISD ),传统顺序处理计算机单指令流、多数据流(SIMD )结构,阵列处理机、并行处理机多指令流、单数据流( MISD )结构,如RISC机、向量机多指令流、多数据流( MIMD )结构,多处理机系统计算机系统的设计原则:1.加速那些使用频率高的部件——提高整个计算机性能; 2.Amdahl定律; 3.程序访问局部性原理Amdahl定律:系统中某一部件由于采用某种改进的执行方式后,整个系统的性能提高了,其衡量指标为加速比。
Amdahl定律可表示为:加速比Sp = T e / T0改进后时间T0= Te(1 –可改进部分占比fe + f e性能提高倍数 r e ⁄)整理得Sp=1(1−fe)+fe/reCPU性能指标:T CPU=I N∗CPI∗T c=指令总数*执行每条指令所需平均周期数*时钟周期CPI=∑CPI i∗I iI N MIPS=I NT e∗106=时钟频率R cCPI∗106MFLOPS=程序中的浮点操作次数I FN执行时间T e∗106计算机系统的层次结构(会排序,注意23级)性能评价结果数据的处理方法:算术性能平均法;几何..;调和..;软件兼容性要求:继承软件资产,保证软件向后兼容和向上兼容数据类型:基本数据类型(二进制数位及位串、整数及自然数、实数(浮点数)、逻辑数、十进制数、字符等。
二进制数位是信息存储的最基本单位,0和1,长度为8时,构成字节。
);结构数据类型(一组由相互有关的数据元素复合而成的数据类型,这些数据元素可以是基本数据类型中的元素,也可以是结构化数据类型本身中的元素如向量、数组、字符串、堆栈、队列等。
结构化的数据类型除了可由用户定义外,还有一种是系统数据类型,它们通常是在操作系统中被使用的,如堆栈、队列等。
);抽象数据类型;访问指针.数据表示:指在计算机中能由硬件直接辩认,指令系统可以直接调用的数据类型。
(实质上是一个软硬件取舍的问题)自定义数据表示:由数据本身来表明数据类型,使计算机内的数据具有自定义能力。
分类:带标志符的数据表示,数据描述符优点1.简化了指令系统2.容易检出程序编制中的错误3.简化了编译程序4.支持数据库系统5.简化了程序设计6.便于软件测试,支持应用软件开发缺点1.数据字长增加2.降低了指令的微观执行速度3.与其他计算机的兼容性差,硬件复杂程序定位方式:直接;静态;动态(优点:在程序执行时由硬件形成主存物理地址,主存利用率高,多个用户可以共享同一个程序段,支持虚拟存储器实现。
缺点:需要硬件支持,实现的算法比较复杂。
)RISC设计思想的起源1.20%-80%定律2.系统设计中硬件和软件之间折衷3.VLSI工艺技术发展主要技术:1.流水线结构和指令调度2.寄存器窗口3.优化编译技术复杂指令集计算机CISC特点:1.指令的控制执行是采用微程序控制技术,有专用的寄存器。
2.控制器十分复杂,占用了大量CPU芯片面积,有些复杂指令用的很少,难以用优化编译生成高效目标代码。
3.处理器的执行效率不高。
4.指令系统与软件之间语义差别越来越大,软件设计任务十分繁重,整个设计风格不是十分经济有效的。
RISC特点1.指令格式简单化、规整化(寄存器-寄存器型)2.基本是单周期操作(指令功能和执行周期权衡选择)3.分开的存取指令数据,引入多级Cache 4.面向寄存器堆的结构5.充分提高流水线效率(用各种技术减少相关阻塞)6.采用硬逻辑控制方式(少数采用微程序设计)7.采用优化编译技术,很好地支持高级语言存储系统的三个特性:局部性;一致性(在容量大的存储器中,一定能找到上层存储信息的副本);包含性(副本修改,以保持同一信息的一致性);计算机存储系统三个基本参数:存储容量S(以字节数表示,单位为B、KB、MB、GB、TB等);存储器速度T(存储器访问周期,与命中率有关);存储器价格C(表示单位容量的平均价值单位为$C/bit或$C/KB)存储层次结构解决频带平衡的三种方法:1.多个存储器并行工作,并用并行访问和交叉访问等方法2.设置各种缓冲存储器3.采用Cache存储系统。
引入CACHE的目的:提高CPU对存储器的访问速度特点:容量比较小但速度比主存高很多,接近于CPU的速度。
地址映像是指某一数据在主存中的地址与在缓存中的地址两者之间的关系。
CACHE写操作的更新策略全写法:Cache及主存与内容同时更新CACHE命中率的影响因素:CACHE容量,CACHE块大小,地址映像方式LRU 最近最少使用法:是依据各块使用的情况,总是选择那个最近最少使用的块被替换。
这种方法比较好的反映了程序局部性规律。
因为最近最少使用的块,很可能在将来的近期也很少使用,所以LRU 法的命中率比较高。
缺点:实现起来比较困难,它不但要记录每块使用次数的多少,而且要反映出近期使用的次数。
Cache 系统的加速比 等效的访问周期为TTc:Cache 的访问周期Tm:主存储器的访问周期;Hc:Cache 命中率 存储系统的访问效率:指高一级存储器的访问速度(容量小速度高的一级)与系统等效的访问速度之比。
存储保护:1.加界保护法:在CPU 中设置了多个界限寄存器,由系统软件经特权指令指定,禁止越界。
(当程序运行过程中,每当访问主存时,首先将访问地址与上下界寄存器进行比较,如果在此区域之内,则允许访问;如果不在此区域之内,即小于上界,大于下界,即说明出现了错误,称为越界错。
这种保护方式是对存储区的保护、运用于段式管理.) 2. 键保护方式: 每次访问主存,首先进行键号比较,如果键号相等才允许访问。
如同一把钥匙开一把锁。
存放键与程序键键号的分配,由操作系统完成 3. 环保护方式:将系统程序和各用户程序按其功能的性质和要求分为几个级别,分别授予不同的权限,m c c c T H T H T )1(-+=)1(1)1(c mc c m c c c m m p H T T H T H T H T T T S -+=-+==c m c c c T T H H T T e )1(1-+==如系统程序对安全的要求比较高,授权级别就比较高,用户程序的级别就可以低些流水线的基本结构中的三大部分:锁存器、时钟、功能段(站)流水线特点:1)流水一定重叠,比重叠更苛刻。
2)一条流水线通常由多个流水段组成。
3)每段有专用功能部件,各部件顺序连接,不断流.4)流水线有建立时间、满载时间、排空时间.5)各段时间尽量短、一致,不一致时最慢子过程为瓶颈。
6)给出的最大吞吐率等指标,为满负载最佳指标。
流水线的分级:1.按处理的级别分级(操作部件级--将复杂的算逻运算组成流水工作方式;指令级--把一条指令解释过程分成多个子过程;处理机级或宏流水线级--由两个以上处理机串行地对同一数据流进行处理,每个处理机完成某一专门任务,各个处理机所得到的结果需存放在与下一个处理机所共享的存储器中.) 2.按功能分类(单功能流水线--只能实现一种固定的专门功能的流水线;多功能流水线--通过各站间的不同连接方式可以同时或不同时地实现多种功能的流水线) 3.按工作方式分类(静态流水线--在同一时间内各功能段只能按一种运算(功能)的连接方式工作;动态流水线--在同一时间内各功能段允许按多种不同运算(功能)的连接方式工作。
) (静态流水线仅当指令都是同一类型时才能连续不断地执行。
当从一种功能方式变为另一种功能方式时,必须先排空流水线,然后再切换成另一种功能进行流水处理。
) 4. 按连接方式(流水线中是否有反馈回路)分类(线性流水线--从输入到输出,每个功能段只允许经过一次,不存在反馈回路;非线性流水线--存在反馈回路,从输入到输出过程中,某些功能段将数次通过流水线,这种流水线常用于进行递归运算) 流水线性能指标:吞吐率Tp,加速比Sp,效率最大吞吐率:流水线达到稳定状态后可获得的吞吐率。
(1)TPmax=1/∆t (理想情况)(2)TPmax=1/ max{∆t1,∆t2,∆t3,∆t4}流水线实际吞吐率m :指令流水线的段数;∆t 0: 各段经过的时间; n :指令条数。
效率ή=n 个任务实际占用的时空区m 个段总得时空区 加速比Sp =T 非流水T 流水对一个周期能发射多条指令计算机有超标量、超流水、超长指令字计算机,此外还有数据流计算机也属于多发射结构。
向量的处理方法:水平;垂直(适用于流水);分组纵横n m TP n m t t n t m n TP 11max )11(1)1(000-+=-+∆=∆-+∆=向量处理机的结构:由向量数据表示和流水线技术相结合构成的向量流水处理机。
并行性概念:在数值计算,数据处理,信息处理或人工智能求解过程中,可能存在某些能同时进行运算或操作的部分。
在同一时刻或同一时间间隔内完成多个性质相同或不同的任务。
并行性的开发还可以按程序大小划分不同粒度的开发方式。
并行粒度或颗粒规模---- 衡量软件进程所含计算量的尺度。
测量方法是数一下颗粒(程序段)中的指令数目。
一般用细、中、粗来描述,决定并行处理的基本程序段。
并行性粒度:每次并行处理的规模大小。
用字母G表示G=T W/T C T W:所有处理器进行计算的时间总和;T C:所有处理器进行通信的时间总和。
(设系统共有P个处理器);当T C较大时,通信量大,则G较小处理粒度较细。
反之对于粗粒度的并行,通信量较小。
粒度小结:1.细粒度并行性常在指令级或循环级上借助于并行化或向量化编译器来进行开发的。
2.任务或作业步骤(过程级)中粒度并行性开发需要程序员和编译器的共同作用。
3.开发程序作业级的粗粒度并行性主要取决于高效的操作系统和所用算法的效率。
4.共享变量通信常用于支持中、细粒度计算。
消息传递型多计算机用于中粒度和粗粒度的计算。
通常情况下,粒度越细,并行性潜力越大,通信和调度的开销也越大。
细粒度能提供较高的并行度,但与粗粒度计算相比,其通信开销也较大。
大规模并行性通常是在细粒度级上开发。
如:SIMD或MIMD计算机上开发的数据并行性。