计算机系统结构第二章第一部分

合集下载

系统结构讲义-2

系统结构讲义-2

码元分配:从树根开始,对每个中间结点的左右2个分支边各赋予
一位代码“0”和“1”(“0”在哪一侧不限)。读出从根结点到任一片树叶 的路径上依次出现的代码位就排成了这个事件(即指令)的完整编码。 由于频度高的事件较晚被合并,它的编码位数也就较少,符合Huffman压 缩原则。
上面所说的频度值就是各事件实际出现次数的百分比, 它是理论出现概率的近似值。 例:假设一台模型计算机共有7种不同的操作码,已 知各种操作码在程序中出现的概率如下表,利用Huffman 编码法进行操作码编码。 指令 概率 I1 0.45 I2 0.30 I3 0.15 I4 0.05 I5 0.03 I6 0.01 I7 0.01
第二章 指令系统
2.3 指令格式的优化设计
指令格式的优化是指如何用最短的二进制位数表示指令的操作码信息和 地址码信息,使指令的平均字长最短,同时便于译码。
指令的组成 操作码 地址码
1) 指令的操作种类。 2) 所用操作数数据 类型。
1) 操作数地址。 2) 地址附加信息。 3) 寻址方式。
指令格式的优化设计目标: 1) 使程序中指令的平均字长最短,节省程序的存储空间。 2) 指令格式要规整,减少硬件译码的复杂程度。
1632和64位固定32位指令时钟频率随技术发展而变化随技术发展而变化寄存器堆824个通用寄存器32192个分离的整数和浮点寄存器堆指令系统规模和类型约300条多于48种指令类型大都基于寄存器寻址方式约12种包含间接变址寻址35种只有取存寻址存储器高速缓存设计较早使用合一高速缓存有些使用分离高速缓存大多数使用分离的数据和指令高速缓存cpi及平均cpi120个周期平均4个简单操作1个周期平均约15个cpu控制大多数用微程序控制有些使用硬连线控制大多数用硬连线控制没有控制存储器代表性商品化处理器intelx86vax8600ibm390mc68040intelpentiumamd486和cyrix686sunultrasparcmipsr10000powerpc604hppa8000digitalalpha21164混合混合ciscriscciscrisc体系结构体系结构pentiumpropentiumpro处理器的处理器的ciscriscciscrisc体系结构体系结构分分基于基于riscrisc核心核心dbab将将x86x86代码转化为代码转化为riscrisc指令指令

第2章计算机系统的组成

第2章计算机系统的组成
返回本节
2.2 计算机硬件系统

输 入 设 备 备 设 出

1.1 计算机硬件
2. 2. 1
微型计算机的硬件组成
微型计算机硬件系统由主机和常用外围设备两大部分 组成。 组成。 主机由中央处理器(CPU)和内存储器 和内存储器(ROM,RAM)组 主机由中央处理器 和内存储器 组 用来执行程序、处理数据, 成,用来执行程序、处理数据,主机芯片都安装在一 块电路板上,这块电路板称为主机板(主板)。 )。为了 块电路板上,这块电路板称为主机板(主板)。为了 与外围设备连接, 与外围设备连,在主机板上还安装有若干个接口插 槽,可以在这些插槽上插入不同外围设备连接的接口 用来连接不同的外部设备。 卡,用来连接不同的外部设备。 主机与外围设备之间信息通过两种接口传输。 主机与外围设备之间信息通过两种接口传输。一种是 串行接口,如鼠标;一种是并行接口,如打印机。 串行接口,如鼠标;一种是并行接口,如打印机。
常用的总线结构有: 常用的总线结构有: (1)ISA总线 ) 总线 (2)MCA总线 ) 总线 (3)EISA总线 ) 总线 (4)VESA总线 ) 总线 (5)PCI总线 ) 总线
2. 2. 2
微型计算机的常见外设
微型计算机常用外围设备有显示器、键盘、 微型计算机常用外围设备有显示器 、 键盘 、 鼠标器 及外存储器。外存中常用的有硬磁盘(硬盘) 及外存储器 。 外存中常用的有硬磁盘 ( 硬盘 ) 、 软 磁盘(软盘)和光盘。 磁盘 ( 软盘 ) 和光盘 。 如果需要还可以根据用户的 要求配置打印机、绘图仪、投影仪; 要求配置打印机 、 绘图仪 、 投影仪 ; 同时为了联网 还可以配置调制解调器等通信设备。 ,还可以配置调制解调器等通信设备。 微机用键盘按照按键个数多少可分为84键 微机用键盘按照按键个数多少可分为 键、101键、 键 104键等几种,目前广泛使用的是 键等几种, 键等几种 目前广泛使用的是101键、104键标准 键 键标准 键盘。这两种键盘一般可分为四个区域: 键盘 。 这两种键盘一般可分为四个区域 : 主键盘区 功能键区、编辑键区、小键盘区(数字键区) 、功能键区、编辑键区、小键盘区(数字键区)。

【精品】计算机

【精品】计算机

7.在浮点加法运算中,完整的操作步骤是对阶。尾数相加、结果规格化、舍入、溢出检查。
8.定点运算器中一般包括ALU、寄存器、对路选择器、移位器和数据通路。
9.ALU的基本逻辑结构是快速进位加法器,它比行波进位加法器优越,具有先行进位逻辑,不仅可以实现高速运算,还能完成逻辑运算。
10.浮点运算器由阶码运算器和尾数运算器组成,它们都是定点运算器,尾数运算器要求能进行加、减、乘、除运算。
18.一条机器指令由一段微指令构成的微程序来解释执行;微指令可由一系列微命令组成。
19.控制部件通过控制线向执行部件发出各种控制命令,通常把这种控制命令叫做微命令。而执行部件接受此控制命令后进行的操作叫做微操作。
20.一条微指令可划分为微命令字段和控制字段;微指令的基本格式可分为水平型和垂直型。
12.虚拟存储器管理的基本方法有页式、段式和段页式三种。
13.在虚拟存储器中,一般采用全相联地址映像方法和LRU更新策略。
14.虚拟存储器中,程序正在执行时,由操作系统完成地址映像。
15.在磁表面存储器中,调频制(FM)记录方式目前主要用于单密度磁盘存储器,改进调频制(MFM)记录方式主要用于双密度磁盘存储器,而在磁带存储器中一般采用调相制(PE)和成组编码(GCR)记录方式。
21.由于数据通路之间的结构关系,微操作可分为相容性和相斥性两种;
在同一微周期中不可能同时出现的微命令,称之为互斥的微命令。
在同一微周期中可以同时出现的微命令,称之为相容的微命令。
22.在微指令的字段编码中,操作控制字段的分段必须遵循的原则包括:
把互斥性的微命令分在同一段内。
一般每个小段要留出一个状态0,表示不操作。
1.-1的补码定点整数表示时为1...1,用定点小数表示时为1...0。

计算机组成与系统结构课后答案免费版全(清华大学出版社 袁春风主编)

计算机组成与系统结构课后答案免费版全(清华大学出版社 袁春风主编)

计算机组成与系统结构课后答案免费版全(清华大学出版社袁春风主编)计算机组成与系统结构课后答案免费版全(清华大学出版社-袁春风主编)第一章练习答案5.若有两个基准测试程序p1和p2在机器m1和m2上运行,假定m1和m2的价格分别是5000元和8000元,下表给出了p1和p2在m1和m2上所花的时间和指令条数。

程序p1p2m1指令条数200×106300×103执行时间(ms)100003指令条数150×106420×103m2执行时间(ms)50006请回答下列问题:(1)对于p1,哪台机器的速度快?快多少?对于p2呢?(2)在m1上执行p1和p2的速度分别是多少mips?在m2上的执行速度又各是多少?从执行速度让我们看看,对于P2,哪台机器速度快?多快?(3)假设M1和M2的时钟频率分别为800 MHz和1.2 GHz,则P1在M1和M2上执行时的平均时钟周期期数cpi各是多少?(4)如果某个用户需要大量使用程序p1,并且该用户主要关心系统的响应时间而不是吞吐率,那么,当用户需要购买大量机器时,他应该选择M1还是M2?为什么?(注意:在性价比方面)(5)如果另一个用户也需要购买大量机器,但用户同样使用P1和P2,那么主要的问题是响应时间间,那么,应该选择m1还是m2?为什么?参考答案:(1)对于p1,m2比m1快一倍;对于p2,m1比m2快一倍。

(2)对于M1,P1的速度为200m/10=20mips;P2为300K/0.003=100mips。

对于m2,p1的速度为:150m/5=30mips;p2为420k/0.006=70mips。

就执行速度而言,对于P2,因为100/70=1.43倍,M1比m2快0.43倍。

(3)在M1上执行P1时的平均时钟周期数CPI为:10×800m/(200×106)=40在m2上执行p1时的平均时钟周期数cpi为:5×1.2g/(150×106)=40。

第二章 计算机控制系统的组成

第二章 计算机控制系统的组成

第二章 计算机控制系统的组成第 1 页 共 15 页第二章 计算机控制系统的组成 第一节 计算机控制系统组成概述一、计算机控制系统的组成图2-1(a) 计算机控制系统的组成框图如图2-1(a)所示,计算机控制系统主要由工业控制机和生产过程两大部分组成。

工业控制机是指按生产过程控制的特点和要求而设计的计算机,它包括硬件和软件两部分;生产过程包括被控对象、测量变送、执行机构、电气开关等装置,这些装置有各种类型的标准产品,在设计计算机控制系统时根据需要进行合理选型。

二、工业控制机工业控制机是指按生产过程控制的特点和要求而设计的计算机,它包括硬件和软件两部分。

1、工业控制机的硬件组成图2-1(b)工业控制机的硬件组成原理图工业控制机的硬件包括主机板、内部总线和外部总线、人机接口、磁盘系统、通信接口、输入输出通道。

(1)主机板:CPU、RAM、ROM等。

作用:进行数值计算、逻辑判断、数据处理。

(2)内部总线和外部总线内部总线:工业控制机内部各组成部分进行信息传送的公共通道,它是一组信号线的集合。

常用内部总线有IBM PC、PCI总线和STD总线。

外部总线:工业控制机与其它计算机和智能设备进行信息传递的公共通道。

RS—232C、USB和IEEE—488通信总线。

(3)人—机接口:键盘、显示器、打印机。

(4)磁盘系统:软盘和硬盘。

(5)通信接口: 工业控制机和其它计算机或智能外设通信的接口。

常用RS—232C、USB和IEEE—488接口。

(6)系统支持功能①监控定时器(看门狗-Watchdog) ②电源掉电检测③保护重要数据的后备存贮器体 ④实时日历时钟(7) 输入输出通道工业控制机和生产过程之间设置的信号传递和变换的连接通道。

它包括模拟量输入(AI)通道、模拟量输出(AO)通道、数字量(或开关量)输入(DI)通道、数字量(或开关量)输出(DO)通道。

它的作用有两个:其一、是将生产过程的信号变换成主机能够接受和识别的代码;其二、是将主机输出的控制命令和数据,经变换后作为执行机构或电气开关的控制信号。

计算机体系结构知识点

计算机体系结构知识点

第一章计算机体系结构得基本概念1 计算机系统结构得经典定义程序员所瞧到得计算机属性,即概念性结构与功能特性。

2 透明性在计算机技术中,把这种本来存在得事物或属性,但从某种角度瞧又好像不存在得概念称为透明性。

3 系列机由同一厂家生产得具有相同系统结构、但具有不同组成与实现得一系列不同型号得计算机。

4 常见得计算机系统结构分类法有两种:Flynn 分类法、冯氏分类法Flynn 分类法把计算机系统得结构分为4 类:单指令流单数据流(SISD)单指令流多数据流(SIMD)多指令流单数据流(MISD)多指令流多数据流(MIMD)5 改进后程序得总执行时间系统加速比为改进前与改进后总执行时间之比6CPI(Cycles Per Instruction ):每条指令执行得平均时钟周期数CPI = 执行程序所需得时钟周期数/IC7 存储程序原理得基本点:指令驱动8冯•诺依曼结构得主要特点1 以运算器为中心。

2 在存储器中,指令与数据同等对待。

指令与数据一样可以进行运算,即由指令组成得程序就是可以修改得。

3 存储器就是按地址访问、按顺序线性编址得一维结构,每个单元得位数就是固定得。

4 指令得执行就是顺序得5 指令由操作码与地址码组成。

6 指令与数据均以二进制编码表示,采用二进制运算。

9 软件得可移植性一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。

差别只就是执行时间得不同。

我们称这两台计算机就是软件兼容得。

实现可移植性得常用方法:采用系列机、模拟与仿真、统一高级语言。

软件兼容:向上(下)兼容:按某档机器编制得程序,不加修改就能运行于比它高(低)档得机器。

向前(后)兼容:按某个时期投入市场得某种型号机器编制得程序,不加修改地就能运行于在它之前(后)投入市场得机器。

向后兼容就是系列机得根本特征。

兼容机:由不同公司厂家生产得具有相同系统结构得计算机。

10 并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。

系统结构复习

系统结构复习

中国地质大学(武汉)计算机学院吴湘宁计算机体系结构习题及答案第一章基础知识1.名词解释翻译解释模拟仿真透明性程序访问局部性[答案]略2. 一个经解释实现的计算机可以按功能划分为四级. 每一级为了执行一条指令需要下一级的N条指令. 若执行第一级的一条指令需要的时间为K ns, 那么执行第二、三、四级的一条指令各需要多少时间?3. 计算机系统按功能划分层次结构的好处主要体现在哪些方面?[答案] (1) 有利于理解软件, 硬件和固件在系统中的地位和作用;(2) 有利于理解各种语言的实质和实现途径;(3) 有利于推动计算机系统结构的发展;(4) 有利于理解计算机系统结构的定义.4. 什么是透明性? 对计算机系统结构, 下列哪些是透明的? 哪些是不透明的?1) 存储器的模m交叉存取; 2) 浮点数据表示; 3) I/O系统是采用通道方式还是I/O处理机方式; 4) 阵列运算部件; 5) 数据总线宽度; 6) 通道是采用结合型的还是独立型的; 7) 访问方式保护; 8) 程序性中断; 9) 串行、重叠还是流水控制方式; 10) 堆栈指令; 11) 存储器的最小编址单位; 12) Cache存储器.[答案] 一种本来是存在的事务或属性, 但从某种角度看却好像不存在, 称为透明性.对计算机系统结构来说透明的是: 1), 4), 5), 6), 9), 12)对计算机系统结构来说不透明的是:2), 3), 7), 8), 10), 11)5. 什么是计算机体系结构? 什么是计算机组成? 什么是计算机实现? 并说明三者的关系和相互影响?[答案] 计算机系统结构是计算机系统的软, 硬件分界面, 是机器语言程序员或是编译程序员所需了解的计算机属性;计算机组成是计算机系统结构的逻辑事项;计算机实现是计算机组成的物理实现.三者的关系和互相影响为:(1) 具有相同系统结构的计算机可以采用不同的组成;(2)(2) 一种计算机组成可以采用多种不同的计算机实现;(3) 计算机组成、计算机实现对计算机系统结构有着很大的影响;(4) 计算机系统结构的设计不应限制计算机组成和实现技术,应能用于高档机,也可用于低挡机;(5) 在不同时期, 计算机系统结构,、组成和实现所包含的内容会有所变化,三者之间的界线常常很模糊.6. 从机器(汇编)语言程序员角度看, 以下哪些是透明的?1) 指令地址存储器; 2) 指令缓冲器; 3) 时标发生器; 4) 条件码寄存器; 5) 乘法器; 6) 主存地址寄存器; 7) 磁盘外设; 8) 先行进位链; 10) 通用寄存器; 11) 中断字寄存器.[答案] 对机器(汇编)语言程序员来说透明的有: 2), 3), 5), 6), 8), 9)对机器(汇编)语言程序员来说不透明的有: 1), 4), 7), 10), 11)7. 假设在一台40 MHz处理机上运行200 000条指令的目标代码, 程序主要由四种类型的指令所组成. 根据程序跟踪实验结果, 各类指令的混合比和每类指令的CPI值如表1.9所示.(1) 试计算在单处理机上执行上述该程序时的平均CPI;(2) 根据(1)所得到的CPI, 计算相应的MIPS速率及程序的执行时间.[答案] (1) 2.24 CPI (2) 17.86 MPIS; 0.0112 s8. 某工作站采用时钟频率为15 MHz、处理速率为10 MIPS的处理机来执行一个程序,假定每次存储器存取为1周期延迟, 试问:(1) 此计算机的有效CPI是多少?(2) 假定将处理机的时钟频率提高到30 MHz, 但存储器子系统速率不变, 这样, 每次存储器存取需要两个时钟周期. 如果30%的指令每条只需要一次存储存取, 而另外5%的指令每条需要两次存储存取, 还假定已知混合程序的指令数不变, 并与原工作站兼容, 试求改进后的处理机性能.[答案] (1) 1.5 CPI; (2) 15.8 MPIS9.什么是并行性?它分为哪两种类型?开发计算机系统并行性的主要技术途径有哪三个?沿这些途径分别发展出什么类型的计算机?[答案]略10.实现软件移植的途径有哪些?[答案]略11.什么是Flynn分类法,按照Flynn分类法可将计算机系统分为哪几类?[答案]略第二章指令系统1. 名词解释数据类型、数据表示、规格化浮点数、Huffman编码、扩展编码、RISC[答案]略2. 某模型机有8条指令I1~I8, 它们的使用频度分别为0.3, 0.3, 0.2, 0.1, 0.05, 0.02, 0.02, 0.01.(1) 试分别用Huffman编码和平均码长最短的等长扩展码(限定为两种码长)对其操作码进行编码.(2) 分别计算Huffman编码和等长扩展码编码的平均长度.[答案] (1) 操作码的Huffman编码和2-4等长扩展码编码如下表1所示.(2) Huffman编码的平均长度为2.38位; 等长扩展码编码的平均码长为2.8位.3. 某模型机有10条指令I1~I10, 它们的使用频度分别为0.3, 0.24, 0.16, 0.12, 0.07, 0.04, 0.03,0.02, 0.01, 0.01.(1) 计算机采用等长操作码表示时的信息冗余量.(2) 要求操作码平均码长最短, 试设计操作码的编码, 并计算所设计操作码的平均长度. (3) 设计2-5扩展操作码编码,并计算平均码长.(4) 设计2-4(2/8)等长扩展码编码,并计算平均码长. [答案] (1) 采用等长操作码表示时的信息冗余量为33.5%. (2) 操作码的Huffman编码如表2所示, 此种编码的平均长度为2.7位.(3) 操作码的2-5扩展码编码如表2所示, 此种编码的平均长度为2.9位.(4) 操作码的2-4(2/4)等长扩展码编码如表2所示, 此种编码的平均长度为2.92位.4. 何谓指令格式的优化? 操作码和地址码的优化一般采用哪些方法?[答案] 指令格式的优化是指通过采用多种不同的寻址方式, 地址制, 地址形式和地址码长度以及多种指令字长, 并将它们与可变长操作码的优化表示相结合, 就可以构成冗余度尽可能少的指令字. 操作码的优化采用扩展操作码编码法. 地址码优化有以下四种方法:(1) 在指令中采用不同的寻址方式;(2)(2) 在指令中采用多地址制;(3) 同一种地址制还可以采用多种地址形式和长度, 也可以考虑利用空白处来存放直接操作数或常数等;(4) 在以上措施的基础上, 还可以进一步考虑采用多种指令字长度的指令.5. 若某机设计有如下指令格式的指令:三地址指令12种, 一地址指令254种, 设计指令的长度为16位, 每个地址码字段的位数均为4位. 若操作码的编码采用扩展操作码, 问二地址指令最多可以设计多少种? [答案] 二地址指令最多可以设计48种.6. 一台模型机共有九条指令I1~I9, 各指令的使用频度分别为0.3,0.2,0.2,0.1,0.08,0.6,0.03, 0.02, 0.01. 该模型机有8位和16位两种指令字长. 8位字长指令为寄存器----寄存器(R--R)二地址类型, 16位字长指令为寄存器----存储器(R--M)二地址变址寻址类型.(1) 试设计有两种码长的扩展操作码, 使其平均码长最短, 并计算此种编码的平均码长. (2) 在(1)的基础上, 该机允许使用多少个可编址的通用寄存器?(3) 若采用通用寄存器作为变址寄存器, 试设计该机的两种指令格式, 并标出各字段的位数.(4) 计算变址寻址的偏移地址范围.[答案] (1) 操作码的2-5扩展码编码如表3所示, 此种编码的平均长度位2.9位.2) 在(1)的基础上, 该机允许使用8个可编址的通用寄存器.(3) 该机的两种指令格式及各字段的位数如下:R-R型: 操作码OP (2位) | 源寄存器RS (3位) | 目的寄存器Rd (3位)R-M型: 操作码OP (5位) | 源寄存器RS (3位) | 变址寄存器RX (3位) | 偏移地址 (5位)(4) 变址寻址的偏移地址范围为-16~+15.7. 简述CISC的特点.[答案] CISC的特点如下:(1) 庞大的指令系统;(2) 采用了可变长度的指令格式;(3) 指令使用的寻址方式繁多;(4) CISC指令系统中包括一些用于特殊用途的指令, 各种指令的使用频度相当悬殊.8. 从指令格式, 寻址方式以及平均CPI三个方面, 比较经典CISC和纯RISC体系结构.[答案] 略9.简述RISC设计的一般原则。

02325计算机系统结构复习资料

02325计算机系统结构复习资料

第一章计算机系统结构的基本概念从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。

位串字串和位并字串基本上构成了SIMD。

位片串字并的例子有:相联处理机STARAN,MPP。

全并行的例子有:阵列处理机ILLIACIV。

从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。

存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。

例子有并行存储器系统,以相联存储器为核心构成的相联处理机。

处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

处理器操作并行是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

擅长对向量、数组进行处理。

例子有阵列处理机。

指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。

例子有多处理机,计算机网络,分布处理系统。

并行性的开发途径有时间重叠(Time Interl eaving ),资源重复(Resou rceReplication),资源共享(ResourceSharing)。

时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。

例子有流水线处理机。

资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。

例子有阵列处理机,相联处理机。

资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。

例子有多处理机,计算机网络,分布处理系统。

SISD:一个指令部件控制一个操作部件,实现一条指令对一个数据的操作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章指令系统∙指令系统是计算机系统结构的主要组成部分∙指令系统是软件与硬件分界面的一个主要标志∙指令系统软件与硬件之间互相沟通的桥梁∙指令系统与软件之间的语义差距越来越大2.1 数据表示2.2 寻址技术2.3 指令格式的优化设计2.4 指令系统的功能设计2.5 RISC指令系统2.1 数据表示∙新的研究成果,如浮点数基值的选择∙新的数据表示方法,如自定义数据表示2.1.1 数据表示与数据类型2.1.2 浮点数的设计方法2.1.3 自定义数据表示2.1.1 数据表示与数据类型∙数据的类型:文件、图、表、树、阵列、队列、链表、栈、向量、串、实数、整数、布尔数、字符∙数据表示的定义:数据表示研究的是计算机硬件能够直接识别,可以被指令系统直接调用的那些数据类型。

例如:定点、逻辑、浮点、十进制、字符、字符串、堆栈和向量∙确定哪些数据类型用数据表示实现,是软件与硬件的取舍问题∙确定数据表示的原则:一是缩短程序的运行时间,二是减少CPU与主存储器之间的通信量,三是这种数据表示的通用性和利用率。

例2.1:实现A=A+B,A和B均为200×200的矩阵。

分析向量指令的作用解:如果在没有向量数据表示的计算机系统上实现,一般需要6条指令,其中有4条指令要循环4万次。

因此,CPU与主存储器之间的通信量:取指令2+4×40,000条,读或写数据3×40,000个,共要访问主存储器7×40,000次以上如果有向量数据表示,只需要一条指令减少访问主存(取指令)次数:4×40,000次缩短程序执行时间一倍以上N m m er =⋅∙ 数据表示在不断扩大,如字符串、向量、堆栈、图、表 ∙ 用软件和硬件相结合的方法实现新的数据表示例如:用字节编址和字节运算指令来支持字符串数据表示 用变址寻址方式来支持向量数据表示2.1.2 浮点数的设计方法1、浮点数的表示方式∙ 一个浮点数N 可以用如下方式表示: 需要有6个参数来定义。

两个数值:m :尾数的值,包括尾数的码制(原码或补码)和数制(小数或整数) e :阶码的值,移码(偏码、增码、译码、余码等)或补码,整数 两个基值:r m :尾数的基值,2进制、4进制、8进制、16进制和10进制等 r e :阶码的基值,通常为2 两个字长:p :尾数长度,当r m =16时,每4个二进制位表示一位尾数 q :阶码长度,阶码部分的二进制位数 p 和q 均不包括符号位 ∙ 浮点数的存储式注:m f 为尾数的符号位,e f 为阶码的符号位,e 为阶码的值,m 为尾数的值。

2、浮点数的表数范围∙ 尾数为原码 尾数用原码、纯小数,阶码用移码、整数时,规格化浮点数N 的表数范围:---⋅≤≤-⋅-111r r N r r m mp m m q e qe r r () ∙ 尾数为补码尾数用补码表示时,正数区间的表数范围与尾数采用原码时完全相同,而负数区间的表数范围为:q e qe r r r N r r r m m p m m ----≤≤-+⋅-11() ∙ 浮点数在数轴上的分布情况min max min max例2.2:设p =23,q =7,r m =r e =2,尾数用原码、纯小数表示,阶码用移码、整数表示,求规格化浮点数N 的表数范围。

解:规格化浮点数N 的表数范围是:1227722321122-≤≤-⋅--N () 即:-129231272122≤≤-⋅-N () 例2.3:尾数用补码、纯小数表示,阶码用移码、整数表示,p =6,q =6,r m =16,r e =2,求规格化浮点数N 的表数范围。

解: 规格化浮点数N 在正数区间的表数范围是:-656631611616≤≤-⋅-N ()在负数区间的表数范围是:63664161616116-≤≤-+⋅--N ()3、浮点数的表数精度(误差)∙ 产生误差的根本原因是浮点数的不连续性 ∙ 误差产生的直接原因有两个:一是两个浮点数都在浮点集内,而运算结果却可能不在这个浮点集内, 二是数据从十进制转化为2、4、8、16进制,产生误差。

∙ 规格化尾数的表数精度为:δ(,)()r p p m m r =--11 最后1个有效位的可信度为一半, 当r m =2时,有:δ(,)()222121p p p ==⋅---4、浮点数的表数效率∙ 浮点数是一种冗余数制(Redundat Number System)∙ 浮点数的表数效率定义为:η==⋅⋅-⋅⋅+⋅⋅⋅-可表示的规格化浮点数的个数全部浮点数个数2121221()r r r r r m m e m e p q p q 简化表示:η()r r r m m m=-1当尾数基值为2时,浮点数的表数效率为:η()221250%=-= ∙ 浮点数的表数效率随r m 增大当尾数基值r m =16时,浮点数的表数效率为:η()1616194%=-= 尾数基值r m =16与r m =2相比,浮点数的表数效率提高了:T ==ηη()().1621875倍4、浮点数尾数基值的选择∙ 在表示浮点数的6个参数中,只有尾数基值r m 、尾数长度p 和阶码长度q 与表数范围、表数精度和表数效率有关∙ 在字长确定的情况下,如何选择尾数基值r m ,使表数范围最大、表数精度和表数效率最高;假设有两种表示方式F1和F2,它们二进制字长相同,尾数都用原码或补码、小数表示,阶码都用移码、整数表示,阶码的基均为2,尾数的基不同。

浮点数表示方式F1:尾数基值r m1=2,尾数长度p1,阶码长度q1, 二进制字长:L1=p1+q1+2。

浮点数表示方式F2:尾数基值r m2=2k ,尾数长度p2,阶码长度q2, 二进制字长:L2=k p2+q2+2。

由F1与F2的二进制字长相同,即L1=L2,得:p1+q1=k p2+q2 (2.1)∙ 字长和表数范围确定时,尾数基值r m 与表数精度的关系F1的表数范围是:q N 1212||max =, F2的表数范围是:|max |()N q k 2222=,F1与F2的表数范围相同,得到:q q k 1222=⋅ 两边取以2为底的对数,得到:q1=q2+log 2 k (2.2) 把(2.2)式代入(2.1)式,得到:p1=k p2-log 2 k (2.3) F1的表数精度是:δ111122=⋅-p(2.4)把(2.3)代入(2.4)得到:δ112122=⋅-+kp k logF2的表数精度是:δ212122=⋅⋅-k p ()取F2与F1表数精度的比值:T k k ==--δδ2112log(2.5)只有k =1(尾数基值r m =2)或k =2(尾数基值r m =4)时,比值T =1。

结论1:在字长和表数范围一定时,尾数基值r m 取2或4,浮点数具有最高的表数精度。

∙ 字长和表数精度一定,尾数基值r m 与表数范围的关系 由F1与F2的表数精度相同得到:1221221112⋅=⋅--p p k () 即: p1=kp2-k +1 (2.6) 把(2.6)代入(2.1)得到:q1=q2+k -1 (2.7)F1的表数范围:q q k q k 121212222222==+--⋅F2的表数范围:q q k k222222()=⋅假设表数范围F2大于F1,则阶码的最大值F2大于F1:q q k k k k 22112222⋅>⋅--> 即这个不等式在正整数定义域内没有解,即不存在比F1的表数范围更大的浮点数表示方式只有k =1(尾数基值r m =2)或k =2(尾数基值r m =4)时,F2阶码的最大值等于F1阶码的最大值。

结论2:在字长和表数精度一定时,尾数基值r m 取2或4,浮点数具有最大的表数范围。

推论1:在字长确定之后,尾数基值r m 取2或4,浮点数具有最大的表数范围和最高的表数精度。

例2.4:IBM 370系列计算机的短浮点数表示方式,尾数基值r m =16,尾数字长为16进制6位,阶码基值r m =2,阶码字长6位,尾数用原码、小数表示,阶码用移码、整数表示。

求表数范围和表数精度,并尾数基址r m =2的浮点数表示方式进行比较。

解: 表数精度为:δ==⋅---121626121()表数范围是:N max ==62256162若尾数基值r m =2,则有:1222121⋅=---()p解得p =21,则q =32-21-2=9,它的表数范围是:N max ==9251222推论2:浮点数的尾数基值r m 取2,并采用隐藏位表数方法是最佳的浮点数表示方式。

这种浮点数表示方式能做到表数范围最大、表数误差最小、表数效率最高。

目前,IBM 公司的IBM360、370、4300系列机等,尾数基值r m =16。

Burroughs 公司的B6700、B7700等大型机,尾数基值r m =8。

DEC 公司的PDP-11、VAX-11和Alpha 等小型机,CDC 公司的CDC6600、CYBER70等大型机,Intel 公司的x86系列机等均采用尾数基值r m =2。

5、浮点数格式的设计定义浮点数表示方式的6个参数的确定原则: ∙ 尾数:多数机器采用原码、小数表示采用原码制表示:加减法比补码表示复杂,乘除法比补码简单 表示非常直观。

采用小数表示能简化运算,特别是乘除法运算。

∙ 阶码:一般机器都采用整数、移码表示采用移码表示的主要原因是:浮点0与机器0一致。

阶码进行加减运算时,移码的加减法运算要比补码复杂 ∙ 尾数的基值r m 选择2, ∙ 阶码的基值r e 取2,浮点数格式设计的关键问题是:在表数范围和表数精度给定的情况下,如何确定最短的尾数字长p 和阶码字长q例2.5:要求设计一种浮点数格式,其表数范围不小于1037,正、负数对称,表数精度不低于10-16。

解:根据表数范围的要求:q2137210-> 解这个不等式:q >+=log(log /log )log .3710212695 取阶码字长q =7根据表数精度的要求,得到:12211610⋅--<-(P )解这个不等式:p >-=-log log .16102532由于浮点数字长通常是8的倍数,因此取尾数字长p =55 所设计浮点数的格式如下:所设计浮点数的主要参数如下: 最大尾数值:()()11255-=---p r m绝对值最小的尾数值:112r m =最大阶码:q r e -=-=1211277 最小阶码:-=-=-q r e 72128 最大正数:7215555127381112212217010--⋅=-⋅-⋅⨯----==(pqr r m e m r )()().;最小正数:--⋅=⋅⨯--==72129391122214710r r m e mqr .; 最大负数:---⋅=-⋅⨯--=-=-7212939112214710r r m e mqr .; 最小负数:7215555127381112212217010---⋅--⋅-⋅⨯----=-=-(pqr r me m r )()().; 表数精度:δ=⋅⋅==⨯------=112222781015515517r r m m p ()().;浮点零:浮点零与机器零相同,64位全为0; 表数效率:采用隐藏位,表数效率η=100%;6、浮点数的舍入处理∙ 浮点数要进行舍入处理的原因是:十进制实数转化为浮点数时,有效位长度超过给定的尾数字长。

相关文档
最新文档