计算机组成原理白中英主编课件chp10

合集下载

计算机组成原理第1章课件(白中英编-科学出版社)

计算机组成原理第1章课件(白中英编-科学出版社)
计算机组成原理
任课教师:赵静
目录
☼ ☼ ☼ ☼

☼ ☼ ☼
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章
计算机系统概论 运算方法和运算器 存储系统 指令系统 中央处理器 总线系统 外围设备 输入输出系统
中央处理单元CPU (第五章) 控输 出 接 口 (第二章)
系统结构
基本概念
4. 操作系统

用来管理计算机资源(如处理器、内存、外部设备和各 种编译、应用程序 )和自动调度用户的作业程序 ,而使 多个用户能有效地共用一套计算机系统。
根据使用环境要求,操作系统大致分为批处理操作系统、分 时操作系统、网络操作系统、实时操作系统等多种。

5. 数据库管理系统

数据库: 实现有组织地、动态地存储大量相关数据 , 方便
基本概念
3. 控制器


控制计算机的各个部件有条不紊地进行工作
(1) 程序
每一个基本操作就叫做一条指令,而解算某一问题的一 串指令序列,叫做该问题的计算程序,简称为程序。

(2) 指令的形式
操作码
指出指令所进行的 操作,如加、减、 乘、除、取数、存 数等
地址码
表示参加运算的数据 从存储器的哪个单元 取;运算的结果应存 到哪个单元

系统结构
1.3 计算机的软件
1.3.1软件的组成和分类
操作系统 语言处理程序
基本概念
系统程序
数据库管理系统 诊断、排错程序 反病毒程序 卸载程序 备份程序 文件压缩程序
服务性程序
软件分类
办公软件包
应用程序
浏览器 实时控制软件 图形图像处理软件 其它应用软件
系统结构

计算机组成原理白中英主编课件ch

计算机组成原理白中英主编课件ch
设计阶段
根据需求分析结果, 设计软件 的体系结构、模块和数据库等。
测试阶段
通过单元测试、集成测试和系 统测试等手段, 确保软件质量。
需求分析
分析用户需求, 确定软件的功 能和性能要求。
编码阶段
将设计转化为计算机程序代码。
维护阶段
对软件进行修改、完善和升级, 以保持软件运行稳定和适应新 需求。
04 指令系统与汇编语言
存储程序原理
将程序和数据存储在计算机内部, 通 过执行程序来实现各种计算任务。
02 计算机硬件组成
中央处理器
定义
中央处理器(CPU)是计算机的核心部件, 负责执行程序中 的指令, 控制计算机的各个部件协调工作。
功能
CPU的主要功能包括运算、控制和输入输出等, 它决定了计 算机的性能和功能。
组成
CPU由运算器、控制器、寄存器等组成, 其中运算器和控制 器是CPU的核心部分。
工作原理
输入输出设备的基本工作原理是利用各种传感器和驱动器来实现数据 的输入和输出。
总线与主板
定义
总线是计算机中各个部件之间传输数据的 通道, 主板则是计算机中各个部件的载体。
组成
总线包括数据总线、地址总线和控制总线 等, 主板则包括处理器插座、内存插槽、扩
展插槽等。
功能
总线的主要功能是连接各个部件并传输数 据, 主板则是固定和连接各个部件的载体。
可维护性 指计算机在出现故障时能够迅速修复 的能力, 通常用平均修复时间来衡量。
计算机性能测试方法
基准测试
通过运行一组标准化的测试程序来评 估计算机的性能, 如SPECint、 SPECfp等。
负载测试
通过模拟实际负载情况来测试计算机 的性能, 如并发用户数、事务处理速 率等。

计算机组成原理第二章课件(白中英编-科学出版社)

计算机组成原理第二章课件(白中英编-科学出版社)
6
计算机组成原理
十进制整数转换为二或十六进制数

ห้องสมุดไป่ตู้
演示
整数部分转换:用除法
• 十进制数整数部分不断除以基数2或16,并记下余
数,直到商为0为止 • 由最后一个余数起逆向取各个余数,则为转换成的 二进制和十六进制数
126=01111110B 126=7EH
计算机组成原理
7
十进制小数转换为二或十六进制数
64位双精度规格化浮点数

IEEE 754标准
E=1~2046 e=-1022~+1023 表达的数据范围(绝对值) : 最小值: e=-1022,M=0(1.M=1) 十进制表达:2-1022≈2.23×10-308 最大值: e=1023,M=11…1(52个1) 1.M=1.11…1 (52个1) =2-2-52 十进制表达:(2-2-52)×21023 ≈ 2×21023 ≈1.79×10308
• 整数从左向右 • 小数从右向左 • 每4个二进制位对应一个十六进制位

00111010B=3AH,F2H=11110010B 十六进制数的加减运算类似十进制
• 逢16进位1,借1当16
23D9H+94BEH=B897H A59FH-62B8H=42E7H
计算机组成原理
9
真值和机器数

真值:现实中真实的数值 机器数:计算机中用0和1数码组合表达的数值 定点数:固定小数点的位置表达数值的机器数
目录


☼ ☼ ☼ ☼ ☼ ☼ ☼
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章
计算机系统概论 运算方法和运算器 存储系统 指令系统 中央处理器 总线系统 外围设备 输入输出系统 并行组织

计算机组成原理chp10

计算机组成原理chp10

计算机科学与技术学院系统教研室
10.3安腾指令系统结构

指令组

指令组将相互之间没有读后写相关,写后写相关,可以并行执 行的一组指令集合。 模版字段正是为实现EPIC的设计思想服务的:一方面,编译器 可以通过5位模版字段指明每个指令槽中的指令使用哪一个执行 单元;另一方面,编译器可以通过模板字段明确给出指令束内 或指令束间的依赖关系。
计算机科学与技术学院系统教研室
10.3安腾指令系统结构
二、安腾寄存器结构




与RISC体系结构类似,安腾体系结构大量使用寄 存器操作;见下一页图 只有取数load和存数store指令才能够访问内存,所 有其他指令都在寄存器上操作。 在以安腾为基础的处理机内,用户可直接使用的寄 存器数量甚至大大超过了主流RISC处理机。 一方面可以加快数据存取的速度,减少访存延迟, 另一方面可以更好地支持并行操作。
计算机科学与技术学院系统教研室
10.2安腾体系结构的基本设计思想
3、分支推断技术


技术能将传统的“ifthenelse”分支结构转变为无分支的顺序/并 行代码,以避免由于错误预测分支而付出代价。当处理机在运行 中遇到分支时,它并不是进行传统的分支预测并选择可能性最大 的一个分支执行,而是按分支的所有可能的后续路径开始并行执 行多段代码并暂存各段代码的执行结果,直到处理机能够确认分 支转移与否的条件是真是假时,处理机再把应该选择的路径上的 指令执行结果保留下来。 采用了推断技术后,原有的转移指令被转换成条件执行指令。原 有的转移指令的所有的分支都被并行执行,无论哪条分支将被命 中,都不会出现流水线断流现象,故消除了因分支预测失误而重 新装载流水线导致的低效率现象。更进一步,以前由于程序分支 和指令依赖等因素不能并行执行的许多指令现在完全可以并行执 行,从而提高了处理机的执行效率。

计算机组成原理第四章(白中英编科学出版社)PPT课件

计算机组成原理第四章(白中英编科学出版社)PPT课件

第14页
计算机组成原理
⊙第四章指令系统
指令操作码与地址码
3.二地址指令格式
操作码OC
AC1
AC2
(1)把保存操作前原来操作数的地址称为源点地址(SS),把保存指令 执行结果的地址称为终点地址或目的地址(DD)。
(2)将源点与终点操作数进行操作码规定的操作后,将结果存入终点 地址。通常二地址指令又称为双操作数指令。 例如,双操作数加法指令: A结D果D存R入0,R1R寄1表存示器将中R。0寄存器的内容和R1寄存器的内容相加以后,将 又 该 存如地器A址的D所内D指容(向相R0的加),单以R元后1表内 ,示容 将将作 结R为 果0寄源 存存点 入器操R的1作寄内数存容,器作和中为作。地为址终,点到操内作存数中的取R出1寄
素。 (b)数据的存取都只能在栈顶单元内进行,即数据的进栈与出栈都只
能经过栈顶单元这个“出入口”。 (c)堆栈中的数据采用“先进后出”或“后进先出”的存取工作方式。
B、 堆栈结构在计算机中的作用 (a)具有堆栈结构的机器使用零地址指令,这不仅合指令长度短,指
令结构简单,机器硬件简化。 (b)实现程序调用,子程序嵌套调用和递归调用。 (c)对于“中断”技术,堆栈更是不可缺少的,保存“断点”和“现
4
第4章 指令系统
4.1 指令系统的发展与性能要求 4.2 指令格式 4.3 指令和数据的寻址方式 4.4 堆栈寻址方式 4.5 典型指令
5
计算机组成原理
⊙第四章指令系统
4.1指令系统的发展与性能要求
指令系统决定了计算机的基本功能,指令系统的设计是计算机系统设计的 一个核心问题。它不仅与计算机的硬件设计紧密相关,而且直接影响到系 统软件设计的难易程度。
简化程序设计,提高程序的可读性非常有用。 (2)匀齐性:是指一种操作性质的指令可以支持各种数据类型。 (3)指令的格式与数据格式的一致性:指令长度与数据长度有一定关系,

计算机组成原理第三章课件(白中英版)

计算机组成原理第三章课件(白中英版)

03
比较
CISC注重提高指令的功能和灵活性,而RISC注重提高指令的执行速度
和效率。
MIPS指令系统介绍
MIPS(无互锁流水线微处理器 )
一种基于RISC架构的处理器,采用简单的 指令集和流水线技术。
指令格式
MIPS指令采用固定长度的32位格式,包括 操作码、寄存器地址等部分。
寻址方式
流水线技术
MIPS支持多种寻址方式,如立即数寻址、 寄存器寻址、基址寻址等。
高级语言是一种面向问 题或面向过程的语言, 更加接近人类的自然语 言,需要经过编译器或 解释器转换成机器代码 才能执行。
02
CATALOGUE
运算方法和运算器
数据的表示方法和转换
数据的表示方法
包括原码、反码、补码等表示方 法,以及移码表示法。
数据之间的转换
介绍不同数据表示方法之间的转 换方法,如原码到补码的转换、 补码到移码的转换等。
THANKS
感谢观看
计算机组成原理第 三章课件白中英版
contents
目录
• 计算机系统概述 • 运算方法和运算器 • 存储系统 • 指令系统 • 中央处理器 • 总线系统
01
CATALOGUE
计算机系统概述
计算机系统的基本组成
01
02
03
硬件
包括中央处理器、存储器 、输入输出设备等,提供 基本的计算、存储和通信 功能。
VS
总线标准
常见的总线标准有ISA总线、EISA总线、 VESA总线和PCI总线等。
PCI总线和USB总线介绍
PCI总线
PCI(Peripheral Component Interconnect)总线是一种高性能的32位 或64位局部总线,用于连接高速的外部设 备。

计算机组成原理(本全)白中英PPT课件

计算机组成原理
白中英
1 精选ppt课件2021
概述
计算机组成:主要指计算机硬件的具体实现方 式及工作原理
从三方面掌握本课程内容
– 硬件结构:从物理上、逻辑上掌握计算机 各部件和器件的构成和作用
– 实现方式:硬件联接形式和内部处理方式 (如控制器、运算器的实现方式等)
– 工作原理:计算机各部分内部工作过程
15 精选ppt课件2021
对一任意数S,其r进制数表示为 (S)r=kn ×r n-1+kn-1 × r n-2+… +ki × r i-1
+… +k-m × r -m-1 其中0≤ ki﹤r
r称为进位计数值的基数, ki为第i位数字符, i为位序号, r i为第i位的
• 计算机系统具有层次性,它是由多级层次结 构组成的。其层次之间的关系十分紧密,上 层是下层功能的扩展,下层是上层的基础; 层次的划分不是绝对的,各层之间有时是相 互渗透的。
13 精选ppt课件2021
第二章 运算方法和运算器
第一节 数据与文字的表示
数据一般分为两大类:
第四节 计算机软件
一、软件的组成与分类
计算机中的各种程序、数据和有关文档构成计算 机的软件系统。 计算机的软件一般分为两大类: • 系统软件:便于计算机使用的系统管理程序 (包括操作系统、语言处理、数据库管理系统等) • 应用软件:针对用户具体实际应用的程序
10 精选ppt课件2021
二、软件的发展
然后按指令的要求发出操作命令,控制计算机各部分 自动协调的工作。
简单程序 指令形式 控制器的基本任务 指令流和数据流 冯·诺依曼体系结构计算机的主要特征是:采用存储程 序和数据,由指令流来控制计算机的操作。

计算机组成原理第五章(白中英版)PPT课件


取出CLA指令
算术逻辑单元
ALU
累加器AC
取指 控制
操作控制器
时序产生器
执行 控制
时钟
状态 反馈
c
+ 1
c
20 CLA 21 ADD 30 22 STA 40 23 NOP 24 JMP 21
30 000 006 31 40
指令译码器
CLA
c
CLA
c 指令寄存器IR
缓冲寄存器DR
数据总线DBUS
15
2
第5章 中央处理器 计算机组成原理
5.1 CPU的组成和功能 5.2 指令周期 5.3 时序产生器和控制方式 5.4 微程序控制器 5.5 微程序设计技术 5.6 硬布线控制器 5.7 传统CPU
5.8 流水CPU 5.9 RISC CPU 5.10 多媒体CPU 5.11 CPU性能评价
3
5.1 CPU的功能和组成
30 000 006 31 40
CLA
c
CLA
c 指令寄存器IR
缓冲寄存器DR
数据总线DBUS
16
5.2.3 ADD指令的指令周期
一个CPU周期 一个CPU周期 一个CPU周期
取指令 开始 PC+1
执行加 操作
取下条指 令PC+1
对指令 译码
送操作 数地址
取出操 作数
取指令阶段
执行指令阶段
17
取出并执行ADD指令
☼ 第一章 计算机系统概论 ☼ 第二章 运算方法和运算器 ☼ 第三章 存储系统 ☼ 第四章 指令系统 ☼ 第五章 中央处理器 ☼ 第六章 总线系统 ☼ 第七章 外围设备 ☼ 第八章 输入输出系统 ☼ 第九章 并行组织

计算机组成原理第五章(白中英版)PPT课件

指令周期 : CPU从内存取出一条指令并执行完这 条指令的时间总和 取指时间+执行指令时间
CPU周期 : 又称机器周期(总线周期),CPU访问 内存所花的时间较长,因此用CPU从内存读取一条指 令字的所需的最短时间来定义
时钟周期 : 通常称为节拍脉冲或T周期。一个CPU 周期包含若干个时钟周期T
相互关系: 1个指令周期 = 若干个CPU周期 1个CPU周期 = 若20干21 T周期
2021
时序产生器 (3/4)
三、3级时序信号的关系 1、一台计算机机内的控制信号一般均由若干个周期
状态,若干个节拍电位及若干个时标脉冲这样3级 控制时序信号定时完成。 2、3级控制时序信号的宽度均成正整数倍同步关系。 周期状态之间,节拍电位之间,时标脉冲之间既 不容许有重叠交叉,又不容许有空白间隙,应该 是能一个接一个地准确连接,一个降落另一个升 起而准确切换的同步信号。
(2) 对指令进行译码,并产生相应的操作控制信号, 送往相应的部件,启动规定的动作;
(3) 指挥并控制CPU、内存与输入/输出(I/O)设 备之间数据流动的方向
• 运算器是数据加工处理部件,所进行的全部操作由 控制器发出的控制信号指挥
(1) (2)执行所有的逻辑运算,并进行逻辑测试
2021
CPU的基本模型
2021
5.1.1 CPU的功能
★ 指令控制
★ 操作控制 CPU产生每条指令所对应的操作信号,并把各种
操作信号送往相应的部件,从而控制这些部件按指令 的要求进行动作
★ 时间控制 对各种操作的实施时间进行定时
★ 数据加工 对数据进行算术运算和逻辑运算处理
2021
5.1.2 CPU的基本组成
• 控制器完成对整个计算机系统操作的协调与指挥。 (1) 控制机器从内存中取出一条指令,并指出下一条 指令在内存中的位置;
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

10.2安腾体系结构的基本设计思想
3、分支推断技术


技术能将传统的“ifthenelse”分支结构转变为无分支的顺序/并 行代码,以避免由于错误预测分支而付出代价。当处理机在运行 中遇到分支时,它并不是进行传统的分支预测并选择可能性最大 的一个分支执行,而是按分支的所有可能的后续路径开始并行执 行多段代码并暂存各段代码的执行结果,直到处理机能够确认分 支转移与否的条件是真是假时,处理机再把应该选择的路径上的 指令执行结果保留下来。 采用了推断技术后,原有的转移指令被转换成条件执行指令。原 有的转移指令的所有的分支都被并行执行,无论哪条分支将被命 中,都不会出现流水线断流现象,故消除了因分支预测失误而重 新装载流水线导致的低效率现象。更进一步,以前由于程序分支 和指令依赖等因素不能并行执行的许多指令现在完全可以并行执 行,从而提高了处理机的执行效率。
例1:下面给出一些汇编指令
①add rl=r2,r3 //简单指令:r2+r3=>r1 ②(P4)add rl=r2,r3 //推断指令,指定推断寄存 器4 ③add r1=r2,r3, //立即寻址指令 ④cmpeq P3,P5=0,r4 //带指令完成符的指令:将 r4寄存器的值与0比较,若相等则置推断寄存器P3为1, P5为0;否则置推断寄存器P3为0,P5为1 ⑤ld8 r1=[r7] //从寄存器r7指向的存储器 空间读取连续8个字节,装入寄存器r1 add r6=r9,r8; //与上一条指令不存在相关 性,故可放在一个指令组中 sub r3=r1,r4 //第一条指令的目标操作数是本指令 的源操作数,故需重新开始一个指令组 st8 [r6]=r10 //将寄存器r10的内容存入寄存器r6指 向的存储器单元
安腾的主要寄存器
10.3安腾指令系统结构
三、安腾指令格式

典型指令格式:安腾的每条指令占41位。

对于寄存器操作数,需要7位选择128个通用寄存器或浮点寄存 器。故一条典型的RRR型安腾指令需要21位来标识两个源 寄存器操作数和一个目标寄存器操作数。 大多数指令还需要一个6位字段选择64个推断寄存器之一,用于 支持推断执行、软件流水等功能。 指令束格式 安腾体系结构采用超长指令字技术,利用集束指令合成;
10.4指令级并行机制
3、推断执行的实现 例2考察下面的一个典型的if-then-else结构: If (x=0) then m=m+1 else m=m-1 在传统的超标量流水线体系结构中,完成上述判断通常要首先安 排一条比较语句,将x与0进行比较。得到比较结果后,再选择执行 then分支或else分支。 相应的汇编语句大致如下所示: cmp x,0;比较x和0 je L1;若相等则转移至标号L1 sub m,1;m=m-1 jmp L2;无条件转移至标号L2 L1:add m,1;m=m+l L2:
10.4指令级并行机制
4、安腾处理机设计思想 首先,安腾指令系统中的每条指令都能够支持推断执行, 所以第二条指令和第三条指令中的条件判断并不需要使 用专门的判断指令。虽然后面两条指令是条件执行的, 但整体条件判断结构不再需要分支指令。 其次,指令中的推断操作的安排是由编译器在编译过程 中完成的,不需要处理机在执行指令的非常短的时间内 动态安排各条指令的条件执行。 最后,每条指令中虽然可以指定推断寄存器,但取指令、 指令译码和执行操作并不需要等到推断寄存器的取值确 定后再进行。 下面可以看一下传统流水线与安腾处理机比较。
传统流水线与安腾处理机比较


IA32体系结构:IA32家族中的第一款32位微处理 机流水技术 IA32体系结构仍是基于CISC架构的处理机。 Pentium体系结构:CISC外壳加RISC内核的结构
10.1高性能处理机体系结构的演变
二、英特尔64位处理机的两种体系结构
1、64T(英特尔64):基于显式并行指令计算EPIC (Explicitly Parallel Instruction Computing)技术 的IA64体系结构,不与IA32指令系统的兼容性。 2、安腾体系结构:与IA32指令系统的兼容性。

指令束模版


10.3安腾指令系统结构
四、安腾汇编语言格式
[qp]Mnemonic[. Comp1][. Comp2] dest=src mnemonic为指令助记符。 dest为目标操作数,指明存放运算结果的寄存器。 src为源操作数,给出若干个寄存器操作数或立即数。 [qp]选择64个推断寄存器之一。在指令执行时,如果选定的一 比特推断寄存器的当前值为1,则该指令的执行结果最终会被 硬件采用;否则,该指令的执行结果将被硬件放弃。对于不需 要推断寄存器的指令,在机器指令中将默认指定推断寄存器0, 该寄存器的值固定为0。因此,所有的指令都可以看作是条件 执行的。 [.comp1][. Comp2] 为指令完成符,用于进一步限定指令所需 完成的操作。
10.4指令级并行机制例2续
而安腾处理机可以通过编译优化消除条件语句中的分支指 令,将该结构转化成顺序的推测执行结构: ①cmpeq P1,P2=0,x;//无条件执行:将r4寄存器的 值与0比较,若相等则置推断寄存器P1为1,P2为0,否则 置推断寄存器P1为0,P2为1 ②(P1)add m=1,m //若P1为1,则m+1送m ③(P2)add m=-1,m //若P2为1,则m-1送m 从判定流程上,似乎上面的三条语句并没有从逻辑上改变 if-then-else结构的执行过程。但如果我们能够把这个例子 和安腾体系结构结合起来,还是可以从这个简单的例子中 体会到安腾处理机的设计思想。
10.4指令级并行机制
一、推断执行技术 1、分支对系统性能的影响 分支是在两个指令序列中根据判定条件选择其 中一个序列执行。为了判定最终选择哪一个指 令序列执行,必须等待一些条件判断指令的执 行结果。


指令执行一旦遇到分支转移,在执行判定操作之前, 多个功能部件由于无法确定程序的执行方向而空闲等 待,使系统性能明显下降。 分支预测并不能充分利用处理机流水线的功能部件
10.2安腾体系结构的基本设计思想
4、推测技术


推测技术,包括控制推测和数据推测,以减少存储器 访问响应时间的影响。 控制推测技术和数据推测技术允许提前执行从内存单 元至通用寄存器的取数指令。当程序中有分支时,控 制推测技术将位于分支指令之后的取数指令提前若干 周期执行,以此消除访存延时,提高指令执行的并行 度。而数据推测技术则用于解决提前取数指令后的数 据相关性问题。 推测技术避免了cache命中失败而导致访存延迟的损 失,消除了因处理机空闲而导致的并行性降低的缺憾。
10.3安腾指令系统结构
二、安腾寄存器结构




与RISC体系结构类似,安腾体系结构大量使用寄 存器操作;见下一页图 只有取数load和存数store指令才能够访问内存,所 有其他指令都在寄存器上操作。 在以安腾为基础的处理机内,用户可直接使用的寄 存器数量甚至大大超过了主流RISC处理机。 一方面可以加快数据存取的速度,减少访存延迟, 另一方面可以更好地支持并行操作。
10.2安腾体系结构的基本设计思想
2、超长指令字(VLIW)技术


超长指令字(VLIW)技术是提高计算机系统并行 性的有效手段。VLIW系统中指令字长可多达 几百位,编译器经过优化,能将多条能够并行 执行的指令合并成一个具有多个操作码的超长 指令字,控制多个独立的功能部件工作。 EPIC是基于超长指令字的设计。 通过将多条指令放入一个超长指令字,能有效 提高处理机内各个执行部件的利用率。
10.3安腾指令系统结构
一、执行单元与指令类型 为提高并行处理能力,安腾处理机内部设 置了多个执行单元。这些执行单元被分为四类:




I单元:整数执行单元,用于执行整数算术运算、逻 辑运算、移位和比特处理等指令,以及32位数据和 指针操作。 M单元:存储器执行单元,用于执行通用寄存器、浮 点寄存器和存储器之间的取数(load)指令、存数 (store)指令以及某些整数ALU运算指令。 B单元:转移执行单元,用于执行转移分支类指令。 F单元:浮点执行单元,用于执行浮点运算指令。 相应地,安腾指令系统中的所有指令被分成六种 类型,每种指令使用一种或多种执行单元。
10.2安腾体系结构的基本设计思想
1、显式并行指令计算(EPIC)技术 Nhomakorabea
安腾的指令中设计了属性字段,用于指明哪些指令可 以并行执行。这些属性信息并不是在指令执行过程中 由处理机判定后获得的,而是由编译程序在编译时通 过对源代码的分析获取指令级的并行性信息,并填写 到执行代码中。这就是所谓显式并行的概念。 EPIC技术则充分利用现代编译程序强大的对程序执 行过程的调度能力,由专用的EPIC编译器首先分析 源代码,根据指令之间的依赖关系最大限度地挖掘指 令级的并行性,从而确定哪些指令可以并行执行,然 后把并行指令放在一起并重新排序,提取并调度其指 令级的并行,并将这种并行性通过属性字段“显式” 地告知指令执行部件。
10.2安腾体系结构的基本设计思想
6、寄存器堆栈技术

安腾处理机利用128个通用寄存器中的96个堆 栈寄存器实现寄存器堆栈,并在处理机内部设 置一个寄存器堆栈引擎RSE来管理寄存器堆栈。 当96个堆栈寄存器不够用时,寄存器堆栈引擎 能够自动将寄存器堆栈与内存储器对接,将寄 存器堆栈溢出的数据转移到内存储器中保存, 或在寄存器堆栈弹出数据时执行反向操作。这 样,编译器将看到一个容量没有限制的寄存器 堆栈空间。
10.2安腾体系结构的基本设计思想

安腾体系结构脱离了IA32 CISC体系结构的束缚,但并 没有完全照搬RISC处理机的设计思想。EPIC既不是 RISC,也不是CISC,而是一种吸收了CISC和RISC两 者长处的全新的体系结构。主要体现在以下几个方面: 显式并行指令计算(EPIC)技术 超长指令字(VLIW)技术 分支推断技术 推测技术 软件流水技术 寄存器堆栈技术
相关文档
最新文档