计算机系统结构 第五章(向量处理机)

合集下载

计算机系统结构-向量处理机

计算机系统结构-向量处理机

WENKU DESIGN
定义与特点
定义
向量处理机是一种特殊类型的计算 机系统,专门设计用于高效处理大
规模数据集,特别是向量数据。
并行处理
能够同时处理多个数据项,大 大提高了处理速度。
内存优化
具有大容量内存和快速内存访 问,以支持大规模数据处理。
专门化硬件
拥有专门为向量运算设计的硬 件,如向量寄存器、乘法器等
03
工具和技术支持。
并行度更高
01
更高并行度的处理器能够同时处理多个任务,提高计算速度 和效率。
02
并行度的提高需要更高效的线程管理和调度技术,以避免资 源冲突和死锁。
03
并行度的提高也带来了数据一致性和同步的挑战,需要更严 谨的设计和实现。
内存墙问题
内存墙问题是指随着处理器性能的提高,内存带宽和延迟成为系统瓶颈, 限制了处理器性能的发挥。
向量处理机的性能优化
REPORTING
WENKU DESIGN
数据预取技术
预测算法
通过分析历史数据,预测未来数 据访问模式,提前从内存中取出 数据放入缓存中。
智能预取
利用AI技术进行数据预取,根据 程序运行时的行为特征,自动识 别出访问模式,提前预取数据。
指令流预取
根据指令流信息,预测即将访问 的数据,提前从内存中取出数据 放入缓存中。
PART 06
向量处理机的发展趋势与 挑战
REPORTING
WENKU DESIGN
向量化程度更高
01
向量化程度更高的处理器能够执行更复杂的计算任务,提高计 算效率和精度。
02
高向量化程度的处理器需要更高效的编译器和优化技术,以充
分发挥其性能。

计算机系统结构-第五章自考练习题答案

计算机系统结构-第五章自考练习题答案

(效率:3/8△t 效率:3/8)同步强化练习一.单项选择题。

1. 重叠机器局部相关的处理方法有两类:推后后续指令对相关单元的读和〔 C 〕。

A.异步流动B.采用顺序流动C.设置相关直接通路D.调整指令流动的顺序2. CRAY-1的流水线是〔 C 〕。

A. 多条单功能流水线B.一条单功能流水线C.一条多功能流水线D.多条多功能流水线3. 指令间的“一次重叠〞是指〔 B 〕。

A.“K 执行〞与“1+K 取指〞重叠B.“1+K 分析〞与“K 执行〞重叠C.“1+K 取指〞与“K 分析〞重叠D. “K 分析〞与“1+K 执行〞重叠4. 指令缓冲器的容量越大,发生指令相关的概率将〔 A 〕。

A.增大B.降低C.不变D.不定5. “取指〞、“分析〞、“执行〞之间的流水属于〔 B 〕。

A.系统级流水B.处理机级流水C.部件级流水D.作业级流水6. 非线性流水线是指〔 B 〕。

A.流水线中某些功能段在各次运算中的作用不同B.一次运算中要屡次使用流水线中的某些功能段C.一次运算中使用流水线的多个功能段D.流水线的各个功能段在各种运算中有不同的组合7. 关于标量流水机的说法有错的是〔 B 〕。

A.没有向量数据表示B.不能对向量数据进展运算C.可对标量数据进展流水处理D.可以对向量、数组进展运算8. 与流水线最大吞吐率有关的是〔 D 〕。

A.最后子过程的时间B.各个子过程的时间C.最快子过程的时间D.最慢子过程的时间9. 在流水线的相关处理中,会发生“写一写〞相关和“先读后写〞相关的是〔 C 〕。

A.猜想法B.顺序流动C.异步流动D.相关专用通路10. 在流水机器中,全局性相关是指〔 D 〕。

A.先读后写相关B.指令相关C.先写后读相关D.由转移指令引起的相关11. IBM360/91机对指令中断的处理方法是〔 A 〕。

A.不准确断点法B.指令复执法C.准确断点法D.对流水线重新调度12. CRAY-1机的两条向量指令V1←V2+V3V4←V1*V5属于〔 B 〕。

向量处理机

向量处理机

向量处理机向量处理机(vector computer),面向向量型并行计算,以流水线结构为主的并行处理计算机。

向量是计算机系统中经常使用的一种数据类型,向量由一组有序、具有相同类型和位数的元素组成。

采用先行控制和重叠操作技术、运算流水线、交叉访问的并行存储器等并行处理结构,对提高运算速度有重要作用。

但在实际运行时还不能充分发挥并行处理潜力。

向量运算很适合于流水线计算机的结构特点。

为了成分发挥流水线处理机的效率,实现高性能计算,有得流水线处理机设置了向量数据表示和相应的向量指令,这就是所谓的向量处理机。

向量型并行计算与流水线结构相结合,能在很大程度上克服通常流水线计算机中指令处理量太大、存储访问不均匀、相关等待严重、流水不畅等缺点,并可充分发挥并行处理结构的潜力,显著提高运算速度。

内容简介:向量处理机(vector computer),面向向量型并行计算,以流水线结构为主的并行处理计算机。

向量运算是一种较简单的并行计算,适用面很广,机器实现比较容易,使用也比较方便,因此向量处理机(向量机)获得了迅速发展。

TI ASC(1972年)和CDC STAR-100 (1973年)是世界上第一批向量巨型计算机(巨型机)。

到1982年底,世界上约有60台巨型机,其中大多数是向量机。

中国于1983年研制成功的每秒千万次的757机和亿次的“银河”机也都是向量机。

向量机适用于线性规划、傅里叶变换、滤波计算以及矩阵、线性代数、偏微分方程、积分等数学问题的求解,主要解决气象研究与天气预报、航空航天飞行器设计、原子能与核反应研究、地球物理研究、地震分析、大型工程设计,以及社会和经济现象大规模模拟等领域的大型计算问题。

1.向量的运算:在普通计算机中,机器指令的基本操作对象是标量,而向量机除了有标量处理功能外还具有功能齐全的向量运算指令系统。

对一个向量的各分量执行同一运算,或对同样维数的两个向量的对应分量执行同一运算,或一个向量的各分量都与同一标量执行同一运算,均可产生一个新的向量,这些是基本的向量运算。

计算机组成原理第5章作业答案

计算机组成原理第5章作业答案

14. 在什么条件下,I/O设备可 以向CPU提出中断请求?
解:I/O设备向CPU提出中断 请求的条件是:I/O接口中的设备 工作完成状态为1(D=1),中断 屏蔽码为0 (MASK=0),且CPU
查询中断时,中断请求触发器状态 为1(INTR=1)。
15. 什么是中断允许触发器?它 有何作用?
程序控制接口、程序中断接口、 DMA接口三种。
11. 简述I/O接口的功能和基本组成。
答: P188 (1)选址功能 (2)传送命令的功能 (3)传送数据的功能 (4)反映I/O设置工作状态的功能
13. 说明中断向量地址和入口地址的 区别和联系。
解: 中断向量地址和入口地址的区别: 向量地址是硬件电路(向量编码器)
输入输出系统
第 五章2. 简要说明C源自U与I/O之间传递信息可 采用哪几种联络方式?它们分别用于什么 场合?
答: CPU与I/O之间传递信息常采用 三种联络方式:直接控制(立即响应)、 同步、异步。 适用场合分别为:
直接控制适用于结构极简单、速度极 慢的I/O设备,CPU直接控制外设处于某种 状态而无须联络信号。
N个数据所需的处理时间=P×N+Q秒 平均每个数据所需处理时间= (P×N+Q)/ N 秒; 求倒数得: 该系统跟踪到的每秒中断请求数=N/ (P×N+Q)次。
19. 在程序中断方式中,磁盘申请 中断的优先权高于打印机。当打印机正 在进行打印时,磁盘申请中断请求。试 问是否要将打印机输出停下来,等磁盘 操作结束后,打印机输出才能继续进行? 为什么?
I/O设备匀速运行, 25s后,第二 个中断请求到来,CPU正在执行中断程 序接收第一个数据, 40s时响应;
50s后,第三个中断请求到来, CPU正在执行中断程序接收第二个数据, 要到80s时响应;

中国海洋大学计算机系统结构课程大纲(理论课程)

中国海洋大学计算机系统结构课程大纲(理论课程)

中国海洋大学计算机系统结构课程大纲(理论课程)中国海洋大学计算机系统结构课程大纲(理论课程)英文名称Computer Architecture【开课单位】计算机科学与技术系【课程模块】学科基础【课程编号】【课程类别】选修【学时数】 48 (理论实践 ) 【学分数】 3一、课程描述本课程大纲根据2011年本科人才培养方案进行修订或制定。

(一)教学对象计算机科学与技术专业大学三年级学生(二)教学目标及修读要求1、教学目标(课程结束后学生在知识、技能和态度三个层面达到的目标) 本课程的结束后,学生应掌握计算机系统结构的基本概念、基本原理、基本结构和基本分析方法,初步了解和掌握几种高性能计算机系统的架构;初步具备计算机系统的架构分析能力,初步具备计算机系统性能的评测技能;对现有的主流计算机系统能有一个比较全面的了解,开阔眼界和思路,为今后进一步的学习、研究和工作奠定基础。

2、修读要求(简要说明课程的性质,与其他专业课程群的关系,学生应具备的基本专业素质和技能等)本课程是一门专业理论课。

由于计算机系统是一个复杂的系统,在学生已经学习了“计算机组成原理”、“计算机操作系统”、“汇编语言程序设计”、“高级语言程序设计”等计算机硬件和软件方面的多门课程之后,通过学习“计算机系统结构”这门课程才能够建立起计算机系统的完整概念。

(三)先修课程(参照2011版人才培养方案中的课程名称,课程名称要准确) 先修课程:“高级语言程序设计”;“计算机组成原理”;“操作系统”。

二、教学内容(一)第1章计算机系统结构的基本概念1、主要内容:1.1 计算机系统结构1.2 计算机系统设计技术1.3 系统结构的评价标准1.4 计算机系统结构的发展2、教学要求:(按照掌握、理解、了解三个层次对学生学习提出要求)掌握计算机系统层次结构,计算机系统结构、计算机组成、计算机实现定义及三者之间的关系,透明性概念,Amdahl定律,CPU性能公式,局部性原理,MIPS 定义,MFLOPS定义,计算机系统结构的分类;理解计算机系统设计方法,系统结构的评价标准;了解冯?诺依曼计算机特征,计算机系统结构的发展,价格、软件、应用、VLSI和算法对系统结构的影响。

计算机体系重叠流水和向量处理机

计算机体系重叠流水和向量处理机

计算机体系重叠流水和向量处理机1. 引言计算机体系结构是指计算机硬件和软件组成的总体结构,其中包含了各个组件之间的互连关系、指令执行过程和数据传输方式等。

在计算机体系结构中,重叠流水和向量处理机是两种常见的优化技术,它们可以显著提升计算机的性能和效能。

2. 重叠流水技术重叠流水是一种通过将指令执行过程划分为多个阶段,并在不同阶段同时执行不同的指令来实现指令级并行的技术。

重叠流水的核心思想是任务重叠,即在当前指令执行的同时,下一条指令的取指阶段已经开始,上一条指令的结果也可以被下一条指令使用。

重叠流水主要包含以下几个阶段: - 取指(Instruction Fetch):从内存中取得当前指令。

- 译码(Instruction Decode):对指令进行解码,并获取操作数。

- 执行(Execution):对指令所需的操作数进行运算,得到结果。

- 访存(Memory Access):根据需要,读取或写入内存中的数据。

- 写回(Write Back):将结果写回到目标寄存器。

2.1 重叠流水的优势重叠流水技术的优势主要表现在以下几个方面: - 提高了指令级并行处理的能力,加快了程序的执行速度。

- 充分利用了硬件资源,提高了系统的效率和吞吐量。

- 可以将计算任务划分为多个小任务,提高了系统的可扩展性和可移植性。

2.2 重叠流水的限制重叠流水技术虽然可以提高计算机的性能,但也存在一些限制: - 指令之间的依赖关系会影响重叠流水的效果,当一个指令的结果需要被后续指令使用时,需要等待该指令执行完成,从而降低了并行的效果。

- 分支指令(如if、for循环等)会导致流水线的中断和重新调整,影响了流水线的效率。

- 数据冒险(Data Hazards)和控制冒险(Control Hazards)也会对重叠流水的效果造成影响。

3. 向量处理机技术向量处理机是一种以向量为基本数据单位,以向量操作为基本操作,通过向量指令和向量寄存器实现的高性能处理机。

计算机系统结构复习试题及答案(非计算)

计算机系统结构复习试题及答案(非计算)

计算机系统结构复习试题及答案(⾮计算)⼀.名词解释计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。

在计算机技术中,把这种本来存在的事物或属性,但从某种⾓度看⼜好像不存在的概念称为透明性。

系列机:由同⼀⼚家⽣产的具有相同系统结构、但具有不同组成和实现的⼀系列不同型号的计算机。

同构型多处理机系统:由多个同类型或⾄少担负同等功能的处理机组成,它们同时处理同⼀作业中能并⾏执⾏的多个任务。

堆栈型机器:CPU 中存储操作数的单元是堆栈的机器。

累加器型机器:CPU 中存储操作数的单元是累加器的机器。

通⽤寄存器型机器:CPU 中存储操作数的单元是通⽤寄存器的机器。

数据相关:考虑两条指令i 和j,i 在j 的前⾯,如果下述条件之⼀成⽴,则称指令j 与指令 i 数据相关:(1)指令j 使⽤指令i 产⽣的结果;(2)指令j 与指令k 数据相关,⽽指令k ⼜与指令i 数据相关。

定向:⽤来解决写后读冲突的。

在发⽣写后读相关的情况下,在计算结果尚未出来之前,后⾯等待使⽤该结果的指令并不见得是马上就要⽤该结果。

如果能够将该计算结果从其产⽣的地⽅直接送到其它指令需要它的地⽅,那么就可以避免停顿。

向量处理机:指令级并⾏:简称ILP。

是指指令之间存在的⼀种并⾏性,利⽤它,计算机可以并⾏执⾏两条或两条以上的指令。

指令的动态调度:是指在保持数据流和异常⾏为的情况下,通过硬件对指令执⾏顺序进⾏重新安排,以提⾼流⽔线的利⽤率且减少停顿现象。

是由硬件在程序实际运⾏时实施的。

指令的静态调度:是指依靠编译器对代码进⾏静态调度,以减少相关和冲突。

它不是在程序执⾏的过程中、⽽是在编译期间进⾏代码调度和优化的。

失效率:CPU 访存时,在⼀级存储器中找不到所需信息的概率。

失效开销:CPU 向⼆级存储器发出访问请求到把这个数据调⼊⼀级存储器所需的时间。

强制性失效:当第⼀次访问⼀个块时,该块不在Cache 中,需要从下⼀级存储器中调⼊Cache,这就是强制性失效。

计算机系统结构--向量处理机

计算机系统结构--向量处理机

如果程序的90%是向量运算,10%是标 量运算。则向量平衡点为0.9。硬件利用 率最高。 向量处理机的向量平衡点必须与用户程序 的向量化程度相匹配。 IBM向量计算机的设计思想与上述方法不 同,它维持较低的向量与标量比例,定 在3~5的范围之间。这种做法能够适应 通用应用问题对标量和向量处理要求。
6.2.1 存储器-存储器结构
向量处理机中有多个高速流水线运算部件, 存储器的访问速度是关键 采用多个存储体交叉和并行访问来提高存 储器速度,例如: CRAY-1有64个存储体,每个处理 机访问4个存储体 STAR-100采用32个存储体交叉, 每个存储体并行读出8个64位数据 我国研制的YH-1向量计算机有37个 存储体
把存储器-存储器结构中的缓冲栈改为向量 寄存器,运算部件需要的操作数从向量 寄存器中读取,运算的中间结果也写到 向量寄存器中。 向量寄存器与标量寄存器的主要差别是: 一个向量寄存器能够保存一个向量, 例如:64个64位寄存器。 连续访问一个向量的各个分量。 需要有标量寄存器和地址寄存器等。
采用寄存器-寄存器结构的主要优点:降低 主存储器的流量。 例如:采用寄存器-寄存器结构的 CRAY-1与采用存储器-存储器结构的 STAR-100比较,运算速度高3倍多,而 主存流量低2.5倍。 STAR-100的主存储器流量: 32×8W/1.28us=200MW/S CRAY-1的主存储器流量: 4W/50ns=80MW/S
6.3 向量处理方式
要根据向量运算的特点和向量处理机的 类型选择向量的处理方式。 有三种处理方式: 1.横向处理方式,又称为水平处理方 式,横向加工方式等。向量计算是按 行的方式从左至右横向地进行。 2.纵向处理方式,又称为垂直处理方 式,纵向加工方式等。向量计算是按 列的方式自上而下纵向地进行。 3.纵横处理方式,又称为分组处理方
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3 之 1
什么是向量处理
— 例子
用Fortran语言编写的一个简单程序: DO 100 I=1,N A(I) =B(I)+C(I) 100 B(I)=2*A(I+1)
《Computer Architecture》V3
幻灯片 5 / 68
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念
《Computer Architecture》V3 幻灯片 22 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本结构>>存储器-存储器结构
3 之 2
处理时序图
(所有向量都从模块0开始存放)
流水段4 流水段3 流水段2 0 0 1 0 1 2 1 2 3 2 3 4 3 4 5 4 5 6 5 6 7
《Computer Architecture》V3 幻灯片 3 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念
2 之 2
向量处理机
《Computer Architecture》V3
幻灯片 4 / 68
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念
幻灯片 2 / 68
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念
2 之 1
向量处理机
具有向量数据表示和向量指令系统的处理机, 是解决数值计算问题的一种高性能计算机结构。 有两个主要优点:效率高和适用性广,一般都采 用流水线结构,有多条流水线并行工作。
向量处理机通常属大型或巨型机,也可以用 微机加一台向量协处理器组成。一般向量计算机 中包括有一台高性能标量处理机。 必须把要解决的问题转化为向量运算,向量 处理机才能充分发挥作用
纵横处理方式
举例 第1组: 第2组: T(1,n) = B(1,n) + C(1,n)
Y(1,n) = A(1,n)×T(1,n)
T(n+1,2n) = B(n+1,2n)+C(n+1,2n) Y(n+1,2n) = A(n+1,2n)×T(n+1,2n)
……
最后第k+1组:T(kn+1,N) = B(kn+1,N) + C(kn+1,N) Y(kn+1,N) = A(kn+1,N) + T(kn+1,N)
等。横向处理和纵向处理相结合的方式。即: 将长度为N的向量分成若干组,每组长度为 n,组内采用纵向处理方式,组间采用横向 处理方式。
《Computer Architecture》V3 幻灯片 13 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念>>向量处理方式
3 之 2
向量处理机
基本概念
基本结构
设计目标 关键技术 协处理器 性能评价
《Computer Architecture》V3 幻灯片 1 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容
基本概念
向量处理机
什么是向量处理 向量处理方式
《Computer Architecture》V3
适合用于寄存器-寄存器结构的向量处理机中, 因为向量寄存器的长度是有限的,例如,每个向量 寄存器有64个寄存器。当向量长度N大于向量寄存 器长度n时,需要分组处理。
《Computer Architecture》V3 幻灯片 15 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容
基本结构
W4
W3 W3
存储体0 RA0 RA0 RB0 RB0
《Computer Architecture》V3 幻灯片 23 / 68
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本结构>>存储器-存储器结构
3 之 3
总 结
操作数缓冲器和写结果缓冲器主要用于解决
访问存储器冲突。主要优缺点:硬件结构简单, 造
流水段1
存储体7 存储体6 存储体5
0
1
2
3
Hale Waihona Puke 4567
RB5 RB5 RA7 RA7 W3 W3 RB4 RB4 RA6 RA6 W2 W2 RB3 RB3 RA5 RA5 W1 W1
存储体4
存储体3 存储体1
RB2 RB2 RA4 RA4 W0 W0
RB1 RB1 RA3 RA3 W6 RB7 RB7 RB6 RB6
幻灯片 9 / 68
《Computer Architecture》V3
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念>>向量处理方式
2 之 2
横向处理方式
分析
存在两个问题:在计算向量的每个分量 时,都发生写读数据相关,流水线效率低; 如果采用多功能流水线,还必须频繁进行流 水线切换。所以横向处理方式对向量处理机 不适合,即使在标量处理机中,也经常通过 编译器进行指令流调度。
幻灯片 17 / 68
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本结构
3 之 2
存储器-存储器结构
M M M M M M M M
《Computer Architecture》V3 幻灯片 18 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
A B
流水结构 加法器
C=A+B
采用向量指令只需要2条: VADD B, C, T VMUL A, T, Y
《Computer Architecture》V3 幻灯片 12 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念>>向量处理方式
3 之 1
纵横处理方式
处理方法
又称为分组处理方式、纵横向加工方式
3 之 2
什么是向量处理
— 标量处理
10 INITIALIZE I=1 READ B(I) READ C(I) ADD B(I)+C(I) STORE A(I)←B(I)+C(I) READ A(I+1) MULTIPLY 2*A(I+1) STORE B(I)←2*A(I+1) INCREMENT I←I+1 IF I≤N GOTO 10 STOP
幻灯片 6 / 68
;读数指令 ;运算指令 ;存数指令 ;运算指令 ;存数指令 ;运算指令 ;条件转移指令
《Computer Architecture》V3
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念
3 之 3
什么是向量处理
— 向量处理
A(1:N)=B(1:N)+C(1:N) ;并行运算指令 TEMP(1:N)=A(2:N+1) ;并行取数指令 B(1:N)=2*TEMP(1:N) ;并行运算指令


模块7
A[7]
B[5]
C[3]

《Computer Architecture》V3
幻灯片 20 / 68
同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本结构>>存储器-存储器结构
2 之 2
处理时序图
流水段4 流水段3 流水段2 0 0 1 0 1 2 1 2 3 2 3 4 3 4 5 4 5 6 5 6 7 6 7 7
采用同一例子说明
《Computer Architecture》V3 幻灯片 8 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念>>向量处理方式
2 之 1
横向处理方式
处理方法 又称为水平处理方式、横向加工方式等。向量计算是按 行的方式从左至右横向地进行。 举例 逐个分量进行处理:假设中间结果为T(I) 计算第1个分量: T(1) =B(1)+C(1) Y(1) =A(1)×T(1) 计算第2个分量: T(2) =B(2)+C(2) Y(2) =A(2)×T(2) …… 计算最后一个分量:T(N)=B(N)+C(N) Y(N)=A(N)×T(N)
本章内容>>基本结构
3 之 3
存储器-存储器结构
采用多个存储体交叉和并行访问来提高 存储器速度,但应该注意解决存储器访问冲 突。下面分情况进行介绍(假设一个存储周 期占两个处理机周期):
《Computer Architecture》V3
理想情况 实际情况
幻灯片 19 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
向量处理机的最关键问题是存储器系统能够满 足运算部件带宽的要求。主要采用两种方法: 存储器-存储器结构 多个独立的存储器模块并行工作。处理机结构 简单,对存储系统的访问速度要求很高。 寄存器-寄存器结构 运算通过向量寄存器进行。需要大量高速寄存 器,对存储系统访问速度的要求降低,而且利用 高速寄存器可完成对矩阵元素的特殊运算。
《Computer Architecture》V3 幻灯片 11 / 68 同济大学.电子与信息工程学院.计算机科学与工程系
本章内容>>基本概念>>向量处理方式
2 之 2
纵向处理方式
分析
因为数据相关不影响流水线连续工作,不同的 运算操作只需要切换1次,所以这种处理方式适用 于向量处理机。 结果的存储直接面向存储器,n的大小可以不 受限制,但速度受到存储器吞吐量的限制。
相关文档
最新文档