计算机系统结构的研究内容
第三章 计算机系统分层结构

PF
CF
奇偶(偶/奇)
进位(是/否)
PE
CY
PO
NC
3.总线
所谓总线是一组能为多个部件分时共享的公共信息传送线路, 它分时接收各部件送来的信息,并发送信息到有关部件。
由于多个部件连接在一组公共总线上,可能会出现多个部件争 用总线,因此需设置总线控制逻辑以解决总线控制权的有关问题。
总线分类:
CPU内部总线用来连接CPU内的各寄存器与ALU ; 系统总线用来连接CPU、主存储器与I/O接口,它通常包括 三组:数据总线、地址总线和控制总线。 按总线传送的方向可将总线分为单向总线和双向总线。
CPU是计算机的核心组成部分
3.1.1
CPU的组成
• 由算术逻辑部件ALU 、控制器、各种寄存器(寄 存器群)和CPU内部总线(连接部件) • 另:Cache
•
1.ALU部件
ALU的功能是实现数据的算术与逻辑运算 两个输入端口,参加运算的两个操作数,通常 来自CPU中的通用寄存器或ALU总线。 控制信号:ADD,SUB,OR,AND等 输出:运算结果
时序控制方式就是指微操作与时序信号之间采取何种关系,
它不仅直接决定时序信号的产生,也影响到控制器及其他部件的组 成,以及指令的执行速度。
1.同步控制方式
同步控制方式是指各项操作由统一的时序信号进行同步控制。 同步控制的基本特征是将操作时间分为若干长度相同的时钟 周期(也称为节拍),要求在一个或几个时钟周期内完成各个微 操作。在CPU内部通常是采用同步控制方式 。 同步控制方式的优点是时序关系简单,结构上易于集中,相应 的设计和实现比较方便。
计算机系统结构
系统的层次结构
★★
5层
翻译(编译器)
计算机系统的层次结构和功能模块

计算机系统的层次结构和功能模块在计算机科学领域,计算机系统是由不同层次和功能模块构成的复杂系统。
这些层次和功能模块相互协作,实现了计算机的各项功能和任务。
本文将详细探讨计算机系统的层次结构和各个功能模块。
一、计算机系统的层次结构计算机系统的层次结构一般可以分为硬件层次和软件层次两个大的方面。
硬件层次包括物理层、逻辑层和微程序层;软件层次包括操作系统、系统软件和应用软件。
1. 物理层物理层是计算机系统的最底层,包括处理器、存储器、输入输出设备等硬件组成部分。
处理器是计算机的核心部件,负责执行各种指令和进行数据处理。
存储器用于存储数据和指令。
输入输出设备则用于与外部环境进行数据交互。
2. 逻辑层逻辑层主要负责解决数据传输和控制信号的问题,确保数据的正确传输和处理。
逻辑层包括总线、控制器和接口等组成部分。
总线是连接各个硬件设备的通信线路,用于传输数据和控制信号。
控制器则负责管理和控制各个硬件设备的工作。
接口用于连接外部设备和计算机系统。
3. 微程序层微程序层是计算机系统的底层软件,主要负责解释和执行计算机指令。
微程序层的设计和实现可以提高计算机系统的性能和灵活性。
4. 操作系统操作系统是计算机系统的核心软件,负责管理和控制计算机系统的各项资源,提供用户与计算机之间的接口。
操作系统包括进程管理、内存管理、文件系统、设备管理等模块,保证计算机系统的稳定运行和资源的有效利用。
5. 系统软件系统软件是在操作系统之上的软件层次,为用户提供各种工具和服务。
系统软件包括编译器、调试器、数据库管理系统等。
6. 应用软件应用软件是计算机系统中最顶层的软件,用于满足用户的各种需求。
应用软件包括办公软件、图像处理软件、娱乐软件等。
二、计算机系统的功能模块除了按照层次结构划分,计算机系统还可以按照功能模块进行划分。
计算机系统的功能模块包括:输入模块、输出模块、存储模块、运算控制模块、逻辑控制模块和时序控制模块。
1. 输入模块输入模块是用于将外部数据和指令输入到计算机系统中的模块。
西南大学计算机师资

计算机与信息科学学院目前有硕士研究生专业6个:计算机系统结构、计算机软件与理论、计算机应用技术、图书馆学、情报学、教育技术学。
一、计算机系统结构本专业研究计算机系统结构的新理论、新技术及其应用,培养具有扎实的计算机硬件、软件基础理论知识,能够从事计算机系统结构研究与应用开发的高级专门人才。
本专业主要研究方向:嵌入式系统:主要从事嵌入式系统硬件平台,嵌入式操作系统开发,嵌入式系统应用,片上系统,嵌入式浏览器/服务器,基于嵌入式的无线网络等方面的研究工作。
智能识别:人体生物特征识别,语音识别,字符识别,目标识别,实时快速算法与并行算法研究。
主要解决计算机视觉、智能机器人等研究领域中的关键理论与应用技术,并开发相应软件,嵌入相应设备。
先进计算机结构:主要从事存储管理,面向对象的网络存储技术,冗余节点阵列技术RAIN,计算机接口技术,基于CPLD和FPGA器件的硬件设计技术,专用集成电路ASIC等方面的研究工作。
二、计算机软件与理论计算机软件与理论主要研究软件设计、开发、维护和使用过程中涉及的软件理论、方法和技术,探讨计算机科学与技术发展的理论基础。
本专业主要研究方向:软件工程:主要从事针对软件工程理论和技术的研究,包括各种模型、面向对象方法、软件重构、软件重用、软件构件、软件测试评价以及软件形式化的研究。
它为广范地开发软件提供了理论及应用层面的全面性研究。
数据库与信息系统:主要从事数据库系统的体系结构、数据库安全、数据库并发控制、数据库恢复技术、并行数据库、分布式数据库、多媒体数据库、空间数据库、WEB与数据库、XML与半结构化数据库、异构数据库集成。
WEB应用技术:主要从事新一代WEB应用技术、WEB信息系统模型、WEB电子商务基本架构、WEB界面设计、WEB智能、WEB数据仓库与WEB 数据挖掘、XML在电子商务中的应用基础研究等。
软件测试技术与理论:主要从事软件质量与软件可靠性,软件测试理论、测试技术与标准,软件测试工具等研究。
计算机系统结构与计算机中的编码

1.1计算机系统结构计算机的发展历史:1946年,世界上第一台电子计算机ENIAC出现,之后经历了5个发展阶段:冯式结构计算机的组成部分:存储器、运算器、控制器、输入设备和输出设备。
强化的概念:计算机的工作过程:一般是由用户使用各种编程语言把所需要完成的任务以程序的形式提交给计算机,然后翻译成计算机能直接执行的机器语言程序,在计算机上运行。
计算机系统可以由下面的模型表示:计算机系统结构(computer architecture):指机器语言级机器(物理机器)的系统结构,它主要研究软件、硬件功能分配,确定软件、硬件界面(机器级界面),即从机器语言程序员或编译程序设计者的角度所看到的机器物理系统的抽象。
计算机组成(computer organization):是指计算机系统的逻辑实现,包括机器内部数据流和控制流的组成以及逻辑设计等,其目标是合理的把各种部件、设备组成计算机,以实现特定的系统结构,同时满足所希望达到的性能价格比。
计算机实现(computer implementation)是指计算机组成的物理实现。
这几个概念之间的关系可以用下面的图加以说明:计算机系统的分类:Flynn分类、冯氏分类、Handler分类和Kuck分类;Flynn分类:根据不同指令流—数据流组织方式把计算机系统分成4类。
(重点理解)指令流:机器指令的执行序列;数据流:由指令流调用的数据序列,包括输入数据和中间结果;多倍性:在系统性能的瓶颈部件上同时处于同样执行阶段的指令和数据的最大可能个数;I. 单指令流单数据流SISD——如单处理机II. 单指令流多数据流SIMD——如相联处理机III. 多指令流单数据流MISD——如流水线计算机IV. 多指令流多数据流MIMD——如多处理机冯氏分类:以最大并行度Pm把计算机系统结构分为4类,其中字宽W表示在一个字中同时处理的二进制位数,位宽B表示在一个位片中能同时处理的字数。
I. 字串位串WSBS(serial)(parallel)II. 字并位串WPBSIII. 字串位并WSBPIV. 字并位并WPBPHandler分类:根据并行度和流水线处理的程度将计算机系统结构分成3个层次I. 程序控制部件PCU的个数KII. 算术逻辑部件ALU或处理部件PE的个数DIII. 每个算术逻辑部件包含基本逻辑线路ELC的套数WKuck分类:与Flynn分类法类似,根据指令流、执行流和多倍性来分类。
山东大学计算机系统结构介绍

山东大学计算机系统结构介绍山东大学计算机系统结构介绍一、培养目标1、认真学习马列主义、毛泽东思想和邓小平理论,加强爱国主义、集体主义、社会主义教育,使硕士生具有勇于追求真理和献身社会主义现代化事业的敬业精神。
2、具有坚实的计算机科学与技术的理论基础,系统掌握计算机系统结构并了解有关计算机软件与理论、计算机应用技术方面的专业知识。
具有严谨求实的科学态度、较深的学术修养。
较为熟练地掌握一门外国语。
具有从事科学研究或独立承担专门技术工作的能力,能胜任计算机系统结构的教学、科研、软件系统开发等工作。
3、具有健康的体魄、良好的心理素质。
二、研究方向1、计算机网络与分布式系统研究计算机通信、异构网络集成、网络与分布式操作系统、网络安全、网络计算、分布式数据采集与监控以及基于网络的CIMS、ERP体系结构及应用技术。
2、多媒体计算机系统研究多媒体计算机体系结构与应用;数字、语音、图象与影象的压缩与传输;多媒体信息技术与应用。
3、微机系统开发与应用研究工业控制计算机系统结构与应用工程、多微机系统及分布式多微机控制系统、嵌入式新型微机应用、计算机接口技术、计算机控制技术等。
三、学习年限硕士生学习年限为3年,允许硕士生分阶段完成学业,但在学累计时间不得超过4年。
四、筛选、分流硕士生在第四学期初,结合硕士学位论文开题报告,由院中期考核领导小组对硕士生进行中期考核筛选。
考核内容包括:政治思想表现、课程学习完成情况、科研能力、外国语水平、论文开题报告、健康状况和学科综合考试。
学科综合测试以考核硕士生的全面业务能力为目的.,内容含基础理论知识和实际工作能力两部分。
中期筛选合格者可进入硕士学位论文阶段。
中期筛选不合格者,按《山东大学硕士生学籍管理条例》的有关规定处理。
五、课程设置及学分总学分不少于34学分1.学位公共课4门8学分2.学位基础课2门6学分3.学位专业课2门6学分4.前沿讲座2学分5.选修课不少于5门,不少于12学分。
计算机系统结构前四章知识总结

计算机系统结构前四章知识总结第一章计算机系统结构的基本概念1、层次结构:计算机系统由硬件/器件和软件组成,按功能划分成多级层次结构。
每一级对应一种机器:第0级和第1级是具体实现机器指定功能的中央控制部分;第2级是传统机器语言及其;第3级是操作系统机器;第4级是汇编语言机器;第5级是高级语言机器;第6级是应用语言机器。
2、计算机系统结构:由程序设计者所看到的一个计算机系统的属性,即概念性结构和功能特性。
但按照计算机层次结构,不同程序者所看到的计算机有不同的属性。
主要研究软件、硬件功能分配和对软、硬件界面的确定。
3、计算机组成:计算机组成是计算机系统结构的逻辑实现,包括机器内部的数据流和控制流的组成以及逻辑设计等。
4、计算机实现:是指计算机组成的物理实现。
5、透明性:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,成为透明性现象。
6、由上往下设计(自上而下设计):首先确定用户级虚拟机器的基本特征、数据类型和基本命令等,而后再逐级向下设计,直到由硬件执行或解释那级为止。
7、由下往上设计(自下而上设计):根据硬件技术条件,特别是器件水平,首先把微程序机器级和传统机器研制出来。
在此基础上,再设计操作系统、汇编语言、高级语言等虚拟机器级。
最后设计面向应用的虚拟机器级。
8、系列机:是指在一个厂家内生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器。
9、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的各挡机器,可获得相同的结果,差别只在于不同的运行时间。
10、兼容机:不同公司厂家生产的具有相同系统结构的计算机。
11、模拟:是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。
12、仿真:用程序直接解释另一种机器指令系统的方法。
13、虚拟机和宿主机:在A计算机上要实现B计算机的指令系统,通常采用解释方法来完成,即B机器的每一条指令用一段A机器的指令进行解释执行,如同A机器上也有B机器的指令系统一样,A机器称为宿主机,B机器称为虚拟机。
计算机体系结构基本概念

计算机体系结构基本概念计算机体系结构是指计算机系统中的各个组成部分之间的关系和交互方式。
它是计算机硬件与软件之间的接口,决定了计算机系统的工作方式、性能表现以及可扩展性。
本文将介绍计算机体系结构的基本概念和相关内容。
一、计算机体系结构的概述计算机体系结构是指计算机系统的结构组织,包括硬件和软件。
主要由计算机硬件、指令系统、运算方式和数据流组成。
计算机体系结构的目标是提供高性能、可靠性、可扩展性和高效能的计算机系统。
计算机体系结构的设计通常以指令集架构和微架构为基础。
二、指令集架构指令集架构是计算机体系结构中的一个重要概念。
它定义了计算机系统处理信息的方式。
指令集架构包括计算机的指令集、寄存器、数据类型和地址模式等。
根据指令集的不同,可以将计算机体系结构分为复杂指令集计算机(CISC)和精简指令集计算机(RISC)。
三、微架构微架构是指计算机体系结构的实现方式。
它包括处理器的内部结构、数据通路、控制流和存储相关的电路设计。
微架构的设计影响着计算机系统的性能和功能。
常见的微架构包括超标量、乱序执行和流水线等。
四、存储结构与存储器层级存储结构是指计算机系统中用于存储数据的层次结构。
存储器层级分为寄存器、高速缓存、内存和辅助存储器等。
不同层级的存储器具有不同的特点,如容量、速度和价格等。
存储结构的设计旨在提高计算机系统的访问速度和运行效率。
五、总线结构总线结构是计算机体系结构中连接各个组件的通信系统。
它包括地址总线、数据总线和控制总线等。
总线结构的设计影响着计算机系统的数据传输速度和可扩展性。
六、并行处理与多核技术并行处理是指多个处理器或计算单元同时执行指令,提高计算机系统的运行速度和性能。
多核技术则是将多个处理核心集成到同一个芯片上,实现并行运算。
并行处理和多核技术在高性能计算、科学计算和图像处理等领域得到广泛应用。
七、虚拟化技术虚拟化技术是指通过软件将计算机资源抽象为多个逻辑实体,实现多个操作系统和应用程序的隔离和共享。
《计算机系统结构》教学大纲

《计算机系统结构》教学大纲课程名称:计算机系统结构课程学时:72学时课程类型:专业必修课课程学分:3学分课程考核方式:考试一、课程目标本课程旨在使学生了解计算机系统的基本结构和原理,掌握计算机系统的层次结构、指令系统和中央处理器、主存储器和输入输出系统等方面的知识,培养学生分析和设计计算机系统的能力。
二、课程内容1.计算机系统概论1.1计算机系统的发展历程1.2计算机系统的基本组成部分1.3计算机系统的层次结构2.指令系统2.1指令的分类与特点2.2指令的寻址方式2.3指令的执行过程2.4简单指令系统的设计与实现3.中央处理器3.1数据通路和控制器3.2指令的执行过程3.3中央处理器的设计与实现3.4流水线技术4.主存储器4.1存储器的基本概念4.2存储器的层次结构4.3存储器的组织与管理4.4高速缓存存储器的设计与实现4.5虚拟存储器5.输入输出系统5.1输入输出系统的功能与分类5.2输入输出设备的接口技术5.3中断处理和DMA技术5.4输入输出系统的设计与实现三、教学方法本课程采用理论课和实验相结合的教学方法。
理论课主要讲授计算机系统的基本原理和概念,通过示例和案例分析加深学生的理解。
实验课将对部分计算机系统组成部分进行仿真和实践操作,提高学生的实际操作能力。
四、教材与参考书主教材:《计算机组成与设计》(第5版)- David A. Patterson, John L. Hennessy,机械工业出版社参考书:1. 《计算机系统结构教程》- M. Morris Mano, 赵洁,高等教育出版社2.《计算机体系结构》-王肇国,机械工业出版社五、考核方式与评分标准本课程采取考试的方式进行综合评估。
考试主要包括选择题、填空题、简答题和综合性问题。
评分标准包括学生对计算机系统原理的掌握程度、对计算机系统设计的理解程度以及实验操作能力的表现等。
六、实验内容1.设计一个简单的指令系统,包括指令集、寻址方式和控制流程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机系统结构的研究内容
课程:计算机系统结构
学号:
班级:
姓名:
2013年 9月17日
在目前得到大多数人认可的历史中,人们最早使用的电子数字计算机(通常
称之为计算机)是1945年诞生于美国宾夕法尼亚大学的ENIAC,用于计算火炮
的弹道。1946 年,生于匈牙利的美国数学家冯·诺依曼(John von Neumann, 1903
年12月28日—1957年2月8日)等人在总结当时计算机研究成果的基础上,
明确提出了存储程序计算机(stored-program computer),因此又称存储程序计
算机为冯·诺依曼结构计算机,它奠定 了现代电子数字计算机的结构基础,成
为计算机的标准结构。六十多年来,虽然计算机技术一直处于飞速发展和变革之
中,但是存储程序计算机的概念和基本结构一直沿用至今,没有发生根本性的变
化,是计算机体系结构研究的基础。
计算机系统结构是从外部来研究计算机系统的一门学科,一般说来,凡是计
算机系统的使用者(包括一般用户和系统程序员)所能看到的计算机系统的属性
都是计算机系统结构所要研究的对象。
计算机体系结构主要指计算机的系统化设计和构造,不同的计算机体系结构
适用于不同的需求或应用。现代计算机的两种主要体系结构是CISC 体系和
RISC 体系。其中RISC是近20 年的研究主流。而随着计算机应用的普及,RISC 结
构也出现了许多与以多媒体处理和个人移动计算机为主要内容的应用趋势的不
协调。
当今的计算机体系结构,从传统意义指令界面上来看基本划分成两大类:一
类是CISC 体系结构,如INTEL 的X86芯片,另一类是RISC 体系结构,如SPARC、
MIPS、POWERPC、等。不管是CISC 体系结构还是RISC 体系结构,人们在计算机
体系结构的设计上均追求两方面的目标: 一、设计的计算机体系在面向应用(软
件)描述方面使得自己的指令语义层次比较高,这点CISC 较为明显,因为它有
许多指令可以直接支持高级语言的语义。而RISC 则比较隐蔽,它是靠精简指令
的优化编译(即通过若干条精简指令有机组合)来支持高级语言的语义。 二、
面向应用处理方面 设计的计算机体系在面向应用处理方面,使得自己的指令处
理速度明显提高,进而加速应用处理的速度。这点RISC表现的比较明显,因为
它的指令硬件译码直接实现和采用流水线技术等大大提高了它的处理速度,而在
CISC 中,当初增加硬件的资源支持复杂的高层次的语义的指令,本身就意味着
提高应用的处理速度。
在过去的20 年里,RISC 技术不断发展,逐渐取代C1SC成为工作站和服务
器的主流技术。RISC 计算机以超标量、流水线、乱序执行、预取指令/数据、分
支预测和指令取消等硬件技术和相应的基于编译器的优化技术为核心,利用指令
级并行,在高端工作站和服务器领域占据了绝对的统治地位。
60 多年来,冯·诺伊曼体系结构为世界众多的科学家精心地构造,从而创
造了今天的计算机世界。冯·诺伊曼的伟大发明,其核心有三点:二进制;存储
模型;一个时刻只有一个操作的串行机制。 虽然在计算机界,众多的国家专家
在研究多值理论,但至今几乎没有突破二进制的体系。人们利用了很多存储管理
的软件技术和方法,力图将一维的存储模型改为二维的,但仍然没有逃出冯氏存
储模型和寄存器存储的结构,使得在串行机制上进行新的突破将十分困难。主要
表现在:
因为冯·诺伊曼体系结构本质包括串行性、顺序性的控制机理。对数据相关
和资源的控制和仲裁均是人为决定。因此构成了时间和空间的极大开销,造成冯
氏数据流的拥塞,即为大家熟知的冯·诺伊曼瓶颈问题。
算法的制约 ,冯氏体系的很大贡献在于将所有应用问题建立在四则运算和
逻辑运算的组合算法,并以寄存器为基本模型的存储体系上,但它在基本操作控
制上仍是一种串行机制,不具备构造一个并行算法的基础。在串行的模型上去建
立并行算法,必定会带来本质的困难和效率的损失。
存储模型的制约 ,存储模型在冯·诺伊曼体系结构当中是一种被动式的访
问机制,不能真正体现人类在并行操作行为中经常反映的无破坏性操作和平等交
互赋值运行的需求,因此冯·诺伊曼的存储模型结构仅能在运行时以空间为代价
进行复制或以时间为代价进行选择来替代这种制约。当前,计算机求解一般过程
如图1 所示,而以上三大制约的存在,严重阻碍了计算机的处理速度及信息处
理能力。
计算机在求解时,经过时间往往多于求解时间几个数量级,如果以上三大制
约瓶颈消除了,我们就可用更简捷的方式求解同样规模的问题,也就是在较短时
间或较少空间内求解,最大发挥计算机的潜力。然而,现有计算机体系结构,无
论是CISC 体系还是RISC 体系,它们本质上都属于冯·诺伊曼体系结构范畴,
只是在指令界面的特征上有所区别而已,难以消除以上制约,因此它们的固有缺
陷再所难免。
计算机体系结构的研究重点 :
对并行体系结构的研究 。众所周知,在计算机领域中,并行是实现计算能
力突破的根本手段。由于与并行体系结构相对的是当前使用的串行结构,串行结
构上的效率提升始终不是无限制的,而在嵌入式领域中,专用的并行结构在当前
的技术条件下提升性能和功耗效率已经达到10-1000 倍。所以,现在不少商业
通用处理器在生产上已经倾向于转向多处理器体系结构,或者CMP,或者SMT,
或者二者兼而有之,而不是仅仅只试图提高单一处理器的IPC,这是一个很大的
转变。
然而,并行应用程序的开发是一个缓慢而且费心的过程。只有那些有巨大的
计算需求或者有严格的预算和功耗限制的人才会去开发。虽然目前很多关于并行
编译器和软件开发工具的研究会对设计可用的并行系统有益,但是只有为并行软
件设计出更好的并行系统,才是关键所在。一些早期的研究为新的并行体系结构
作了尝试。原始的数据流结构由于只关注并行而忽略局部性和可预测性而最终导
致失败,但它确实又提供了一个真实的并行结构例子。后来人们又在数据流的思
想上进行了局部性方面的研究,但这方面的工作进行的还远远不够。
像数据流、缓存及前瞻技术的各种组合都值得深入研究。
对功耗敏感的体系结构进行研究。假如计算机性能和容量能够以过去的速度
继续增长,对于功耗敏感的体系结构的研究是十分重要的。对于功耗敏感的体系
结构,静态和动态功耗方面的考虑已成为处理器设计过程中最大的限制。尽管计
算机工作者对于“动态可调整结构”的研究进行了很多的工作,但他们取得的性
能收益正逐渐递减,并且它的复杂性使其难以应用到系统的大部分部件中去。由
于它是以指数级形式上升的,设计先进体系结构和嵌入式应用要时刻考虑功耗问
题,这是很重要的。并且功耗问题和可靠性问题之间的关系非常密切,一定要一
同考虑。
设计能够高效开发显示并行的结构。新结构性能的提升主要来源于开发更
多的并行,因为流水线深度和时钟速率有局限性。显示并行的方法能够用于提高
那些易提取并行性代码的性能。这方面存在很多的挑战,例如:确定片上该集成
何种机制能够提高这部分代码的可扩 展性:确定CMP 中PE 的最佳粒度:要扩
大那些能够有效地运行在并行结构上的代码类型;找到有效的方法来消除引脚接
口的瓶颈。目前引脚接口的瓶颈已经成为影响性能的一大因素,因为引脚数增长
的速度要远远小于片上可集成的晶体管数目增长的速度。
开发隐式并行的大指令窗口的体系结构 。开发单线索代码中的隐式并行方
面的研究也十分重要。目前的体系结构可开发的隐式并行与代码中存在的隐式并
行相差有1-2 个数量级。这方面的研究之所以重要是因为:
第一,绝大多数代码无法显示并行化。
第二,体系结构时钟速率方面的限制也强迫我们必须转向开发更多的并行。 这
些研究领域不能被分割开,在最好的情况下,不是将各种研究机制复杂地组合在
一起,而是应该研究出一种从根本上,简洁的底层机制一次性解决上述问题。