冯诺依曼体系计算机存储器体系的瓶颈及发展

冯·诺依曼体系计算机存储器体系的瓶颈及发展

——计算机类王一之摘要：

冯·诺依曼体系结构是目前应用最广泛的计算机体系结构，从1949年的EDVAC （Electronic Discrete variable Automatic Compute电子离散变量计算机）到如今几乎所有的商用计算机，历经半个多世纪，计算机制造技术发生了巨大变化，但冯·诺依曼体系结构仍

然沿用至今，可见其优越性。而其中储存器在该体系中有着至关重要的作用。本文就存储器对于冯·诺依曼体系结构的影响以及该体系的未来发展展开讨论。

0 引言：

美籍匈牙利数学家冯·诺依曼于1946年提出存储程序原理，把程序本身当作数据来对待，程序和该程序处理的数据用同样的方式储存。冯·诺依曼体系结构冯·诺依曼理论的要点是：计算机的数制采用二进制；计算机应该按照程序顺序执行。人们把冯·诺依曼的这个理论称

为冯·诺依曼体系结构。①这个体系中，以二进制表示数据，计算机运把要执行的程序和处理的数据首先存入主存储器（即内存），在执行程序时，按顺序从主存储器中取出指令一条一条地执行。计算机硬件由运算器、控制器、存储器、输入设备和输出设备五大部分组成。其最大特点便是将指令和数据都放在储存器中，那么储存器的作用便尤为重要。随着半导体技术的发展，以其为基础的储存器也随之高速发展，然而计算机其它部件（如运算器）发展的速度已经超过了储存器的发展速度，并且还有着不断拉开差距的趋势，而储存器的发展似乎即将到达瓶颈。现今储存器中信息传输速度的瓶颈成为了该体系计算机的瓶颈。本文将讨论这种瓶颈的原因以及对未来计算机发展的思考。

1 冯·诺依曼体系计算机的储存器体系

冯·诺依曼体系计算机中的储存器最粗略的可分为两种，即只读存储器(Read-only Memory，ROM)和随机存取存储器(Random-access Memory, RAM)。ROM属于非易失性存储器，即使电源断电，ROM中存储的数据也不会消失。而RAM属于易失性存储器,一旦电

源断电，RAM中存储的数据就会随之消失。其中RAM的速度快，但容量小，可跟随处理器实时运算。而ROM速度慢，但容量大，用于大量储存数据。

更加详细地，存储器可分为下图中的七种，由上至下速度更慢，容量更大，价格更便宜。寄存器（Register）是最接近运算器的储存器，由触发器和锁存器及其他门电路构成，其响应速度可达1ns，相应的，容量只有几百比特（如8086寄存器包含14个16位寄存器，仅有224bit的容量）。主存（DRAM）即我们生活中所说的内存，它的作用主要是用来暂时存放需要在CPU中进行运算的数据，以及与各种外部存储设备交换数据。在计算机运行中，CPU把需要运算的数据调到内存中进行运算，当运算完成后再将结果传送出来。其容量有

几GB，响应速度则超出了100ns。为了弥补主存与寄存器间的巨大差异，高速缓冲存储器（Cache）诞生了。它是存在于主存与CPU之间的一级存储器，由静态存储芯片(SRAM)组成，容量比较小但速度比主存高得多，在计算机存储系统的层次结构中，是介于中央处理器和主存储器之间的高速小容量存储器。为了提升效率，现今多数CPU拥有三级高速缓存，

如intel的i7-7700HQ有着256KB L1缓存，1MB L2缓存以及6MB L3缓存）。CPU会首先在L1高速缓存中寻找数据，若未找到，则在L2中寻找，之后在L3中寻找，只有高速缓冲存

储器不含有所需数据时，CPU才会访问主存。这极大的提升了CPU的运行效率。剩余的两种存储器都属于非易失性存储器，本地存储有硬盘，光盘，U盘等，可以储存多达TB级量的数据，速度相比RAM极大的下降，目前最快的固态硬盘也只能达到3-4GB/s的读写速度，

远不及RAM。而网络存储则是近几年才蓬勃发展的一门技术，其被定义为一种特殊的专用数据存储服务器，包括存储器件（例如磁盘阵列、CD/DVD驱动器、磁带驱动器或可移动的存储介质）和内嵌系统软件，可提供跨平台文件共享功能。网络存储通常在一个LAN上占有自己的节点，无需应用服务器的干预，允许用户在网络上存取数据，在这种配置中，网络存储集中管理和处理网络上的所有数据，将负载从应用或企业服务器上卸载下来，有效降低总拥有成本，保护用户投资。②一般来说，这种储存可达PB级（1PB=1024TB 1TB=1024GB），而速度则取决于网络水平。

图1 计算机储存器体系③

2 存储器的发展瓶颈

集成电路IC芯片的技术水平决定了存储器及其他硬件的性能。为了提高硬件的性能，以英特尔公司为代表的芯片制造企业在集成电路生产方面做出了极大的努力，且获得了巨大的技术成果。现在每隔18个月IC的集成度翻一倍，性能也提升一倍，产品价格降低一半，这就是所谓的“摩尔定律”。这个规律已经持续了40多年，估计还将延续若干年。然而，电子产品面临的二个基本限制是客观存在的：光的速度和材料的原子特性。首先，信息传播的速度最终将取决于电子流动的速度，电子信号在元件和导线里流动会产生时间延迟，频率过高会造成信号畸变，所以元件的速度不可能无限的提高直至达到光速。第二，计算机的电子信号存储在以硅晶体材料为代表晶体管上，集成度的提高在于晶体管变小，但是晶体管不可能小于一个硅原子的体积。随着半导体技术逐渐逼近硅工艺尺寸极限，摩尔定律原导出的规律将不再适用。④

2017年10月IBM在京都举行的VLSI echnology and Circuits研讨会上所宣布, IBM与其研究联盟合作伙伴Global Foundries以及三星公司为新型的芯片制造了5纳米(nm)大小的晶体管。研究团队将硅纳米层进行水平堆叠,而非传统的硅半导体行业的垂直堆叠构架,这使得5nm晶体管的工艺有了实现可能。⑤这便是现今正在生产中的最先进的5nm半导体工艺，而7nm工艺已经投入量产。博通公司CTO Henry Samueli曾表示过,15年后摩尔定律就不管用了,2003年他在IEDM国际电子元件会议上又发表了类似的言论,称现有半导体工艺将在5 nm阶段达到极限。⑥因为硅原子半径为0.118nm，5nm工艺中可供使用的硅原子仅有十多个，在这基础上实现具有完整功能的晶体管已经十分困难，缩小制程的难度难以想象。那么对于其前景的不看好也是理所当然。

然而早在2004年，半导体突破微米级不久，便有人指出：“然而,CMOS IC的主流工艺技术或许到了90或60纳米将会面临瓶颈, 而在物理极限与市场应用的双重瓶颈下, 半导体即使进入纳米时代, 也让人很难相信未来能保证半导体业有大幅成长的空间。“⑦同样的，摩尔定律早在上个世纪就有人提出“摩尔定律即将失效”的论断，然而摩尔定律在2018年的今天仍旧有效。这些结论在如今达到看来的确令人发笑，有人认为我们如今对工艺接近极限的看法在未来也会像前人的结论一般被证明错误，如美国能源部(DOE)下属的布鲁克海文国家实验室的科研人员宣布创造了新的世界记录,他们成功制造了尺寸只有1nm的印刷设备,

使用还是电子束印刷工艺而非传统的光刻印刷技术。⑧这一看法当然有道理，但我们永远无法得知未来如何发展，我们必须考虑若这一工艺真的到达极限，计算机该如何继续发展。

3解决方案

3.1新材料半导体工艺

既然硅芯片在5nm制程接近极限，那么用一种新材料取代硅便可能达到更小的制程。碳纳米管和石墨烯便是取代方案之一。零维富勒烯、一维碳纳米管、二维石墨烯都属于碳纳米材料家族，并且彼此之间满足一定条件后可以在形式上转化。碳纳米管是一种具有特殊结构的一维材料，它的径向尺寸可达到纳米级，轴向尺寸为微米级，管的两端一般都封口，因此它有很大的强度，同时巨大的长径比有望使其制作成韧性极好的碳纤维。

碳纳米管和石墨烯在电学和力学等方面有着相似的性质，有较好的导电性、力学性能和导热性，这使碳纳米管复合材料在超级电容器、太阳能电池、显示器、生物检测、燃料电池等方面有着良好的应用前景。此外，掺杂一些改性剂的碳纳米管复合材料也受到人们的广泛关注，例如在石墨烯/碳纳米管复合电极上添加CdTe量子点制作光电开关、掺杂金属颗粒制作场致发射装置。⑨

前文提到的劳伦斯伯克利国家实验室将现有最精尖的晶体管制程从14nm缩减到了1nm，其晶体管就是由碳纳米管掺杂二硫化钼制作而成。但这一技术仅仅处于实验室技术突破的阶段，完全没有商业化量产的能力。但碳和硅一样，在地球上都有着大量的存储，并且碳纳米管相比硅的生产更为环保。那么在将来，它便有可能代替硅，成为主流商用技术，解决如今的困境。

3.2 新架构存储器

传统的非易失性存储器主要包括EPROM、E2PROM、Flash等,若半导体工艺接近极限，这些存储器也将接近极限，然而当前占市场份额最多的Flash存储器存在着一些缺点,由于Flash存储器是利用浮栅中的电荷来存储数据的,因此在读写过程中的高能热电子可能会引起存储器本身的损坏,影响器件可靠性;同时,为避免器件之间的串扰,Flash存储器需要对某一位数据进行擦除时,需要将整个数据块的数据擦除,这大大影响了存储器的速度,而且在65nm节点以下,将很难继续将器件缩小。这些缺点大大限制了Flash存储技术在下一代非易失性存储器中的应用。

因此,相变存储器(phasechangememory,PCM)引起众多研究者的注意。相变存储器是基于Ovshinsky在20世纪60年代末提出的奥弗辛斯基电子效应的存储器,对于某些二元或三元金属硫化物(Ge2Sb2Te5,GST)当施加一个幅值较大宽度较短的脉冲(一般5ns)时,由于焦耳热引起材料熔化,快速淬火后形成无序排列的非晶态,当施加一个幅值较小宽度较长(一般

30ns)的脉冲,退火形成晶态,其中非晶态的GST电导率较小,晶态GST电导率较大,其电导率比值可以达到104,若施加一个小于相变电压的脉冲,那么就可以通过电流的大小识别出逻辑“0”或者逻辑“1”。由于其存储机理不同于Flash存储器的“幸运电子”原理,因此不需要大的电压,可以和现有的MOS器件相匹配,同时由于工艺的进步,其尺寸可以缩小到深亚微米级甚至是纳米级,其功耗也可以减低到很低的水平。⑩

除此之外，铁电随机存取存储器（FeRAM）、磁阻式随机存取存储器（MRAM）、可编程金属化单元（PMC）、电阻式存储器（ReRAM）都是正在研究的新型存储器技术，这些技术有的早在21世纪前就开始了研究，有的则是最近几年开始兴起，其中的某个技术很有可能在未来可以替代如今的闪存。

3.3非冯·诺依曼结构计算机

传统冯·诺依曼计算机体系结构的存储程序方式造成了系统对存储器的依赖，CPU访问存储器的速度制约了系统运行的速度。传统的冯式机缺少模糊性，必须对“0”和“1”有着清晰的划分，这也对半导体工艺产生了要求，而人类生活中许多的数据都是模糊的，用“0”“1”模拟这些数据显然会带来误差及效率的下降。此外，存储器是按地址访问的线性编址, 按顺序排列的地址访问, 利于存储和执行的机器语言指令, 适用于作数值计算。但是高级语言表示的存储器则是一组有名字的变量, 按名字调用变量, 不按地址访问。机器语言同高级语言在语义上存在很大的间隔, 称之为冯·诺依曼语义间隔。消除语义间隔成了计算机发展面临的一大难题。11

存储器的发展导致计算机陷入瓶颈，寻找一种新型的计算机结构便成为计算机发展的解决方案之一。目前非冯·诺依曼结构计算机的研究方向大致有三种：

1光子计算机

光子计算机是一种由光信号进行数字运算、逻辑操作、信息存贮和处理的新型计算机。电子计算机是由电子来存储传递和处理信息，光子计算机则利用激光来传送信号，靠激光束进入反射镜和透镜组成的阵列进行运算处理，它可以对复杂度高、计算量大的任务实现快速的并行处理，这远胜通过电子“0”、“1”状态变化进行的运算。光子计算机在图像处理、目标识别和人工智能等方面发展的潜力巨大。

2量子计算机

量子计算机（quantumcomputer）是一类遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。半导体靠控制集成电路来记录和运算信息，量子电脑则希望控制原子或小分子的状态，记录和运算信息。使用量子门替代晶体管逻辑门的功能。这量子不像半导体只能记录0与1，可以同时表示多种状态，一次运算可以处理多种不同状况，因此，一个40位元的量子计算机，就能解开1024位元的电子计算机花上数十年解决的问题。

3神经计算机

神经计算机是模仿人的大脑判断能力和适应能力，并具有可并行处理多种数据功能的神经网络计算机。神经计算机与电子计算机最大的不同是：电子计算机的存储部件和处理部件是两个不同的部分，而模仿大脑神经记忆的信息存放在神经元上，神经元又是处理信息的基本单元，所以二者是不可分的。

非冯·诺依曼结构计算机的发展虽然总体上缓慢，但不妨碍其成为计算机未来发展的可能。

4结论

随着半导体工业现有技术有着走向瓶颈的可能，冯·诺依曼体系结构计算机受其存储器体系制约，也陷入一定危机。新型的工艺尚未成熟，但具有着代替原存储器甚至原计算机结构的可能。冯·诺依曼体系与现今硅半导体工艺靠着其廉价，稳定的性质，已经为人类创造了巨大的生产力。但在未来，新型的结构与工艺更有可能替代它们而为人类服务。

参考资料：

①百度百科“冯·诺依曼体系结构”

②南京大学吴海军数字电路第十七讲课件

③百度百科“NAS （网络附属存储）”

④中国知网朱伟方育红辜艺冯·诺依曼体系计算机的局限与非冯机发展方向研究

⑤期刊《半导体信息》（Semiconductor Information）2017年05期“IBM正式宣布突破5nm 芯片制造工艺”

⑥期刊《半导体信息》（Semiconductor Information）2013年06期“博通再谈摩尔定律:5nm 是半导体极限看好石墨烯”

⑦电子资讯时报2004-07-26萨支唐“半导体工艺进入纳米时代遭遇基本物理学极限”

⑧期刊军民两用技术与产品（Dual Use Technologies & Products）2017年11期

ISSN：1009-8119 美国实现1nm制程工艺突破半导体工艺极限

⑨中国电子网单片机新闻“5nm是现有芯片工艺的极限？”

⑩中国知网计算机学报（Chinese Journal of Computers）2015年05期ISSN：0254-4164冒伟刘景宁童薇冯丹李铮周文张双武“基于相变存储器的存储技术研究综述”

11期刊科技视界（Science & Technology Vision）2013年36期ISSN：2095-2457

朱伟方育红辜艺“冯·诺依曼体系计算机的局限与非冯机发展方向研究”

计算机体系结构试题及答案版本

计算机体系结构试题及答案 1、计算机高性能发展受益于：(1) 电路技术的发展；(2) 计算机体系结构技术的发展。 2、层次结构：计算机系统可以按语言的功能划分为多级层次结构，每一层以不同的语言为特征。第六级：应用语言虚拟机-> 第五级：高级语言虚拟机-> 第四级：汇编语言虚拟机-> 第三级：操作系统虚拟机->第二级：机器语言(传统机器级) -> 第一级：微程序机器级。 3、计算机体系结构：程序员所看到的计算机的属性，即概括性结构与功能特性。 4、透明性：在计算机技术中，对本来存在的事物或属性，从某一角度来看又好像不存在的概念称为透明性。 5、Amdahl 提出的体系结构是指机器语言级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定，也就是指令集的设计，该界面之上由软件的功能实现，界面之下由硬件和固件的功能来实现。 7、计算机组织是计算机系统的逻辑实现；计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系？答：一种体系结构可以有多种组成，一种组成可以有多种物理实现，体系结构包括对组织与实现的研究。 9、系列机：是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。 10、软件兼容：即同一个软件可以不加修改地运行于系统结构相同的各机器，而且它们所获得的结果一样，差别只在于运行时间的不同。 11、兼容机：不同厂家生产的、具有相同体系结构的计算机。 12、向后兼容是软件兼容的根本特征，也是系列机的根本特征。 13、当今计算机领域市场可划分为：服务器、桌面系统、嵌入式计算三大领域。 14、摩尔定律：集成电路密度大约每两年翻一番。 15、定量分析技术基础（1）性能的评测：（a）响应时间：从事件开始到结束之间的时间；计算机完成某一任务所花费的全部时间。（b）流量：单位时间内所完成的工作量。（c ）假定两台计算机x 、y；x 比y 快意思为：对于给定任务，x 的响应时间比y少。x的性能是y的几倍是指：响应时间x / 响应时间y = n ，响应时间与性能成反比。

计算机体系结构解

————————————————————————————————作者：————————————————————————————————日期：

第一章计算机组成原理本部分要求掌握计算机方面的基础知识，包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂，尤其是有关计算机硬件方面的内容，很细而且灵活性不高，知识量相当大，掌握这部分一定要多下功夫，学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求考试要求： 1 掌握数据表示、算术和逻辑运算； 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示（原码、反码、补码、移码表示，整数和实数的机内表示，精度和溢出）?非数值表示（字符和汉字表示、声音表示、图像表示） ?校验方法和校验码（奇偶校验码、海明校验码、循环冗余校验码） 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2．计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能，以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式（中断系统、DMA、I/O 处理机方式） ?CISC/RISC，流水线操作，多处理机，并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理，多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例： (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

软件体系结构总结

第一章：1、软件体系结构的定义国内普遍看法：体系结构=构件+连接件+约束 2、软件体系结构涉及哪几种结构： 1、模块结构（Module）系统如何被构造为一组代码或数据单元的决策 2、构件和连接件结构（Component-And-Connector，C&C）系统如何被设计为一组具有运行时行为（构件）和交互（连接件）的元素 3、分配结构（Allocation）展示如何将来自于模块结构或C&C结构的单元映射到非软件结构（硬件、开发组和文件系统） 3、视图视点模型视点（View point） ISO/IEC 42010:2007 (IEEE-Std-1471-2000)中规定：视点是一个有关单个视图的规格说明。视图是基于某一视点对整个系统的一种表达。一个视图可由一个或多个架构模型组成架构模型架构意义上的图及其文字描述（如软件架构结构图）视图模型一个视图是关于整个系统某一方面的表达，一个视图模型则是指一组用来构建 4、软件体系结构核心原模型 1、构件是具有某种功能的可复用的软件结构单元，表示了系统中主要的计算元素和数据存储。 2.连接件(Connector)：表示构件之间的交互并实现构件

之间的连接特性：1)方向性2)角色3)激发性4)响应特征第二章 1、软件功能需求、质量属性需求、约束分别对软件架构产生的影响功能性需求：系统必须实现的功能，以及系统在运行时接收外部激励时所做出的行为或响应。质量属性需求：这些需求对功能或整个产品的质量描述。约束：一种零度自由的设计决策，如使用特定的编程语言。质量原意是指好的程度，与目标吻合的程度，在软件工程领域，目标自然就是需求。对任何系统而言，能按照功能需求正确执行应是对其最基本的要求。正确性是指软件按照需求正确执行任务的能力，这无疑是第一重要的软件质量属性。质量属性的优劣程度反映了设计是否成功以及软件系统的整体质量。系统或软件架构的相关视图的集合，这样一组从不同视角表达系统的视图组合在一起构成对系统比较完整的表达

计算机系统结构发展历程及未来展望

计算机系统结构发展历程及未来展望一、计算机体系结构什么是体系结构经典的关于“计算机体系结构（computer Architecture）”的定义是1964年C.M.Amdahl在介绍IBM360系统时提出的，其具体描述为“计算机体系结构是程序员所看到的计算机的属性，即概念性结构与功能特性” 。按照计算机系统的多级层次结构，不同级程序员所看到的计算机具有不同的属性。一般来说，低级机器的属性对于高层机器程序员基本是透明的，通常所说的计算机体系结构主要指机器语言级机器的系统结构。计算机体系结构就是适当地组织在一起的一系列系统元素的集合，这些系统元素互相配合、相互协作，通过对信息的处理而完成预先定义的目标。通常包含的系统元素有：计算机软件、计算机硬件、人员、数据库、文档和过程。其中，软件是程序、数据库和相关文档的集合，用于实现所需要的逻辑方法、过程或控制；硬件是提供计算能力的电子设备和提供外部世界功能的电子机械设备(例如传感器、马达、水泵等)；人员是硬件和软件的用户和操作者；数据库是通过软件访问的大型的、有组织的信息集合；文档是描述系统使用方法的手册、表格、图形及其他描述性信息；过程是一系列步骤，它们定义了每个系统元素的特定使用方法或系统驻留的过程性语境。体系结构原理计算机体系结构解决的是计算机系统在总体上、功能上需要解决的问题，它和计算机组成、计算机实现是不同的概念。一种体系结构可能有多种组成，一种组成也可能有多种物理实现。计算机系统结构的逻辑实现，包括机器内部数据流和控制流的组成以及逻辑设计等。其目标是合理地把各种部件、设备组成计算机，以实现特定的系统结构，同时满足所希望达到的性能价格比。一般而言，计算机组成研究的范围包括：确定数据通路的宽度、确定各种操作对功能部件的共享程度、确定专用的功能部件、确定功能部件的并行度、设计缓冲和排队策略、设计控制机构和确定采用何种可靠技术等。计算机组成的物理实现。包括处理机、主存等部件的物理结构，器件的集成度和速度，器件、模块、插件、底板的划分与连接，专用器件的设计，信号传输技术，电源、冷却及装配等技术以及相关的制造工艺和技术。主要研究内容 1·机内数据表示：硬件能直接辨识和操作的数据类型和格式 2·寻址方式：最小可寻址单位、寻址方式的种类、地址运算 3·寄存器组织：操作寄存器、变址寄存器、控制寄存器及专用寄存器的定义、数量和使用规则 4·指令系统：机器指令的操作类型、格式、指令间排序和控制机构 5·存储系统：最小编址单位、编址方式、主存容量、最大可编址空间 6·中断机构：中断类型、中断级别，以及中断响应方式等

计算机系统结构有详细答案

(仅供参考，不作为考试标准)，选择题分，每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员。意________，应当注提系在计算机统设计时，为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法象联组，相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路令指条下析分后推C) 令指条下行执后推D) 流的用采，时关据数到，中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通，测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机系统结构复习总结

计算机系统结构复习总结一、计算机系统结构概念 1.1 计算机系统结构：程序员所看到的计算机的基本属性，即概念性结构与功能特性。 *注意：对不同层次上的程序员来说，由于使用的程序设计语言不同，可能看到的概念性结构和功能特性会有所不同。 1.2 计算机系统的层次结构现代计算机是一种包括机器硬件、指令系统、系统软件、应用程序和用户接口的集成系统。现代计算机结构图 *注意：计算机结构的层次模型依据计算机语言广义的理解，可将计算机系统看成由多级“虚拟”计算机所组成。

从语言层次上画分可得下图：计算机结构的层次模型 1.3计算机系统结构组成与实现计算机系统结构：是计算机系统的软件与硬件直接的界面计算机组成：是指计算机系统结构的逻辑实现计算机实现：是指计算机组成的物理实现*计算机系统结构、组成与实现三者间的关系：计算机系统结构不同会影响到可用的计算机组成技术不同，而不同的计算机组成又会反过来影响到系统结构的设计。因此，计算机系统结构的设计必须结合应用来考虑，要为软件和算法的实现提供更多更好的硬件支持，同时要考虑可

能采用和准备采用哪些计算机组成技术，不能过多或不合理地限制各种计算机组成、实现技术的采用与发展。计算机组成与计算机实现可以折衷，它主要取决于器件的来源、厂家的技术特长和性能价格比能否优化。应当在当时的器件技术条件下，使价格不增或只增很少的情况下尽可能提高系统的性能。 1.4 计算机系统结构的分类计算机结构分类方式主要有三种：（1）按“流”分类按“流”分类法是Flynn教授在1966年提出的一种分类方法，它是按照计算机中指令流（Instruction Stream）和数据流（Data Stream）的多倍性进行分类。指令流是指机器执行的指令序列，数据流是指指令流调用的数据序列。多倍性是指在计算机中最受限制（瓶颈最严重）的部件上，在同一时间单位中，最多可并行执行的指令条数或处理的数据个数。 *注意：按“流”分类法，即Flynn分类法的逻

计算机体系结构论文

计算机体系结构论文论文题目：计算机系统结构中多处理机技术姓名：XXX 班级：XXX 学号：XXXX

摘要：多处理机是指能同时执行多个进程的计算机系统.多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理，协同求解一个大而复杂的问题来提高速度，或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构，以及现今几种典型的并行计算机体系结构及处理机分配与调度策略。而本篇论文主要根据所阅读的文章进行扩展延伸，主要介绍了多处理机技术，它的总线以及分配调度方面。关键字：多处理机；体系结构；总线；调度引言：微电子技术和封装技术的进步，使得高性能的VLSI微处理器得以大批量生产，性能价格比不断合理，这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个：一个是微电子技术，另一个是计算机体系结构技术。五十年代以来，人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等_系列并行处理技术，提高计算机处理速度，增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容，已成为并行计算机发展中人们最关注的结构。多处理机的介绍：多处理机是指能同时执行多个进程的计算机系统。由于超大规模集成电路(VLSI)技术迅速发展的结果，多处理技术能够充分地发挥高性能的32位微处理机的有效性，用大量低价格的部件配置高性能的计算机结构系统.以典型的

计算机体系结构知识点

目录第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能改进后系统性能改进前 = 总执行时间改进前总执行时间改进后加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成付志强

计算机体系结构参考1

第一题选择题 1．SIMD是指（B） A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2．下列那种存储设备不需要编址？D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3．按照计算机系统层次结构，算术运算、逻辑运算和移位等指令应属于（A）级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4．早期的计算机系统只有定点数据表示，因此硬件结构可以很简单。但是这样的系统有明显的缺点，下面哪一个不是它的缺点：B A．数据表示范围小 B．单个需要的计算时钟周期多 C．编程困难 D．存储单元的利用率很低 7．下面哪个页面替换算法实际上是不能够实现的？D A）随机页面替换算法 B）先进先出替换算法 C）最久没有使用算法 D）最优替换算法

9．指令优化编码方法，就编码的效率来讲，那种方法最好？C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10．在早期冯·诺依曼计算机特征中，机器以（C）为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A．先进先出顺序访问 B．按地址访问 C．无地址访问 D．按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段，每—段分别只有—个部件可供使用，并且执行时间分别为Δt、2Δt和3Δt，连续执行n条指令所需要花费的最短时间约为( C )。（假设“取指令”、“分析”和“执行”可重叠，并假设n足够大） A．6 nΔt B．2 nΔt C．3 nΔt D．nΔt 6、下列计算机不属于RISC计算机的是（C ）。 A．SUN：Ultra SPARC

计算机系统结构学习心得

计算机系统结构学习心得姓名：班级：学号：

在大四上学期课程中对于计算机系统结构的学习已经结束，老师细心的讲解，耐心的辅导，是我从中学到很多的知识。从中我了解到计算机系统结构（Computer Architecture）也称为计算机体系结构，它是由计算机结构外特性，内特性，微外特性组成的。经典的计算机系统结构结构的定义是指计算机系统多级层次结构中机器语言机器级的结构，它是软件和硬件固件的主要交界面，是由机器语言程序、汇编语言源程序和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所应具有的界面结构和功能。计算机系统结构指的是什么? 是一台计算机的外表? 还是是指一台计算机内部的一块块板卡安放结构? 都不是，那么它是什么? 计算机系统结构就是计算机的的机器语言程序员或编译程序编写者所看到的外特性。所谓外特性，就是计算机的概念性结构和功能特性。用一个不恰当的比喻一，比如动物吧，它的"系统结构"是指什么呢? 它的概念性结构和功能特性，就相当于动物的器官组成及其功能特性，如鸡有胃，胃可以消化食物。至于鸡的胃是什么形状的、鸡的胃部由什么组成就不是"系统结构"研究的问题了。系统结构只管到这一层。关于计算机系统的多层次结构，用"人"这种动物的不恰当的例子列表对比如下。计算机系统，人，应用语言级，为人民服务级，高级语言级，读书、学习级，汇编语言级，语言、思维级，操作系统级，生理功能级，传统机器级，人体器官级，微程序机器级，细胞组织级，电子线路级，分子级。传统机器级以上的所有机

器都称为虚拟机，它们是由软件实现的机器。软硬件的。功能在逻辑上是等价的，即绝大多部分硬件的功能都可用软件来实现，反之亦然。计算机系统结构的外特性，一般应包括以下几个方面(这也就是我们要分章学习的几个章节)把这几个方面弄清了，系统结构也就基本明确了：(1)指令系统 (2)数据指令 (3)作数的寻址方式 (4)寄存器的构成定义 (5)中断机构和例外条件 (6)存储体系和管理 (7)I/O结构 (8)机器工作状态定义和切换 (9)信息保护。所以在以后的学习中常回头想想这是系统结构的哪一方面，这对把握全局有好处。这里提一下计算机系统结构的内部特性，计算机系统结构的内特性就是将那些外特性加以"逻辑实现"的基本属性。所谓"逻辑实现"就是在逻辑上如何实现这种功能，比如"上帝"给鸡设计了一个一定大小的胃，这个胃的功能是消化食物，这就是鸡系统的某一外特性，那怎么消化呢，就要通过鸡喙吃进食物和砂石,再通过胃的蠕动、依靠砂石的研磨来消化食物，这里的吃和蠕动等操作就是内特性。还有一个就是计算机实现，也就是计算机组成的物理实现。它主要着眼于器件技术和微组装技术。拿上面的例子来说，这个胃由哪些组织组成几条肌肉和神经来促使它运动就是"鸡实现"。据此我们可以分清计算机系统的外特性、内特性以及物理实现之间的关系。在所有系统结构的特性中，指令系统的外特性是最关键的。因此，计算机系统结构有时就简称为指令集系统结构。我们这门课注重学习的是计算机的系统结构，传统的讲，就是处在硬件和软件之间介面的描述，

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。

解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。

计算机体系结构试题汇总

计算机系统结构姓名：学号：一、简答题（每小题10分，共20分） 1．简述使用物理地址进行DMA存在的问题，及其解决办法。 2．从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较（列表）。二、（60分）现有如下表达式： Y＝a ×X 其中：X和Y是两个有64个元素的32位的整数的向量，a为32位的整数。假设在存储器中，X和Y的起始地址分别为1000和5000，a的起始地址为6000。 1．请写出实现该表达式的MIPS代码。 2．假设指令的平均执行时钟周期数为5，计算机的主频为500 MHz，请计算上述MIPS 代码（非流水化实现）的执行时间。 3．将上述MIPS代码在MIPS流水线上（有正常的定向路径、分支指令在译码段被解析出来）执行，请以最快执行方式调度该MIPS指令序列。注意：可以改变操作数，但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图，计算调度前和调度后的MIPS代码序列执行所需的时钟周期数，以及调度前后的MIPS流水线执行的加速比。 4．根据3的结果说明流水线相关对CPU性能的影响。三、（20分）请分析I/O对于性能的影响有多大？假设： 1．I/O操作按照页面方式进行，每页大小为16 KB，Cache块大小为64 B；且对应新页的地址不在Cache中；而CPU不访问新调入页面中的任何数据。 2．Cache中95%被替换的块将再次被读取，并引起一次失效；Cache使用写回方法，平均50%的块被修改过；I/O系统缓冲能够存储一个完整的Cache块。 3．访问或失效在所有Cache块中均匀分布；在CPU和I/O之间，没有其他访问Cache 的干扰；无I/O时，每1百万个时钟周期中，有15,000次失效；失效开销是30个时钟周期。如果替换块被修改过，则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机体系结构知识点汇总

第一章计算机体系结构的基本概念 1.计算机系统结构的经典定义程序员所看到的计算机属性，即概念性结构与功能特性。 2.透明性在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。 3.系列机由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。 4.常见的计算机系统结构分类法有两种：Flynn分类法、冯氏分类法Flynn分类法把计算机系统的结构分为4类：单指令流单数据流(SISD) 单指令流多数据流(SIMD) 多指令流单数据流(MISD) 多指令流多数据流(MIMD) 5. 改进后程序的总执行时间

系统加速比为改进前与改进后总执行时间之比 6.CPI（Cycles Per Instruction）:每条指令执行的平均时钟周期数 CPI = 执行程序所需的时钟周期数／IC 7.存储程序原理的基本点：指令驱动 8.冯·诺依曼结构的主要特点 1.以运算器为中心。 2.在存储器中，指令和数据同等对待。指令和数据一样可以进行运算，即由指令组成的程序是可以修改的。 3.存储器是按地址访问、按顺序线性编址的一维结构，每个单元的位数是固定的。 4.指令的执行是顺序的 5.指令由操作码和地址码组成。 6.指令和数据均以二进制编码表示，采用二进制运算。 9.软件的可移植性一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。差别只是执行时间的不同。我们称这两台计算机是软件兼容的。实现可移植性的常用方法:采用系列机、模拟与仿真、统一高级语言。软件兼容：向上（下）兼容：按某档机器编制的程序，不加修改就能运行于比它高（低）档的机器。向前（后）兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改地就能运行于在它之前（后）投入市场的机器。向后兼容是系列机的根本特征。兼容机：由不同公司厂家生产的具有相同系统结构的计算机。

计算机体系结构重点总结

1、、Amdahl定律:某部件应用越频繁,当提高该部件性能时,整机性能也提高得越多;整机得性能加速不可能大于在原机器中除该部件外所有其它部件运行时间得百分比得倒数1/(1-F)。 F定义为采用先进高速部件得那部分程序在未采用先进高速部件得计算机上运行得时间占总时间得百分比,则F= 采用高速部件得任务在老计算机上运行得时间整个任务在老计算机上运行得时间同时将S定义为先进高速部件与老部件得性能,则 S= 老部件完成该功能得时间先进高速部件完成该功能得时间而采用了高速部件后整机性能提高比,即 Speedup = T old = 1 T new (1－F)+F/S 某种硬件增强技术,可使执行速度提高10倍,在采用增强技术得计算机上测出其使用率就是50%。根据Amdahl定律计算: ⑴采用增强技术后计算机性能加速比就是多少？ ⑵未采用增强技术运行得部件在不采用增强技术得机器上运行时得时间比例。 2、(1)90/10局部性规则:程序花费90%得执行时间运行指令集中10%得指令代码。这就就是说在指令集中所有得指令只有10%指令就是常用得,而另外90%指令得使用率合起来只有10%。 (2)时间局部性:如果某一参数被引用,那它不久将再次被引用。这里指出了程序执行时在时间上得局部性 (3)空间局部性:如果某一参数被引用,那它附近得参数不久也将被引用。指出程序执行时地址空间上得局部性。 3、计算机得性能就是指在计算机上完成用户得应用任务所需得时间长短。完成同样任务所需得时间越短,计算机得性能越好。(考判断) 4、衡量计算机性能得参数:响应时间就是指计算机系统完成某一任务(程序)所花费得时间。 5、如果用速度来评价性能,我们称“高”为性能好;如果用响应时间来评价性能,我们称“短”为性能好。(考判断) 6、计算机整机性能分成两部分:一就是CPU执行程序得时间,二就是等待时间。提高计算机性能就就是提高CPU性能与减少等待时间。 cpu性能因子CPI:每条指令得平均时钟周期数(clock cycles per instruction), CPI=CPU花费得时钟数/CPU执行得总指令数 CPUtime =指令数× CPI ×时钟周期==I× CPI ×τ 8、CPU性能因子:(1)时钟频率(f)(2)CPI(3)指令数(I) (考填空) CPU性能 =1/CPU time= f / ( I×CPI ) 计算机性能常用指标:(1)MIPS(million instruction per second)MIPS得意思就是每秒钟执行得百万条指令数。 MIPS= 指令数/ ( 执行时间×106 ) = 时钟频率 / ( CPI×106 ) =f / ( CPI×106 ) MFLOPS(million floating-point operation per second)每秒钟执行得百万个浮点操作数MFLOPS=浮点操作数 / 执行时间×106 10、工作负载基准程序(workload benchmark): (1)实际程序(2)核心基准程序(3)简单基准程序(4)合成基准程序 (考填空) 11、基准程序得一般设计原则: (1)具有代表性,反映用户得实际应用。 (2)不能对基准程序进行优化。 (3)复现性。能重复测试,其环境相同,结果能重复出现。(4)可移植性。系统相关性要小。 (5)紧凑性。基准程序不宜太庞大。 (6)成本-效率要高。 12、测量结果得统计与比较----性能报告:SPEC(system performance evaluation cooperative)基准程序 13、指令设计时主要以下几个方面来考虑: (考填空) ⑴应用范围;⑵指令得使用概率;⑶常用指令分析;⑷特殊指令设计。

计算机系统结构论文

计算机系统结构论文计算机系统结构中多处理机技术摘要：多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理，协同求解一个大而复杂的问题来提高速度，或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构。关键词：多处理机；体系结构；总线微电子技术和封装技术的进步，使得高性能的VLSI 微处理器得以大批量生产，性能价格比不断合理，这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个：一是微电子技术，另一个是计算机体系结构技术。五十年代以来，人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等一系列并行处理技术，提高计算机处理速度，增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容，已成为并行计算机发展中人们最关注的结构。

1 微处理器的发展 20 世纪80 年代中期，RISC 精简指令集计算机，用20%指令的组合实现了CISC 计算机指令系统不常用的80%指令的功能。在提高性能方面，RISC 采用了超级流水线、超级标量、超长指令字并行处理结构；多级指令Cache；编译优化等技术，充分利用RISC 的内部资源，发挥其内部操作的并行性，从而提高流水线的执行效率。20 世纪80 年代后期，RISC 处理机的性能指标几乎以每年翻一番的速度发展，它对于提高计算机系统的性能和应用水平起着巨大的作用。目前，由Intel 和HP 两家公司联合开发的基于IA—64 架构的Merced 芯片，并由其共同定义的显式并行指令计算技术EPIC(Explicitly Parallel Instruction Computing )，将为微处理器技术的发展带来突破性进展。EPIC 技术主要指编译器在微处理器执行指令之前就对整个程序的代码作出优化安排，编译器分析指令间的依赖关系，将没有依赖关系的指令(最多3 个)组成一“组”，由Merced内置的执行单元读入被分成组的指令群并执行。从理论上讲，EPIC 可以并行执行3 倍于执行单元数的指令。64 位体系结构的Merced 芯片还采用了指令预测、数据预装等技术，可以显著地减少实际执行程序的长度，同时增强语句执行的并行性，经过代码的重组，程序的执行时间比基于传统体系结构

-计算机系统结构(有详细答案)

(仅供参考，不作为考试标准)，选择题(30分，每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员在计算机系统设计时，为了提高系统性能，应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法与全相联映象相比，组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令流水操作中，遇到数据相关时，采用的解决办法有________。 A)用优化编译器检测，通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络虫蚀寻径以流水方式在各寻径器是顺序传送的是________。授课：XXX

计算机系统结构复习(个人总结)

第一章：计算机系统的层次结构：（按照计算机语言从低级到高级）微程序机器，传统机器语言机器，操作系统机器，汇编语言机器，高级语言机器和应用语言机器。计算机系统结构：传统机器程序员所看到的计算机属性，即概念属性和功能特性。计算机组成：计算机系统结构的逻辑实现，包括物理机器级中的数据流和控制流的组成和逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机，主存等物理结构及整机装配技术。（器件技术和微组装技术）透明性：在计算机技术中，把这种本来存在的事物和属性，但从某种角度看又好像不存在的概念称为透明性。 Flynn分类法是依旧：指令流和数据流的多倍性进行分类的。冯氏分类发：是按照计算机系统的最大并行度来分类的。计算机系统设计的定量原则： 1，以经常性事件为重点：在计算机系统中对于经常发生的事件，赋予它优先的处理权和系统使用权。 2，Amdahl定律：加快某部件的执行速度所获得的系统性能的加速比。S n=1 1?F e+F e e （注： Fe=可改进时间比例，Se=性能提高倍数） 3，CPU性能公式：执行一个程序所需要的CPU时间=IC*CPI*时钟周期时间（CPI指令平均时钟周期=执行程序所需要的时钟周期数/所执行的指令数）CPI=（CPI i?IC i IC ） n i=1 4，程序的局部属性：程序执行时，所访问的存储器地址不是随机分布的，而是相对簇聚的。包括时间局部性和空间局部性。计算机系统设计者的主要任务： 1，确定用户对计算机系统的功能，价格和性能的要求。 2，软硬件功能的分配。 3，设计出生命周期长的系统结构。软件兼容：一台计算机上的程序不加修改或只需要少量的修改就可以由一台计算机一直到另一台计算机上运行，差别只是执行时间的不同从中间开始设计：

计算机体系结构名词解释总汇

集中式共享存储器结构（centralized shared memory architecture）：这类多处理机在目前至多有几十个处理器，可通过大容量的cache和总线互连使各处理器共享一个单独的集中式存储器。物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址，每个处理器可以访问任何一个其他的局部存储器。这类机器的结构被称为分布式共享存储器（DSM，distributed shared memory）或可缩放共享存储器（SSM，scalable shared memory）体系结构。整个地址空间由多个独立的地址空间构成，它们在逻辑上也是独立的，远程的处理器不能对其直接寻址。在这种机器的不同处理器中，相同的物理地址指向不同存储器的不同单元，每一个处理器、存储器模块实际上是一个单独的计算机，因而这种机器也称为多计算机（multicomputers）。通讯延迟：发送开销＋跨越时间＋传输延迟＋接收开销。迁移是把远程的共享数据项的拷贝放在一个本处理器局部的cache中使用，从而可降低对远程共享数据的访问延迟。复制是把多个处理器需要同时读取的共享数据项的拷贝放在各自局部cache中使用，复制不仅降低了访存的延迟，也减少了访问共享数据时的产生的冲突。目录（directory）：物理存储器中用来保存共享数据块的状态及相关信息的数据结构。监听（snooping）：每个cache除了包含物理存储器中块的数据拷贝外，也保存着各个块的共享状态信息。Cache通常连在共享存储器的总线上，各个cache控制器通过监听总线来判断它们是否有总线请求的数据块。在一个处理器写某个数据项之前保证它对此数据项有唯一的访问权，对应这种方法的协议称为写作废（write invalidate）协议。cache块拥有唯一的拷贝的处理器通常称为这个cache 块的拥有者（ower）。处理器的写操作使其成为对应cache块的拥有者。原子性（atomic），即操作运行过程中不能被打断，例如将写失效的检测、申请总线连接、接收响应作为一个单独的原子操作。基于目录的相关性协议称为全映射（full map）。原子交换（atomic change）：将一个存储单元的值和一个寄存器的值进行交换。建立一个锁，锁值为0表示开锁，为1表示上锁。旋转锁是指处理器环绕一个锁不停地旋转而试图获得该锁。栅栏（barrier）同步：是一个同步操作，它强制所有到达该栅栏的进程进行等待，直到全部的进程到达栅栏，然后释放全部的进程，从而形成同步。组合树是多个请求在局部结合起来形成树的一种分级结构，它降低冲突的原因是将大冲突化解成为并行的多个小冲突。排队记录等待的进程，当锁释放时送出一个已确定的等待进程，这种机制称为排队锁（queuing lock）。一个处理器对变量的写和另一个处理器对该变量的访问（读或写）由一对同步操作分开，其中一个在写操作后执行，另一个在别的处理机访问之前执行，则称数据访问有序。无同步操作排序变量可能提前被刷新，这种情况称为数据竞争（data race），从而对于同步的程序可称之为无数据竞争（data－race－free）。称与解锁相对应的同步操作为释放（release）与加锁相对应的则称为获取（acquire）。防护（fence）是计算过程中的固定点，用来保证无读或写穿过防护点。预取能返回最新数据值，并且保证对数据实际的存储器访问返回的是最新的数据项，则被称为非绑定的（nonbinding）。互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络，这些结点可能是处理器、存储模块或其它设备，它们通过互连网络进行信息交换。静态网络由点和点直接相连而成，这种连接方式在程序执行过程中不会改变。动态网络是用开关通道实现的，它可动态地改变结构，使其与用户程序中通信要求匹配。

计算机系统结构知识点复习考点归纳总结

0.从（使用语言的）角度可以将系统看成是按（功能）划分的多个机器级组成的层次结构 1、从计算机系统执行程序的角度看，并行性等级由低到高分为（指令内部）、（指令之间）、（任务或进程之间）和（作业或程序之间）四级。 2、从计算机系统中处理数据的并行性看，并行性等级从低到高分为（位串字串）、（位并字串）、（位串字并）和（全并行）。 3、存储器操作并行的典型例子是（并行存储器系统和相联处理机），处理机操作步骤并行的典型例子是（流水线处理机），处理机操作并行的典型例子是（阵列处理机），指令、任务、作业并行的典型例子是（多处理机）。 4、开发并行的途径有（时间重叠），资源重复和资源共享。 5、计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是（微程序机器级，传统机器语言机器级，汇编语言机器级）。 6、对系统程序员透明的应当是（CACHE存储器、系列机各档不同的数据通路宽度、指令缓冲寄存器） 7、对机器语言程序员透明的是（主存地址寄存器） 8、计算机系统结构包括（机器工作状态、信息保护、数据表示） 9、对汇编语言程序员透明的是（I/O方式中的DMA访问） 10、属计算机系统结构考虑的是（主存容量和编址方式） 11、从计算机系统结构上讲，机器语言程序员所看到的机器属性是（编程要用到的硬件组织） 12、计算机组成设计考虑（专用部件设置、控制机构的组成、缓冲技术） 13、在多用户机器上，应用程序员能使用的指令是（“执行”指令、“访管”指令、“测试与置定”指令） 14、软硬件功能是等效的，提高硬件功能的比例会（提高解题速度、提高硬件成本、减少所需存储器用量） 15、下列说法中正确的是（软件设计费用比软件重复生产费用高、硬件功能只需实现一次，而软件功能可能要多次重复实现、硬件的生产用比软件的生产费用高） 16、在计算机系统设计中，比较好的方法是（从中间开始向上、向下设计）。 17、推出系列机的新机器，不能更改的是（原有指令的寻址方式和操作码）。 18、不同系列的机器之间，实现软件移植的途径包括（用统一的高级语言、模拟、仿真）。 19、在操作系统机器级，一般用（机器语言）程序（解释）作业控制语句。 20、高级语言程序经（编译程序）的（翻译）成汇编语言程序。 21、传统机器语言机器级，是用（微指令程序）来（解释）机器指令。 22、汇编语言程序经（汇编程序）的（解释）成机器语言程序。 23、微指令由（硬件）直接执行。 24、系列机软件必须保证（向后兼容），一般应做到（向上兼容） 25、在计算机系统的层次结构中，机器被定义为（能存储和执行相应语言程序的算法和数据结构）的集合体 26、优化性能价格比指（在某种价格情况下尽量提高性能）或（在满足性能前提下尽量降低价格）。 27、目前，M0由（硬件）实现，M1用（固件）实现，M2至M5大多用（软件）实现。 28、系列机中（中档机）的性能价格比通常比（低档机、高档机）的要高 29、（计算机组成）着眼于机器级内各事件的排序方式，（计算机体系结构）着眼于对传统机器级界面的确定，（计算机组成）着眼于机器内部各部件的功能，（计算机实现）着眼于微程序设计。 30、计算机系统结构也称（计算机体系结构），指的是（传统机器级）的系统结构。 31、用微程序直接解释另一种机器指令系统的方法称为（仿真），用机器语言解释