基于32位微处理器系统架构的Cache设计

合集下载

基于FPGA的32位RISC微处理器设计

器数据路径结构，并且对设计中由于增加流水线级数而引入的流水线数据冲突问题给出了完整水线结构的动态分支预测器用以解决微处理器分支冒险问题，其优点在于既能降低微处理器
第２卷第３６期２１年５月０１
数
据
采
集
与
处
理
Ｖｏ．６Ｎｏ３１２．
Ｍａｙ２０１１
Ｊｕｎｌｏｔｑｉｉｉｎ８ｒｃｓｉｇｏｒａｆＤａａＡｃｕｓｔｏＬＰｏｅｓｎ
文章编号：０４９３（０１０ —３７０１０ — ０７２１）３０６ — ７
基于ＦＧＡ的３Ｐ２位ＲＩＣ微处理器设计Ｓ
刘览郑步生施慧彬
（．１南京航空航天大学电子信息工程学院，南京，１０６２０１；
２南京航空航天大学计算机科学与技术学院，京，１０６．南２０１）
的ＣＩ同时又不会使流水线出现局部逻辑拥堵从而降低微处理器的主频。最后给出了设计的综合结果，对该Ｐ，并设计进行了软件仿真和硬件验证。在ＦＧＡ芯片上的运行时钟频率可达１６６８ＭＨｚＰ４．２。关键词：简指令集计算机；处理器；水线；支预测精微流分中图分类号：Ｐ０．Ｔ３２２文献标识码：Ａ

嵌入式系统设计教程(第2版)简答题答案.pdf

第一章嵌入式系统概论1.嵌入式系统的定义是什么？答：以应用为中心，以计算机技术为基础，硬件、软件可裁剪，功能、可靠性、成本、体积、功耗严格要求的专用计算机系统。

2.简述嵌入式系统的主要特点。

答：（1）功耗低、体积小、具有专用性（2）实时性强、系统内核小（3）创新性和高可靠性（4）高效率的设计（5）需要开发环境和调试工具3. 嵌入式系统一般可以应用到那些领域？答：嵌入式系统可以应用在工业控制、交通管理、信息家电、家庭智能管理系统、网络及电子商务、环境监测和机器人等方面。

4. 简述嵌入式系统的发展趋势答：（1）嵌入式应用的开发需要强大的开发工具和操作系统的支持（2）连网成为必然趋势（3）精简系统内核、算法，设备实现小尺寸、微功耗和低成本（4）提供精巧的多媒体人机界面（5）嵌入式软件开发走向标准化5.嵌入式系统基本架构主要包括那几部分？答：嵌入式系统的组织架构是由嵌入式处理器、存储器等硬件、嵌入式系统软件和嵌入式应用软件组成。

嵌入式系统一般由硬件系统和软件系统两大部分组成，其中，硬件系统包括嵌入式处理器、存储器、I/O系统和配置必要的外围接口部件；软件系统包括操作系统和应用软件。

6.嵌入式操作系统按实时性分为几种类型，各自特点是什么？答：（1）具有强实时特点的嵌入式操作系统。

（2）具有弱实时特点的嵌入式操作系统。

（3）没有实时特点的嵌入式操作系统。

第二章嵌入式系统的基础知识1.嵌入式系统体系结构有哪两种基本形式？各自特点是什么？答：冯诺依曼体系和哈佛体系。

冯诺依曼体系结构的特点之一是系统内部的数据与指令都存储在同一存储器中，其二是典型指令的执行周期包含取指令TF，指令译码TD，执行指令TE，存储TS四部分，目前应用的低端嵌入式处理器。

哈佛体系结构的特点是程序存储器与数据存储器分开，提供了较大的数据存储器带宽，适用于数据信号处理及高速数据处理的计算机。

2.在嵌入式系统中采用了哪些先进技术？答：（1）流水线技术（2）超标量执行（3）总线和总线桥3.简述基于ARM架构的总线形式答：ARM架构总线具有支持32位数据传输和32位寻址的能力，通过先进微控制器总线架构AMBA支持将CPU、存储器和外围都制作在同一个系统板中。

32位微处理器

NE：数据异常中断控制位。NE=1表示执行浮点运算指令时发生故障，产生异常中断16。NE=0同MS DOS系统中以前所用的所有协处理器的控制之间保持兼容。
WP：写保护控制位。WP=1表示表示禁止来自管理程序级的写操作写到用户级的页面上。WP=0通过管理进程可以对用户级的只读页面进行写操作。
15
TSD：禁止定时标志。TSD=1且当前特权级不为0时，禁止RDTSC指令（读时间标志计数器指令）且执行这一指令时将产生故障。TSD=0表示在任何特权级上都允许RDTSC指令执行。
DE：调试扩充位。DE=1表示允许调试扩充。DE=0禁止调试扩充。实际上该位控制是否支持I/O断点。
18
1.1 32位微处理器的寄存器组
GDTR和IDTR必须在转入保护模式之前进行初始值设定，这两个寄存器在实地址模式下可以访问。LDTR和TR只能在保护模式下使用，程序只可以访问段选择寄存器，其他的缓冲部分是在任务切换时由LDT描述符和TSS描述符中自动装入的。
10
1.1 32位微处理器的寄存器组
系统地址寄存器和系统段寄存器
任务寄存器TR：是一个16位的寄存器，用来存放任务状态段表（TSS）的段选择字。
11
1.1 32位微处理器的寄存器组
32位微处理器为了控制管理的需要，配备了控制寄存器。在80386 中配备了3个32位的控制寄存器(CR0,CR2,CR3)，发展到Pentium微处理器时，就有5个控制寄存器(CR0~CR4)，不过，控制寄存器中的一些位被重新定义了。这些控制寄存器中保存着全局性的和任务无关的机器状态，供应用程序读取，而写这些控制寄存器的操作被大多数系统禁止。
CR3：页因为Pentium的页目录表是按页排列的。 PWT：页面写贯通。PWT=1表示对当前所访问的页实现通写。PWT=0则实现

【免费下载】分析Cache的运行机制和设计理念

分析Cache的运行机制和设计理念随着双核时代的到来，CPU的Cache越来越受到DIYer的重视。

本文吸收了其它高手发表的文章观点，浅谈一下Cache的运行和设计原理。

1. CPU Cache简介Cache其是就是CPU和内存之间的一个中转站。

由于目前CPU的频率（速度）已经大大超过内存，往往CPU会为了读取或存储数据白白浪费几十个时钟周期。

这造成了巨大的资源浪费。

于是Cache的设计思想被提上日程，几经实验修改后，逐渐形成了我们现在所能够看到的Cache架构。

在现代CPU设计中，设计师们要解决的最主要问题，就是找到一个在CPU和内存之间平衡的均点。

Cache作为CPU--->内存的中转站，在其中发挥了巨大的作用。

CPU在请求数据或指令时，除了常规的在内存中进行查找外，还会在Cache中进行查找。

一旦命中，就可以直接从Cache中读取，节约大量时间。

正因为如此，Cache在现代CPU中显得越来越重要。

2. Cache的实现原理众所周知，Cache属于SRAM（Satic Random Access Memory），它利用晶体管的逻辑开关状态来存取数据。

也正因为如此，SRAM内部的电路构造比起常见的DRAM（Dynamic Random Memory）要复杂得多，导致了成本的巨增。

这也是SRAM不能普及的一个重要原因。

Cache在计算机存储系统中没有编配固定的地址，这样程序员在写程序时就不用考虑指令是运行在内存中还是Cache中，Cache对于计算机上层来说是完全透明的。

CPU在读取数据时，会首先向内存和Cache都发送一个查找指令。

如果所需要的数据在Cache中（命中），则直接从Cache读取数据，以节约时间和资源。

CPU对Cache 的搜索叫做Tag search，即通过Cache中的CAM（Content Addressed Memory）对希望得到的Tag数据进行搜索。

CAM是一种存储芯片，延迟很低，常用于网络设备中用作路由选择。

基于32位超标量处理器的保留站设计

【关键词】保留站；ＡＬＵ；超标量；多发射【中图分类号】ＴＰ３ｌ１【文献标识码】Ａ【文章编号】１００８．１１５１（２０１３）１１－０００３．０２
Ｒｅｓｅｒｖａｔｉｏｎｓｔａｔｉｏｎｄｅｓｉｇｎｂａｓｅｄｏｎ３２ｂｉｔｓｓｕｐｅｒｓｃａｌａｒｐｒｏｃｅｓｓｏｒｓ
翟召岳
（同济大学电子与信息工程学院，上海２０１８０４）
【摘要】该保留站根据超标量处理器中寄存器重命名的原理，将从数据寄存器或ＡＬＵ单元送来的数据临时存储在保留站

的数据位，３两个数据位的数据都准备好－＂时，则发射存储在保留站中的指令给ＡＬＵ单元进行运算。文章的设计中，增加了从
ｂｅｆｏｒｅｔｈｅｎｅｘｔｃｌｏｃｋｃｙｃｌｅ．Ｃｏｍｐａｒｅｄｔｏｒｅａｄｄａｔａｆｒｏｍｈｅｔｒｅｏｒｄｅｉｒｎｇｂｕｆｅｒ（ＲＯＢ），ｔｉｓｈｗｉｌｌｒｅｄｕｃｅｔｈｅｔｉｍｅｈａｔｔｒｅｓｅｖａｒｔｉｏｎｓｔａｔｉｏｎ
总第１５卷１７１期
２０１３年１１月
大众科技
ＰｏｐｕｌａｒＳｃｉｅｎｃｅ＆Ｔｅｃｈｎｏｌｏｇｙ
Ｖ０Ｉ．１５ＮＯ．１１Ｎｏｖｅｍｂｅｒ２０１３

基于MIPS指令集的32位RISC处理器逻辑设计

本科生毕业论文题目：基于MIPS指令集的32位RISC处理器逻辑设计院系：信息科学与技术学院专业：计算机科学与技术学生姓名：***学号：********指导教师：李国桢副教授二〇〇九年四月摘要CPU是计算机系统的核心部件，在各类信息终端中得到了广泛的应用。

处理器的设计及制造技术也是计算机技术的核心之一。

MIPS是世界上很流行的一种RISC 处理器。

MIPS的意思是“无内部互锁流水级的微处理器”（Microprocessor without interlocked piped stages），其机制是尽量利用软件办法避免流水线中的数据相关问题。

本文在详细研究32位MIPS处理器体系结构的基础之上，在Quartus II 7.2环境中，完全依靠自己的研发设计能力，采用硬件描述语言VHDL完成了拥有自主知识产权的基于MIPS指令集的32位RISC处理器的逻辑设计。

共开发出单周期、多周期、五级流水线等3个不同版本的32位RISC处理器，均通过Quartus II进行了时序仿真和性能比较分析。

本文的首先概述了MIPS指令集的重要特征，为讨论CPU的具体设计奠定基础。

本文设计的3个版本的CPU均实现了一个共包含59条指令的32位MIPS指令子集。

本文的主体部分首先详细描述了处理器各个独立功能模块的设计，为后续的整体设计实现提供逻辑功能支持。

随后按照单周期、多周期、流水线的顺序，循序渐进的围绕着指令执行过程中需经历的五个阶段，详细描述了3个版本的处理器中各阶段的逻辑设计。

在完成了各个版本的CPU的整体逻辑设计后，通过Quartus II时序仿真软件在所设计的CPU上运行了测试程序，测试输出波形表明了处理器逻辑设计的正确性。

本文还通过Quartus II 7.2中的Quartus II Time Quest Timing Analyzer软件，基于Altra公司的FPGA器件比较分析了所设计的3个版本CPU的性能。

32位微处理器Pentium

③使用两条指令流水线并行执行指令。 ④内部集成了增强型浮点处理部件FPU。
32位微处理器Pentium
2
⑤对常用指令采用硬件实现。
⑥采用分段和分页两级存储管理机制，使得存储管理可靠快速。
⑦增强了信息传输准确性的检测能力和机器异常事件的处理能力。
⑧为系统的扩展提供了很好的检测和测试能力。
32位微处理器Pentium
32位微处理器Pentium
14
2.RISC
RISC体系的指令特征：精简指令集：包含了简单、基本的指令，透过这些简单、基本的指令，就可以组合成复杂指令。同样长度的指令：每条指令的长度都是相同的，可以在一个单独操作里完成。单机器周期指令：大多数的指令都可以在一个机器周期里完成，并且允许处理器在同一时间内执行一系列的指令。
13
2.CISC和RISC相结合的技术
CISC和RISC的比较
1用微代码。新设计的处理器，只需增加较少的电晶体就可以执行同样的指令集，也可以很快地编写新的指令集程式。庞大的指令集，可以减少编程所需要的代码行数。
CISC体系的优缺点：优点：能够有效缩短新指令的微代码设计时间，允许设计师实现CISC体系机器的向上相容。微程序指令的格式与高阶语言相匹配，因而编译器并不一定要重新编写。缺点：指令集以及晶片的设计比上一代产品更复杂，不同的指令，需要不同的时钟周期来完成，执行较慢的指令，将影响整台机器的执行效率。
7
计算机流水线(Computer Pipeline)
把计算机的指令或操作分解成一系列可独立执行的步，并将多条指令或多个操作的步，按流水线方式重叠执行的一种工作方式。其特点是多条指令或多个操作并行处理，虽然每条指令或每个操作的执行步骤并未减少，但从整体看却加快了指令流进程，提高了整体处理速度。

分析Cache的运行机制和设计理念

分析Cache的运行‎机制和设计理念随着‎双核时代的到来，CP‎U的Cache越来越‎受到DIYer的重视‎。

本文吸收了其它高手‎发表的文章观点，浅谈‎一下Cache的运行‎和设计原理。

1. ‎C PU Cache简‎介Cache其是就‎是CPU和内存之间的‎一个中转站。

由于目前‎C PU的频率（速度）‎已经大大超过内存，往‎往CPU会为了读取或‎存储数据白白浪费几十‎个时钟周期。

这造成了‎巨大的资源浪费。

于是‎C ache的设计思想‎被提上日程，几经实验‎修改后，逐渐形成了我‎们现在所能够看到的C‎a che架构。

在现‎代CPU设计中，设计‎师们要解决的最主要问‎题，就是找到一个在C‎P U和内存之间平衡的‎均点。

Cache作为‎C PU--->内存的‎中转站，在其中发挥了‎巨大的作用。

CPU在‎请求数据或指令时，除‎了常规的在内存中进行‎查找外，还会在Cac‎h e中进行查找。

一旦‎命中，就可以直接从C‎a che中读取，节约‎大量时间。

正因为如此‎，Cache在现代C‎P U中显得越来越重要‎。

2. Cache‎的实现原理众所周知‎，Cache属于SR‎A M（Satic R‎a ndom Acce‎s s Memory）‎，它利用晶体管的逻辑‎开关状态来存取数据。

‎也正因为如此，SRA‎M内部的电路构造比起‎常见的DRAM（Dy‎n amic Rand‎o m Memory）‎要复杂得多，导致了成‎本的巨增。

这也是SR‎A M不能普及的一个重‎要原因。

Cache‎在计算机存储系统中没‎有编配固定的地址，这‎样程序员在写程序时就‎不用考虑指令是运行在‎内存中还是Cache‎中，Cache对于计‎算机上层来说是完全透‎明的。

CPU在读取‎数据时，会首先向内存‎和Cache都发送一‎个查找指令。

如果所需‎要的数据在Cache‎中（命中），则直接从‎C ache读取数据，‎以节约时间和资源。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

由于程序具有局部性特点，所以Ｃａｃｈｅ具有时
作者简介：杨大为（１９７７－），男（回族），辽宁省沈阳市人，高级工程师，主研方向：集成电路设计。收稿日期：２０１５－１０－２９
·６·
微处理机
２０１６
间局部性和空间局部性［２］的特点。时间局部性即如果某个数据被访问，那么在不久的将来它很可能再次被访问。空间局部性即如果某个数据被访问，那么与它相邻的数据很可能很快被访问。每次ｍｉｓｓ都把被访问地址相邻块大小的数据调入到Ｃａｃｈｅ中，能够提高Ｃａｃｈｅ的命中率。图１为ｃａｃｈｅ工作原理图。
第１期
２０１６年２月
微处理机
Ｍ
基于３２位微处理器系统架构的Ｃａｃｈｅ设计
杨大为，王爽，王丹
（中国电子科技集团公司第四十七研究所，沈阳１１００３２）
摘要：近年来随着芯片技术的发展，嵌入式微处理器迎来了新的机遇，广泛应用于通信、多媒体、网络以及娱乐等方面。处理器的处理速度发展迅速，近乎于指数增长，然而内存的处理速度增长缓慢，因此内存的存储速度成为了影响嵌入式微处理器系统性能的主要瓶颈，为了均衡成本、性能和功耗，高速缓存Ｃａｃｈｅ广泛应用于嵌入式系统中。首先介绍Ｃａｃｈｅ的工作原理，其次对直接映射、全关联映射、组相联映射三种策略进行比较分析，然后分析行大小与命中率的关系，最后设计一款基于３２位微处理器系统架构的高速缓存Ｃａｃｈｅ。
关键词：高速缓存；组相联；行填充；命中率；写通；写回ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１００２－２２７９．２０１６．０１．００２中图分类号：ＴＮ４９２文献标识码：Ｂ文章编号：１００２－２２７９（２０１６）０１－０００５－０６
ＤｅｓｉｇｎｏｆＣａｃｈｅＢａｓｅｄｏｎ３２－ＢｉｔＣＰＵＳｙｓｔｅｍＡｒｃｈｉｔｅｃｔｕｒｅ
Ｋｅｙｗｏｒｄｓ：Ｃａｃｈｅ；Ｓｅｔ－ａｓｓｏｃｉａｔｅ；Ｌｉｎｅｆｉｌｌ；Ｈｉｔｒａｔｅ；Ｗｒｉｔｅ－Ｔｈｒｏｕｇｈ；Ｗｒｉｔｅ－Ｂａｃｋ
１引言
近年来，嵌入式微处理器发展迅速，在移动终端、多媒体、网络通信等方面应用尤其广泛，对处理器性能的要求也越来越高。为了弥补内存速度较低的问题，Ｃａｃｈｅ作为连接内核和内存的桥梁，对于提高处理器访问程序和数据的速度［１］，起到了至关重要的作用。
２Ｃａｃｈｅ工作原理
Ｃａｃｈｅ位于主存与内核之间，用于提高存储系统
的性能，提高处理器访问主存的效率。Ｃａｃｈｅ的功能完全用硬件来实现，对于软件人员是完全透明的。如果处理器内核可以在Ｃａｃｈｅ中找到需要的数据，叫做ｈｉｔ（命中）；如果没有找到，叫做ｍｉｓｓ（未命中）。
当Ｃａｃｈｅ命中时，可以很快将所需数据返回给内核；当Ｃａｃｈｅ未命中时，需对Ｃａｃｈｅ进行更新，从主存中重新把需要的数据搬移进Ｃａｃｈｅ，再返回给处理器内核。Ｃａｃｈｅ存储体由块即Ｃａｃｈｅ行（ｌｉｎｅ）构成，块是Ｃａｃｈｅ与主存之间进行数据交换的基本单位。
ＹａｎｇＤａ－ｗｅｉ，ＷａｎｇＳｈｕａｎｇ，ＷａｎｇＤａｎ
（Ｔｈｅ４７ｔｈＲｅｓｅａｒｃｈＩｎｓｔｉｔｕｔｅｏｆＣｈｉｎａＥｌｅｃｔｒｏｎｉｃｓＴｅｃｈｎｏｌｏｇｙＧｒｏｕｐＣｏｒｐｏｒａｔｉｏｎ，Ｓｈｅｎｙａｎｇ１１００３２，Ｃｈｉｎａ）
Ａｂｓｔｒａｃｔ：Ｗｉｔｈｔｈｅｄｅｖｅｌｏｐｍｅｎｔｏｆｔｈｅｃｈｉｐｔｅｃｈｎｏｌｏｇｙ，ｔｈｅｅｍｂｅｄｄｅｄｐｒｏｃｅｓｓｏｒｃａｔｃｈｅｓｔｈｅｎｅｗｏｐｐｏｒｔｕｎｉｔｉｅｓ，ｗｈｉｃｈｉｓｗｉｄｅｌｙｕｓｅｄｉｎｓｕｃｈｆｉｅｌｄｓａｓｃｏｍｍｕｎｉｃａｔｉｏｎ，ｍｕｌｔｉｍｅｄｉａ，ｎｅｔｗｏｒｋｉｎｇ，ｅｎｔｅｒｔａｉｎｍｅｎｔ，ｅｔｃ．Ｔｈｅｐｒｏｃｅｓｓｉｎｇｓｐｅｅｄｏｆｔｈｅｐｒｏｃｅｓｓｏｒｎｅａｒｌｙｉｎｃｒｅａｓｅｓｉｎａｃｅｒｔａｉｎｉｎｄｅｘ，ｗｈｉｌｅｔｈｅｓｌｏｗｅｒｐｒｏｃｅｓｓｉｎｇｓｐｅｅｄｏｆｔｈｅｍｅｍｏｒｙｂｅｃｏｍｅｓｔｈｅｍａｊｏｒｂｏｔｔｌｅｎｅｃｋｏｆＭＣＵｓｙｓｔｅｍｃｈａｒａｃｔｅｒｉｓｔｉｃｓ．Ｃｏｎｓｉｄｅｒｉｎｇｏｆｂａｌａｎｃｉｎｇｃｏｓｔ，ｐｅｒｆｏｒｍａｎｃｅａｎｄｐｏｗｅｒ，ｔｈｅｃａｃｈｅｗｉｄｅｌｙｉｓｕｓｅｄｉｎＭＣＵｓｙｓｔｅｍ．Ｉｎｔｈｉｓｐａｐｅｒ，ｔｈｅｐｒｉｎｃｉｐｌｅｏｆｔｈｅｃａｃｈｅｉｓｆｉｒｓｔｌｙｄｅｓｃｒｉｂｅｄ，ｔｈｅｄｉｒｅｃｔ－ｍａｐｐｉｎｇ，ｆｕｌｌ－ａｓｓｏｃｉａｔｅｃａｃｈｅａｎｄｓｅｔ－ａｓｓｏｃｉａｔｅｃａｃｈｅａｒｅｃｏｍｐａｒｅｄａｓｗｅｌｌ．Ｔｈｅｎ，ｔｈｅｒｅｌａｔｉｏｎｓｈｉｐｂｅｔｗｅｅｎｌｉｎｅｓｉｚｅａｎｄｈｉｔｒａｔｅｉｓａｎａｌｙｚｅｄ．Ｌａｓｔｌｙ，ａｃａｃｈｅ，ｂａｓｅｄｏｎ３２ｂｉｔｓｐｒｏｃｅｓｓｏｒａｒｃｈｉｔｅｃｔｕｒｅ，ｉｓｄｅｓｉｇｎｅｄ．
图１Ｃａｃｈｅ工作原理
３Ｃａｃｈｅ设计
３．１地址映像方式由于内存的空间远远大于Ｃａｃｈｅ，因此内存中的
数据与Ｃａｃｈｅ为多对一的映射关系。设计时采用组相联映像方式［３］。组相联是一种较为通用的映射策略，结合了直接映射访问速度快、实现简单的优点和全相联映射命中率高的优点。首先，将高速缓存分成若干大小相等的块，每一块称作一个ｗａｙ（路）；接着用类似于直接映射方式中的分页方法将主存按照一个ｗａｙ的大小进行分页；然后将高速缓存中的每一个ｗａｙ都分成大小相同的ｌｉｎｅ，包含每一个ｗａｙ中相同位置的ｌｉｎｅ的集合称作一个ｓｅｔ（组）。在进行数据填充时，主存的每一个数据块只能映射到高速缓存中固定的ｓｅｔ上，即在ｓｅｔ之间采用直接映射的方式；但是主存的每一个数据块可以映射到组内的任意一个ｗａｙ上，即在ｓｅｔ内部采用全相联映射方式。３．２Ｃａｃｈｅ种类