数据库系统工程师考试知识点精讲(高速缓冲存储器)

合集下载

第四章-存储器04-高速缓冲存储器

Cache 000 001 010 011 100 101 110 111 000 001 010 011 100 101 110 111
调入
4.1、地址映象——直接映像
例2：设一个Cache中有8块，访问主存进行读操作的块地址依次为： 10110、11010、10110、11010、10000、00100、10010，求每次访问时Cache的内容。
硬件完成功能：访存地址转成 Cache地址辅助存储器
Cache 的全部功能都是由硬件完成的，对程序员来说是透明的。
4.1、地址映象
映象：其物理意义就是位置的对应关系，将主存地址变成Cache地址。
常见的映象方式主要有三种： 1）直接映象 2）全相联映象 3）组相联映象
CPU Cache 字数据总线字
2位主存区号标记 00 主存块号比较 3位区内块号 100 Cache块号未命中访问内存 000 001 010 011 100 101 110 111 块内地址块内地址
Cache
000 001 010 011 100 101 110 111
调入
块表 000 001 010 011 100 101 110 111
4、高速缓冲存储器（Cache）
考研试题精选：
假设：CPU执行某段程序时，共访问Cache 3800 次，访问主存200 次，已知Cache存取周期为50ns，主存存取周期为250ns。
求：Cache—主存系统的平均存取时间和效率。解：系统命中率 h = 3800 / 3800 + 200 = 0.95
Cache
000 001 010 011 100 101 110 111 调入
块表 000 10 001 010 11 011 100 101 110 10 111

虚拟存储和高速缓冲存储器

cache中央处理器cache外存主存中央处理器cachecache中央处理器cachecache中央处理器cachecache中央处理器cachecache中央处理器cache主存cache中央处理器cache外存主存cache中央处理器cachecache中央处理器cache主存中央处理器cachecache中央处理器cachecache中央处理器cachecache中央处理器cachecache中央处理器cache主存cache中央处理器cache外存主存cache中央处理器cachecache外存主存cachecachecachecache主存cache外存主存cachecache主存cachecachecachecache主存cache外存主存cache中央处理器cache二级缓存二级缓存是为了协调一级缓存与内存之间的速度
在实际应用中，虚拟文件系统存储方案以非对称式拓扑结构为表现形式。
第十一页，共49页
虚拟存储的特点：
虚拟存储提供了一个大容量存储系统集中管理的手段，由网络中的一个环节（如服务器）进行统一管理，避免了由于存储设备扩充所带来的管理方面的麻烦。
虚拟存储对于视频网络系统最有价值的特点是：可以大大提高存储系统整体访问带宽。
第十八页，共49页
三级缓存的性能影响
❖ 在游戏方面，提升三级缓存的容量对游戏的性能影响很大，如果是网吧机提升三级缓存的容量，会有显著的性能提升的。
❖ 对PC机来说，三级缓存其实只是做了个辅助的作用，除了服务器，其实对大多数家庭机没什么用的，对于家庭机内存是最重要的。
第十九页，共49页
高速存储器的工作原理图：
地址总线
LRU管理逻辑
CAM
相联存储图表
主
CPU

高速缓冲存储器

3.2.1 中央处理器
计算机导论(2014)
3.2.1 中央处理器
主要性能指标
兼容性(Compatibility)：运行在旧款CPU上的程序不用修改，就能直接在新款的CPU上运行，称为向下兼容。
字长(Word Size)：CPU一次能够处理的数据的二进制位数，字长越长，运算速度就越快。主频(Master Frequency)：主频是指CPU的时钟频率，它决定了CPU每秒钟可以有多少个指令周期，可以执行多少条指令。主频越高，CPU的运算速度也就越快。
3.1 计算机的基本组成及工作原理
计算机的工作原理
计算机导论(2014)
3.2 计算机硬件子系统
中央处理器（主要包含运算器和控制器）内存储器外存储器输入设备输出设备主板总线
计算机导论(2014)
CPU的两大体系: RISC(Reduced Instruction Set Computer)，基本组成其包括ARM/MIPS/PowerPC处理器。运算器 CISC(Complex Instruction Set Computer)，控制器其包括x86架构各种CPU，包括寄存器 AMD,INTEL,CYRIX, VIA公司生产的各种 CPU。芯片化的 CPU称为微处理器
计算机导论(2014)
分类：按存储介质半导体存储器：用半导体器件组成的存储器。磁表面存储器：用磁性材料做成的存储器。按存储方式随机存储器：任何存储单元的内容都能被随机存取，且存取时间和存储单元的物理位置顺序存储器：只能按某种顺序来存取，存取时间和存储单元的物理位置有关。按读写功能存储器：存放数据和程序。只读存储器(ROM)：存储的内容是固定不变的，只能读出而不能写入的半导体存储器。随机读写存储器(RAM)：既能读出又能写入的各存储器之间的关系输入设备：将数据和程序输入计算机。半导体存储器。按信息保存性输出设备：将运算结果输出。非永久记忆的存储器：断电后信息即消失的存储器。永久记忆性存储器：断电后仍能保存信息的存储器。按用途根据存储器在计算机系统中所起的作用，可分为主存储器、辅助存储器、高速缓冲存储储器等。为了解决对存储器要求容量大，速度快，成本低三者之间的矛盾，通常采用多级存储器即使用高速缓冲存储器、主存储器和外存储器。存储系统的分级结构用途特点高速缓冲存储器Cache 高速存取指令和数据存取速度快，但存储容量小主存储器内存存放计算机运行期间的大量程序和数据存取速度较快，存储容量不大外存储器外存存放系统程序和大型数据文件及数据库存储容量大，位成本低

Lecture 14 存储器-高速缓冲存储器

高速缓存的理论依据

程序访问的局部性时间局部性：如果一个存储单元被访问，则可能该单元会很快被再次访问，这称为程序访问的时间局部性。空间局部性：在一个较短的时间间隔内，CPU对局部范围的存储器地址频繁访问，而对此地址范围之外的地址访问很少；设立高速缓存的理论依据是程序访问的局部性

逐行相加
逐列相加
代码1多次运行的平均时间为0.25ms 代码2多次运行的平均时间为0.35ms
例
对于双精度数的矩阵，处理器为拥有1MB二级Cache的 MIPS R4000，在机器SG Challeage L上，CPU运行时间为77.2s。如果循环次序改为k,j,i，执行时间为44.2s。利用一种称为分块的技术进一步优化编译，大大提高调整缓存的命中率，可以使运行时间少于10s! for(i=0;i!=500;i++) 面对CPU与存储器越来 for(j=0;j!=500;j++) 越大的速度差异，一种 for(k=0;k!=500;k++) 可能的途径是寻求软件 x[i][j]=x[i][j]+y[i][k]*z[k][j]; 帮助。使用大量的程序
00组
01组
1111
(1) 直接映射
块号
0001
组标记
00 00 01 10 11
0000 0001 0010 0011 0100 0101 0110 0111源自00组01组1111
分析：CPU访问主存第1块的过程
(1) 直接映射
块号
0001
组标记
00 01 01 10 11
0000 0001 0010 0011 0100 0101 0110 0111

第4章半导体存储器-4.2高速缓冲存储器Cache

3、存储器管理
虚拟存储器：虚拟存储器是由主存－辅存物理结构和负责信息块划分以及主存－辅存之间信息调度的存储器管理部件(MMU)的辅助硬件及操作系统的存储器管理软件所组成的存储系统。管理方式：页式虚拟存储器、段式虚拟存储器、段页式虚拟存储器虚拟地址：能访问虚拟空间的指令地址码称为虚拟地址。物理地址：实际的主存地址。
地址对准实际上是保证数据的对准。未对准的数据要在CPU内部经过字节交换，使其在数据线上对准存储体。非对准的字要两个总线周期，对相邻的两个字进行两次操作，在CPU内部经过字节交换，最终完成读写。
№ 13
2、替换策略
先进先出FIFO：选择最早装入快存的页作为被替换的页；最近最少使用策略LRU：选择CPU最近最少访问的页作为被替换的页
AD0 L H L H
读写的字节两个字节（AD15—AD0）高字节（AD15—AD8）低字节（AD7—AD0）不读写
如何连接，满足读写一个字节的需要，又能达到读一个字（低 № 10 位字节在偶地址）？
� � � �
1、存储器的奇偶分体偶地址（从0开始）单元组成偶存储体，奇地址单元组成奇存储体。偶体、奇体共同组成16位存储器系统。 16位读写是从偶体中选中1个单元、再从地址加1的奇体中选中1个单元同时读写。
虚地址
…
段式虚拟存储器的映像
3）段页式虚拟存储器
3、段页式虚拟存储器虚地址
基号
段号
段表 0
页号
页表
页内地址实地址
段基址表 0 L N-1
段表段表长度基址 ‥ 1 L-1
M
装入段长位
页表下址
实页装入号位
访问方式

第8章高速缓冲存储器和虚拟存储器

页式存储管理的特点

优点：只要有空白页新页就可以调入内存只有程序的最后一页可能有零头浪费缺点：页不是逻辑上的独立程序实体处理、保护和共享信息不如段式方便
直接映像

多路组相联映射

全相联映射和多路组相联映射的失效处理

18
练习
1. 设主存容量1MB，Cache容量64KB，Cache每块为8KB，现采用直接相联映像，请回答下列问题：（1）Cache有多少块？主存有多少块？每块有多少字节？（2）写出主存的地址以及结构， Cache的标记有几位？（3）主存地址02530H的字应存放在Cache的第几块？ 2. 一个多路组相连映像Cache由64个存储块组成，共分为 4组。主存含有4096个块，每块由128个字节组成。访问内存为字节地址。（1）写出Cache每组有多少块？（2）写出主存的地址格式（3）主存地址48AB9H映射到Cache的哪一块？哪个组？

直接写回（Write Through）：简便易行，数据一致性容易保证，系统运行效率不高，Cache对写操作没有提高性能。拖后写回（Write Back）：一直拖到有另外设备要读内容已过时的主存单元时，则首先停止读，待写回后再启动暂停的读操作。
问题：如何知道访问过时的内存单元？回答：通过监视地址总线，记下内存单元地址用于比较。控
29
页式存储管理
页式存储管理是把虚拟空间和主存空间都分成大小相同的页（为2的整数幂个字），并以页为单位进行虚存与主存间的信息交换。此时虚存逻辑地址和主存物理地址分别被分为“虚存页号＋页内地址”和“主存页号＋页内地址”，虚、实二页号会不同，但使用相同的页内地址。
与段式存储管理不一样，页不是程序本身的结构特性，而是从管理的角度人为划分的结果。设臵和管理好页表是页式存储管理的关键技术。

缓冲存储器

简介
当前随着半导体器件集成度的进一步提高，缓冲存储器已放入到CPU中，其工作速度接近CPU的速度，从而能组成两级以上的Cache系统。
工作原理
缓冲存储器工作原理要求它尽量保存最新数据。当一个新的主存块需要复制到Cache，而允许存放此块的行位置都被其他主存块占满时，就要产生替换。替换问题与Cache的组织方式紧密相关。对直接映射的Cache来说，因一个主存块只有一个特定的行位置可存放，所以问题解决起来很简单，只要把此特定位置上的原主存块换出 Cache即可。对全相联和组联Cache来说，就要从允许存放新主存块的若干特定行中选取一行换出。
算法
如何选取就涉及到替换策略，又称替换算法。通过硬件实现的常用算法主要有以下3种。
最不经常使用（LFU）算法
LFU算法认为应将一段时间内被访问次数最少的那行数据换出。为此，每行设置一个计数器。新行建立后从0 开始计数，每访问一次，被访问行的计数器增1。当需要替换时，对这些特定行的计数值进行比较，将计数值最小的行换出，同时将这些特定行的计数器都清零。这种算法将计数周期限定在对这些特定行两次替换之间的间隔内，因而不能严格反映近期访问情况。
缓冲存储器
一种高速缓冲存储器
01 简介Байду номын сангаас
03 算法
目录
02 工作原理 04 应用
缓冲存储器（Cache）是一种高速缓冲存储器，是为了解决CPU和主存之间速度不匹配而采用的一项重要技术。 Cache是介于CPU和主存之间的小容量存储器，但存取速度比主存快。主存容量配置几百MB的情况下，Cache的典型值是几百KB。Cache能高速地向CPU提供指令和数据，从而加快了程序的执行速度。从功能上看，它是主存的缓冲存储器，由高速的SRAM组成。为追求高速，包括管理在内的全部功能均由硬件实现，因而对程序员是透明的。

第7讲：高速缓冲存储器(6学时)-2018

4
1.1 存储访问的局部性原理程序示例
存储空间（M=3，N=4）
程序A 程序B
访问内存特点分析
程序A：sum被连读多次访问，数组a 的访问具有空间连续性；
程序B ： sum被连读多次访问，数组a 的访问不具备空间连续性；
5
1.1 存储访问的局部性原理
局部性原理（principle of locality）：大量典型程序的运行情况分析结果表明，无论是存取指令或存取数据，所访问的存储单元都趋于聚集在一个较小的连续存储区域中。
Block
……
v Tag Data Block M -1
Cache
Block 0 Block 1
……
Block N -1 Main Memory
17
2.1 Cache与主存之间的映射
如何进行映射?
把主存划分成大小相等的主存块（Block）
Cache中存放一个主存块的对应单位称为Cache块（Block）
路地址比较能同时进行（一般与组结合），路数即指一组内的块数。命中率（hit rate）：目标数据在Cache中的存储访问的比例。缺失率（miss rate）：目标数据不在Cache中的存储访问的比例。
13
1.2 高速缓冲存储器(Cache)的原理
Cache结构示意
分S组每组E行每数据块包含B个字节
BLOCK 00000
BLOCK 00001
BLOCK 00002
Cache
FFFFEFH FFFFF0H
FFFFFFH
BLOCK FFFFF
内存
21
2.1 Cache与主存之间的映射—全相联
全相联Cache组织同时与所有Tag

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数据库系统工程师 http://www.educity.cn/rk/dbms/index.html
数据库系统工程师考试知识点精讲（高速缓冲存储器）

数据库系统工程师为软考中一门中级资格考试，以下是小编整理的一些数据
库系统工程师考试知识点精讲，供大家参考学习。
高速缓冲存储器
Cache的功能是提高CPU数据输入输出的速率，突破所谓的“冯•
诺依曼瓶颈”，即CPU与存储系统间数据传送带宽限制。高速存储器能以极高
的速率进行数据的访问，但因其价格高昂，如果计算机的内存完全由这种高速存
储器组成则会大大增加计算机的成本。通常在CPU和内存之间设置小容量的高
速存储器Cache。Cache容量小但速度快，内存速度较低但容量大，通过优化
调度算法，系统的性能会大大改善，仿佛其存储系统容量与内存相当而访问速度
近似Cache。
1．Cache基本原理
使用Cache改善系统性能的依据是程序的局部性原理。依据局部性原理，
把内存中访问概率高的内容存放在Cache中，当CPU需要读取数据时首先在
Cache中查找是否有所需内容，如果有，则直接从Cache中读取；若没有,再从
内存中读取该数据，然后同时送往CPU和Cache。如果CPU需要访问的内容
大多都能在Cache中找到（称为访问命中），则可以大大提高系统性能。
如果以h代表对Cache的访问命中率(“1-h”称为失效率，或者称为未命
中率)，t1表示Cache的周期时间，t2表示内存的周期时间，以读操作为例，
使用“Cache+主存储器”的系统的平均周期为t3，则：

计算机硬件基础
数据库系统工程师 http://www.educity.cn/rk/dbms/index.html
系统的平均存储周期与命中率有很密切的关系，命中率的提高即使很小也能

导致性能上的较大改善。
例如：设某计算机主存的读/写时间为100ns，有一个指令和数据合一的
Cache，已知该Cache的读/写时间为10ns，取指令的命中率为98%，取数的
命中率为95%。在执行某类程序时，约有1/5指令需要存/取一个操作数。假设
指令流水线在任何时候都不阻塞，则设置Cache后，每条指令的平均访存时间
约为：
(2%×100ns+98%×10ns)+1/5×(5%×100ns+95%×10ns)=14.7ns
2．映射机制
当CPU发出访存请求后，存储器地址先被送到Cache控制器以确定所需数
据是否已在Cache中，若命中则直接对Cache进行访问。这个过程称为Cache
的地址映射（映像）。在Cache的地址映射中，主存和Cache将均分成容量相
同的块（页）。常见的映射方法有直接映射、全相联映射和组相联映射。
（1）直接映射。直接映射方式以随机存取存储器作为Cache存储器，硬件
电路较简单。直接映射是一种多对一的映射关系，但一个主存块只能够复制到
Cache的一个特定位置上去。Cache的块号i和主存的块号j有函数关系：
i=j%m（其中m为Cache总块数）
例如，某Cache容量为16KB（即可用14位表示），每块的大小为16B（即
可用4位表示），则说明其可分为1024块（可用10位表示）。则主存地址的
最低4位为Cache的块内地址，然后接下来的中间10位为Cache块号。如果
内存地址为1234E8F8H的话（一共32位），那么最后4位就是1000（对应
十六进制数的最后一位“8”），而中间10位，则应从E8F（111010001111）
数据库系统工程师 http://www.educity.cn/rk/dbms/index.html
中获取，得到1010001111。因此，内存地址为1234E8F8H的单元装入的Cache

地址为10100011111000。
直接映射方式的优点是比较容易实现，缺点是不够灵活，有可能使Cache
的存储空间得不到充分利用。例如，假设Cache有8块，则主存的第1块与第
17块同时复制到Cache的第1页，即使Cache其他页面空闲，也有一个主存
页不能写入Cache。
（2）全相联映射。全相联映射使用相联存储器组成的Cache存储器。在全
相联映射方式中，主存的每一页可以映射到Cache的任一页。如果淘汰Cache
中某一页的内容，则可调入任一主存页的内容，因而较直接映射方式灵活。
在全相联映射方式中，主存地址不能直接提取Cache页号，而是需要将主
存页标记与Cache各页的标记逐个比较，直到找到标记符合的页（访问Cache
命中），或者全部比较完后仍无符合的标记（访问Cache失败）。因此这种映
射方式速度很慢，失掉了高速缓存的作用，这是全相联映射方式的最大缺点。如
果让主存页标记与各Cache标记同时比较，则成本又太高。全相联映射方式因
比较器电路难于设计和实现，只适用于小容量Cache。
（3）组相联映射。组相联映射是直接映射和全相联映射的折中方案。它将
Cache中的块再分成组，通过直接映射方式决定组号，通过全相联映射的方式
决定Cache中的块号。在组相联映射方式中，主存中一个组内的块数与Cache
的分组数相同。
例如，容量为64块的Cache采用组相联方式映像，每块大小为128个字，
每4块为一组。若主存容量为4096块，且以字编址，那么主存地址应该为多少
位？主存区号（组号）为多少位？这样的题目，首先根据主存与Cache块的容
数据库系统工程师 http://www.educity.cn/rk/dbms/index.html
量需一致，既每个内存块的大小也是128个字，因此共有1284096

个字（219个字），即主存地址需要19位。因为Cache的容量为64块，所以
内存需要分为4096/64个组，即26，因此主存组号需6位。
在组相联映射中，由于Cache中每组有若干可供选择的页，因而它在映射
定位方面较直接映射方式灵活；每组页数有限，因此付出的代价不是很大，可以
根据设计目标选择组内页数。
3．淘汰算法
当Cache产生了一次访问未命中之后，相应的数据应同时读入CPU和
Cache。但是当Cache已存满数据后，新数据必须淘汰Cache中的某些旧数据。
最常用的淘汰算法有随机淘汰法、先进先出法（FIFO）和近期最少使用淘汰法
（LRU）。其中平均命中率最高的是LRU算法。
4．写操作
因为需要保证缓存在Cache中的数据与内存中的内容一致，相对读操作而
言，Cache的写操作比较复杂，常用的有以下几种方法。
（1）写直达（writethrough）。当要写Cache时，数据同时写回内存，
有时也称为写通。
（2）写回（writeback）。CPU修改Cache的某一行后，相应的数据并不
立即写入内存单元，而是当该行从Cache中被淘汰时，才把数据写回到内存中。
（3）标记法。对Cache中的每一个数据设置一个有效位。当数据进入Cache
后，有效位置1；而当CPU要对该数据进行修改时，数据只需写入内存并同时
将该有效位清0。当要从Cache中读取数据时需要测试其有效位：若为l则直接
从Cache中取数，否则从内存中取数。