第三章存储器
数字逻辑与计算机组成原理:第三章 存储器系统(1)

A3 0
字线
地0 A2 0 址
译
A1
0码 器
A0 0
15
读 / 写选通
… …
…
0,0 … 0,7
16×8矩阵
15,0 … 15,7
0
…
7 位线
读/写控制电路
D0
… D7
(2) 重合法(双译码方式)
0 A4
0,00
…
0 A3
阵
A2
译
0码
31,0
…
A1
器 X 31
0 A0
… …
或低表示存储的是1或0。 T5和T6是两个门控管,读写操作时,两管需导通。
六管存储单元
保持
字驱动线处于低电位时,T5、T6 截止, 切断了两根位线与触发器之间的 联系。
六管存储单元
单译码方式
读出时: 字线接通 1)位线1和位线2上加高电平; 2)若存储元原存0,A点为低电
平,B点为高电平,位线2无电 流,读出0。
3)若存储元原存1,A点为高电 平,B点为低电平,位线2有电
流,读出1。
静态 RAM 基本电路的 读 操作(双译码方式)
位线A1
A T1 ~ T4 B
位线2
T5
行地址选择
T6
行选
T5、T6 开
列选
T7、T8 开
T7
T8
读选择有效
列地址选择 写放大器
写放大器
VA
T6
读放
读放
DOUT
T8 DOUT
DIN
1.主存与CPU的连接
是由总线支持的; 总线包括数据总线、地址总线和控制总线; CPU通过使用MAR(存储器地址寄存器)和MDR(存储
计算机组成原理第三章 第2讲 SRAM存储器

3.2 SRAM存储器
主存(内部存储器)是半导体存储器。根
据信息存储的机理不同可以分为两类:
相对而言 静态读写存储器(SRAM):
• 存取速度快,一般用作Cache
动态读写存储器(DRAM):
• 存储容量大,一般用作主存
3.2 SRAM存储器
一、基本的静态存储元阵列 1、存储元:
例1:图3.5(a)是SRAM的写入时序图。 其中R/W是读/写命令控制线,当R/W 线为低电平时,存储器按给定地址把 数据线上的数据写入存储器。请指出 图3.5(a)写入时序中的错误,并画出正 确的写入时序图。
3.2 SRAM存储器
3.2 SRAM存储器
写使能信号
3.2 SRAM存储器
三、存储器的读写周期 读周期
读出时间Taq 读周期时间Trc 写周期时间Twc 写时间Twd 读周期时间Trc=写时间Twd
写周期
存取周期
3.2 SRAM存储器
片选 读使能
3.2 SRAM存储器
片选 写使能
3.2 SRAM存储器
教材P69
用锁存器实现。 需要加电,无限期保持0或者1状态。
3.2 SRAM存储器
回顾译码器
可参考CAI动画
63
3.2 SRAM存储器
2、三组信号线
地址线:A0-A5,可指定26=64个存储单元 数据线:I/O0,I/O1 ,I/O2 ,I/O3
• 行线,列线 • 存储器的字长4位
控制线:读或写 存储位元、存储单元、字存储单元、最小寻址 单位、最小编址单位。
写入数据:
第三章 微机存储器

联机外存储器 脱机外存储器
两大类——内存、外存
• 内存——存放当前运行的程序和数据。
– 特点:快,容量小,随机存取,CPU可直接访问。 – 通常由半导体存储器构成 – RAM、ROM
• 外存——存放非当前使用的程序和数据。
– 特点:慢,容量大,顺序存取/块存取。需调入内存后 CPU才能访问。 – 通常由磁、光存储器构成,也可以由半导体存储器构成 – 磁盘、磁带、CD-ROM、DVD-ROM、固态盘
16
读0过程
17
写入数据1的过程
18
写0过程
19
2、存储器芯片的基本组成
20
三、存储器与系统的连接
1、数据线、地址线和控制线的连接
存储芯片通过地址线、数据线和控制线与外部连接。 地址线是单向输入的,其数目与芯片容量有关。CPU发 出的地址信号,部分使芯片的片选端有效,称为“片 选”,部分再选中芯片内部的存储单元实现“字选”。 如容量为1024×4时,地址线有10根。
8
2.常用半导体存储器的特点
(1)静态存储器SRAM
用双稳态触发器存储信息。 速度快(<5ns),不需刷新,外围电路比较简单, 但集成度低(存储容量小,约1Mbit/片),功耗 大。 在PC机中,SRAM被广泛地用作高速缓冲存储Cache。 典型SRAM芯片:CMOS RAM芯片6264(8K*8)
14
二、存储器芯片的基本组成
1、基本存储电路 静态存储器SRAM存储原理:双稳态触发器保存信 息。 T1 通,T2 止存0 ;T1 止,T2 通存1 ; 保持信息时,不送地址信号; 读出:送地址,发读命令; 写入:送地址,送数据发写命令。
白中英计算机组成原理第3章_内部存储器

存储器带宽
每秒从存储器进出信息的最大数量; 单位为位/秒或者字节/秒。
2014年12月14日星期日 12
求存储器带宽的例子
设某存储系统的存取周期为500ns,每个存取周期可 访问16位,则该存储器的带宽是多少? 存储带宽= 每周期的信息量 / 周期时长 = 16位/(500 ╳10-9)秒 = 3.2 ╳ 107 位/秒 = 32 ╳ 106 位/秒 = 32M位/秒
第三章 内部存储器
目录
3.1 存储器概述
3.2 SRAM存储器 3.3 DRAM存储器 3.4 只读存储器和闪速存储器 3.5 并行存储器 3.6 CACHE存储器
(理解)
(理解) (掌握) (理解) (理解) (掌握)
2014年12月14日星期日
2
学习要求
理解存储系统的基本概念 熟悉主存的主要技术指标 掌握主存储器与CPU的连接方法
半导体存储器:用半导体器件(MOS管)组成的存储器; 软盘
磁表面存储器:用磁性材料(磁化作用)做成的存储器; 光盘存储器:用光介质(光学性质)构成的存储器; 光盘 按存取方式分 随机存储器:存取时间和存储单元的物理位臵无关; 顺序存储器:存取时间和存储单元的物理位臵有关;
半导体 存储器 磁带 硬盘 磁带
数据总线 MDR
•••
驱动器
•••
译码器
控制电路
•••
MAR
地址总线
2014年12月14日星期日
读
写
23
32K×8位的SRAM逻辑结构图
X方向: 8根地址线 输出选中 256行
动画演示: 3-3.swf
三维存储 阵列结构
输入输出时 分别打开不 同的缓冲器
读写、 选通 控制
计算机组成原理:第三章 主存储器和存储系统1

芯片
芯片地址
片选信号
片选逻辑
1K
A9…A0
CS0
A11 A10
1KA9…A0Fra bibliotekCS1
A11 A10
1K
A9…A0
CS2
A11 A10
1K
A9…A0
CS3
A11A10
(6)连接方式:扩展位数,扩展单元数,连接控制线
A11
A10
A9
A8
片选
译码
CS0
CS1
CS2
RAM; 8K×8位RAM; 2K×8位ROM; 4K×8位ROM; 8K×8位ROM及74LS138译码器和
各种门电路,画出CPU与存储器的连接图,要求最小4K为系统程序区,相邻8K为用户程序
区。
(1)写出对应的二进制地址码
(2)确定芯片的数量及类型
(3)分配地址线
(4)确定片选信号
2. P86 — 4.6
A14
A15
MREQ
A0
…
…
A13
A12
A11
A10
A9
G1
G2A
G2B
C
B
A
&
Y4
…
PD/Progr
2K ×8位
ROM
…
…
…
D7
D4
D3
D0
Y5
WE
CPU与存储芯片的连接图
…
1K ×4位
RAM
…
…
1K ×4位
RAM
例2: 设CPU有16根地址线,8根数据线,并用MREQ作访存控制信号(低电平有效),用WE
计算机组成原理试读稿_第3章存储器系统的层次结构_(初稿)【王道考研系列】2012计算机考研

大纲内容
(待补充)
已考真题分布
(待补充)
3.1 存储器的分类 3.1.1 考点精析
1. 存储器的分类(★)
存储器种类繁多,可以从不同的角度对存储器进行分类。 (1)按在计算机中的作用(层次)分类 1)主存储器:简称主存,又称内存储器(内存),用来存放计算机运行期间所需的大 量程序和数据,CPU可以直接随机地对其进行访问,也可以和高速缓冲存储器(Cache)以 及辅助存储器交换数据。其特点是容量较小、存取速度较快、每位价格较高。 2)辅助存储器:简称辅存,又称外存储器(外存),是主存储器的后援存储器,用来 存放当前暂时不用的程序和数据,以及一些需要永久性保存的信息,它不能与 CPU 直接交 换信息。其特点是容量极大、存取速度较慢、单位成本低。 3)高速缓冲存储器:简称Cache,位于主存和CPU之间,用来存放正在执行的程序段和 数据,以便CPU能高速地使用它们。Cache的存取速度可以与CPU的速度相匹配,但存储容量 小、价格高。目前的高档微机通常将它们或它们的一部分制作在CPU芯片中。 (2)按存储介质分类 按存储介质可分为磁表面存储器(磁盘、磁带)、半导体存储器(MOS 型存储器、双 极型存储器)和光存储器。 (3)按存取方式分类 1)随机存储器(RAM):存储器的任何一个存储单元的内容都可以随机存取,而且存 取时间与存储单元的物理位置无关。其优点是读写方便、使用灵活,主要用做主存或高速缓 冲存储器。 2)只读存储器(ROM):存储器的内容只能随机读出而不能写入。信息一旦写入存储 器就固定不变了,即使断电,内容也不会丢失。因此,通常用它存放固定不变的程序、常数 和汉字字库,甚至用于操作系统的固化。它与随机存储器可共同作为主存的一部分,统一 构成主存的地址域。
第三章 内存储器-教案

第三章内存储器一、教学目的:1、了解内存储器的概念和发展、结构和性能指标。
2、掌握内存条的区分、选购和测试。
二、教学重点、难点:掌握内存条的区分、选购和性能测试。
三、教具使用:计算机一台,多媒体幻灯片演示,内存条若干四、教学方法:分析法和问题讨论法,引导学生分析内存条的结构、选购方法,以及如何测试内存条。
五、教学过程:导入:由人的大脑、书、纸张对比引入到内存储器的知识学习。
幻灯片或板书课题:第三章内存储器一、基础知识-认识内存储器提问:仓库对现代化工厂中的流水线的影响?学生看书、思考并回答;教师归纳总结并由仓库的作用引入内存条的工作原理,并进一步介绍内存条的的组成、分类及主要性能参数。
1. 内存条的工作原理(作用):中转数据2. 内存条的组成:内存条主要由印刷电路板、内存颗粒、SPD芯片、金手指等组成。
3. 内存条的分类和区别讲解主流三种内存条引脚和定位键(缺口)4. 内存的封装和技术指标二、制定选购方案-选购原则及分析提问:计算机运行需要什么类型、多大内存才能够发挥最佳性能?学生思考看书进行回答;教师归纳、引导学生根据计算机实际使用条件确定计算机内存的各项参数,进行进一步的分析和选购。
1. 确定内存容量影响内存容量的要素:操作系统、使用模式、硬件设备和用户类型2. 确定内存带宽应保证内存带宽与主板和CPU前端总线一致3. 确定内存种类和条数根据主板内存插槽(定位键)或说明书确定所需内存条种类;应确保使用的内存条数最少,避免多条内存之间出现兼容性故障,方便内存扩充三、实战:内存储器的选购提问:如何购买内存条?教师引导学生思考,并利用幻灯片介绍各种内存颗粒和内存条的鉴别与选择。
1. 如何识别内存利用幻灯片介绍主要的内存厂商和内存颗粒以及内存编号识别2. 内存质量鉴别方法主要使用观察法查看内存条的质量小结:1. 内存条的组成和颗粒封装2. 内存条的选购原则作业:1. 复习本章知识2. 预习下一章知识3. 完成本章书后的习题和实践。
第三章 AT89S52单片机存储器结构PPT课件

见书P39 表3.2.5
11
3.3 外部存储器及其访问
一、外部程序存储器及访问 1、访问外部ROM所用控制信号
ALE:低8位地址锁存信号; PSEN:读取控制信号; EA:片内、外ROM访问控制信号,EA=1,访问片内;
EA=0,访问片外。 2、访问片外ROM的过程
首先通过地址总线给出地址信号,选中程序存储器该地 址的存储单元,然后由PSEN发出读选通信号,在读选通信号 的控制作用下,将存储在被选中存储单元中的指令代码读出 并送至数据总线,单片机通过对数据总线的访问读取已送至 数据总线的指令代码,完成一次对外部程序存储器的访问1过2
3.2 存储器结构
10
3.2 存储器结构
三、特殊功能寄存器SFR AT89S52有128B特殊功能寄存器区,其特殊功能寄
存器有32个,比AT89C51增加11个,比AT89S51增加6 个。
特殊功能寄存器虽与片内RAM高128B地址完全重叠, 但在物理上是完全独立的。可以用寻址方式区分:直 接寻址访问的是SFR; 间接寻址访问,访问的是数据 RAM。
14
3.3 外部存储器及其访问
一、外部程序存储器及访问 5、访问外部程序存储器的时序
15
3.3 外部存储器及其访问
一、外部程序存储器及访问 5、访问外部程序存储器的时序
16
3.3 外部存储器及其访问
二、外部数据存储器及访问 1、扩展外部数据存储器的方法
17
3.3 外部存储器及其访问
二、外部数据存储器及访问 2、访问外部数据存储器的时序
5
3.2 存储器结构
一、程序存储器
1)程序存储器结构
8KB Flash存储器,地址0000H~1FFFH,可外扩展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
特点:
–
容易实现,命中时间短 – 无需考虑淘汰(替换)问题 – 但不够灵活,Cache存储空间得不到充分利用,命中率 低 例如,需将主存第0块与第16块同时复制到Cache中时, 由于它们都只能复制到Cache第0槽,即使Cache其它 槽空闲,也有一个主存块不能写入Cache。这样就会产 生频繁的 Cache装入。
0000 0010 0010 0000 1100B第1块群中的0001块(即第17块)中第12个单元!
假定主存地址为32位, 按字节编址 假定Cache是块大小为1B的直接映射Cache Cache Index: The lower N bits of the memory address Cache Tag: The upper (32 - N) bits of the memory address 31 N Cache Tag Example: 0x50 Cache Index Valid Bit Cache “tag”
–
Write Back 和Write Through
Cache失靶处理 Cache性能评估
Direct Mapped Cache(直接映射Cache) 把主存的每一块映射到一个固定的Cache槽(行) 也称模映射(Module Mapping) 映射关系为: Cache槽号=主存块号 mod Cache槽数 举例:4=100 mod 16 (假定Cache共有16槽) (说明:主存第100块应映射到Cache的第4槽中。)
替换算法-最近最少用
是一种堆栈算法,它的命中率随组的增大而提高。 当分块局部化范围(即:某段时间集中访问的存储区) 超过了Cache存储容量时,命中率变得很低。极端情 况下,假设地址流是1,2,3,4,1 2,3,4,1,……,而Cache 每组只有3槽,那么,不管是FIFO,还是LRU算法, 其命中率都为0。这种现象称为颠簸(Thrashing / PingPong)。 该算法具体实现时,并不是通过移动块来实现的, 而是通过给每槽设定一个计数器,根据计数值来记 录这些主存块的使用情况。这个计数值称为LRU位。 具体实现
全相联映射Cache组织示意图
各主存块可装到Cache任一槽Slot(行Line或项Entry)中。称为全映射或全相联映射
假定: 数据在主存和Cache之间块传送 的单位为512字。 Cache大小:213字=8K字=16槽 x 512字/ 槽 主存大小: 220字=1024K字 =2048块 x 512字/ 块 Cache标记(tag)指出对应槽取 自哪个主存块 主存tag指出对应地址位于哪个 主存块 两个标记相等时,说明要找的 地址在对应槽中。比较所有标 记都不等,则缺失。 举例:假定Cache为空,如何对 01E0CH单元进行访问? 0000 0001 1110 0000 1100B 是第15块中的第12个单元!可映射到任意cache槽中
读/写的数据
MDR
主存地址
数据线 (64位) 地 址 寄 存 器 地 址 译 码 器
MM
00000 00001 00010 00011 00100 · · · · · · · 01101001 10101010
MAR CPU
地址线 (36位)
记 忆 单 元 存储
单元 地址
存 储 内 容
· · · · ·
组相联映射的Cache组织图
假定:
数据在主存和Cache之间按 块传送的单位为512字。 Cache大小:213字=8K字=16 槽 x 512字/ 槽=8组x2槽/ 组 x512字/ 槽 主存大小: 220字=1024K字 =2048块 x 512字/ 块
Cache标记(tag)指出对应 槽取自哪个主存组群 主存tag指出对应地址位于 哪个主存组群中 两个标记相等时,说明要 找的地址在对应槽中 举例:假定Cache为空,如何 对0120CH单元进行访问?
替换算法-其他算法
最不经常用(LFU)算法:
替换掉Cache中引用次数最少的块。LFU也用 与每个槽相关的计数器来实现。
(这种算法与LRU有点类似,但不完全相同。) 随机算法: 随机地从候选的槽中选取一个淘汰,与使用 情况无关。 (模拟试验表明,随机替换算法在性能上只 稍逊于基于使用情况的算法。而且代价低!)
组相联映射(Set Associative)
组相联映射结合直接映射和全相联映射的特点 将Cache所有槽分组,把主存块映射到Cache固定组的任一槽中。 也即:组间模映射、组内全映射。映射关系为: Cache组号=主存块号 mod Cache组数 举例:假定Cache划分为:8K字=8组x2槽/组x512字/槽 4=100 mod 8
举例
假定计算机系统有一个容量为32Kx16位的主存,且有一个4K字的4路组相联 Cache,主存和Cache之间的数据交换块的大小为64字。假定Cache开始为空, 处理器顺序地从存储单元0、1、…、4351中取数,一共重复10次。设Cache比主 存快10倍。采用LRU算法。试分析Cache的结构和主存地址的划分。说明采用 Cache后速度提高了多少?采用MRU算法后呢? 答:假定主存按字编址。每字16位。 主存:32K字=512块 x 64字 / 块 Cache:4K字=16组 x 4槽 / 组 x 64 字 / 槽 主存地址划分为:
机字长8位,CPU可输出8条数据线(D7~0), 16条地址线(A15~0),1条控制线(WE), 拟采用2K×4(位)的静态存储器芯片,构成 总容量为16K×8(位)主存储器。 (1)共需要多少片RAM芯片? (2)连接好CPU与主存储器之间的线路(拟用 138译码器,可采用部分译码方式)。 (3)主存储器的地址范围是什么? (4)若要求其地址范围为0800H~8FFFH(无地 址重叠区)则138译码器应如何连接
替换算法-最近最少用
计数器变化规则:
每组4槽时,计数器有2位。计数值越小则说明越被常用。 命中时,被访问的槽的计数器置0,比其低的计数器加1,
其余不变。 未命中且该组未满时,新槽计数器置为0,其余全加1。 未命中且该组已满时,计数值为3的那一槽中的主存块被 淘汰,新槽计数器置为0,其余加1。 1 2 3 4 1 2 5 1 2 3 4 5
将主存块和Cache槽按照以下三种方式进行映射
直接(Direct):每个主存块映射到Cache的固定槽中 全相联(Full Associate):每个主存块映射到Cache的任意槽中
组相联(Set Associate):每个主存块映射到Cache的固定组中的
任意槽中
cache容量和块大小的选择 Cache替换算法 cache-friendly的程序 Cache的写策略
3行/组
1 1* 1* 1* 4 4 4* 5 2 2* 1 1 1 2 3 3 3 2 *2 √ * 1* 1* 1* 1* 1* 1* 5 2 2 2 2 2 2 3 3 3 3 *3 4 4 * 4 4 √ √ 1 2 3 4 1 2 5 3 4 5 5 5 1* 1* 3 2 2 2* √ √ 5 5 5* 1 1 1 2 3* 2 4 4* 3 2 5 5* 5* 3 3 4 4 4 4 1* 5 2 2* 3 3
第三章存储器
主要内容
存储器的分类 存储器的分层结构
高速缓冲存储器Cache的基本原理 命中率 Cache和主存之间的地址映射 替换算法 写一致性 虚拟存储器的基本概念、页表结构、缺页异常、转换后援
缓冲器TLB
半导体随机存取存储器的组织
静态、动态 只读存储器 主存储器与CPU的连接:同步、异步 多体交叉编址存储器
0 Ex: 0x03
② =否?
2
N
Cache Data Bytes 0 1 2 3
Byte 0 Byte 1 Byte 2
①
③ =1否? 1
0x50
Byte 3
:
:
:
Byte 2 N- 1 2 -1
N
– 利用了时间局部性:某字节不久又可能被用 – 没有利用空间局部性:某字节的邻近字节不久可能也被用,但没有被调到Cache (每次调入的一块信息只有一个字节!) – 发生冲突概率增大,因为块小使映射到同一个Cache行的主存块增加 可以通过增大块的大小来利用空间局部性
0000 0001 0010 0000 1100B是第1组群中 的001块(即第9块)中第12个单元。 所以,映射到第一组中。
将主存地址标记和固定Cache 组中每个Cache标记进行比较
替换算法-先进先出(FIFO)
总是把最先进入的那一块淘汰掉。
例:假定主存中的5块{1,2,3,4,5}同时映射到Cache同一 组中,对于同一地址流,考察3槽/组、 4槽/组的情况。
控制线
读/写控制信号
读写控制电路
11110 11111
什么是程序访问的局部化特性 具有Cache机制的CPU的基本访存过程 Cache和主存之间的映射方式
把主存划分成大小相等的主存块(Block) Cache中存放一个主存块的对应单位称为槽(Slot)或行(line)或块(Block)
4行/组
由此可见,FIFO不是一种堆栈算法,即命中率并不随组的增大而提高。
替换算法-最近最少用(LRU)
总是把最近最少用的那一块淘汰掉。
例:假定主存中的5块{1,2,3,4,5}同时映射到Cache同一组中, 对于同一地址流,考察3槽/组、 4槽/组、 5槽/组的情况。 1 2 3 4 1 2 5 1 2 3 4 5 5 2 3 4 1 2 3 4 1 2 5 1 2 3 4 1 2 3 4 1 2 5 1 3 1 2 3 4 1 2 5 1 2 1 2 3 4 4 4 5 1 2 3 3 3 4 5 1 3行/组 √ √ 4行/组 √ √ √ √ 5行/组 √ √ √ √ √ √ √