DSP第二章DSP芯片的基本结构和特征

合集下载

DSP芯片

常用芯片
1)电源： TPS73HD3xx，TPS7333，TPS，PT64xx 2)Flash： AM29F400，AM29LV400，SST39VF400 3)SRAM： CY7C1021，CY7C1009，CY7C1049 4)FIFO： CY7C425，CY7C42x5 5)Dual port： CY7C136，CY7C133，CY7C1342 6)SBSRAM： CY7C1329，CY7C1339 7)SDRAM： HY57VBTC 8)CPLD： CY系列，CY系列，CY系列 9)PCI： PCI2040，CY7C 10)USB： AN21xx，CY7C68xxx 11)Codec：TLV320AIC23，TLV320AIC10
面向低功耗、手持设备、无线终端的应用主要有：手机、PDA、GPS、数传电台等。
数字信号处理数字滤波器
数字滤波器的实用型式很多，大略可分为有限冲激响应型和无限冲激响应型两类，可用硬件和软件两种方式实现。在硬件实现方式中，它由加法器、乘法器等单元所组成，这与电阻器、电感器和电容器所构成的模拟滤波器完全不同。数字信号处理系统很容易用数字集成电路制成，显示出体积小、稳定性高、可程控等优点。数字滤波器也可以用软件实现。软件实现方法是借助于通用数字计算机按滤波器的设计算法编出程序进行数字滤波计算。
谢ቤተ መጻሕፍቲ ባይዱ观看
优点缺点
优点
缺点
大规模集成性稳定性好，精度高可编程性高速性能可嵌入性接口和集成方便
成本较高高频时钟的高频干扰功率消耗较大等
产品应用
DSP芯片广泛应用于数字控制、运动控制方面的应用主要有磁盘驱动控制、引擎控制、激光打印机控制、喷绘机控制、马达控制、电力系统控制、机器人控制、高精度伺服系统控制、数控机床等。

定时器控制寄存器

专用的硬件乘法器
• 在通用的微处理器中，乘法指令是
由一系列加法来实现的，故需许多个指令周期来完成 • DSP具有专用的硬件乘法器，乘法可在一个指令周期内完成
1）多总线结构
2）40位算术逻辑单元（ALU）
3）17×17位并行乘法器
4）比较、选择和存储单元（CSSU） 5）指数编码器 6）两个地址发生器
为了快速实现数字信号处理运算，DSP芯片一般都采用特殊的硬件结构，正是这种针对运算的特殊的结构和设计，使它区别于通常的CPU或 MCU(微控制器)。 TMS320系列DSP芯片的主要硬件特点包括：哈佛结构、流水线操作、多总线、多处理单元、硬件配置强、耗电省。
DSP芯片的基本结构和特征
DSP芯片的基本结构哈佛结构流水线操作专用的硬件乘法器特殊的DSP指令快速的指令周期
11
1B 1C 1D
1E 1E~
REA（块重复结束寄存器） PMST （处理器工作方式） XPC（程序计数器扩展）保留
辅助寄存器(AR0～AR7)：这8个16位的辅助寄存器可以由算术逻辑单元(ALU)访问，也可以由辅助寄存器算术单元(ARAU) 进行修改。它们主要的功能是产生16位的数据地址，也可以同来作为通用寄存器和计数器。
暂存器T
1.
2. 3. 4.
为乘法指令或乘/累加指令存放一个乘数；为带有移位操作的指令（如：ADD ，LD，SUB 等）存放一个动态的移位数；为BITT指令存放一个动态位地址；参与EXP指令和NORM指令的操作。
状态转移寄存器TRN
1. 2.
为计算新的测量值存放中间结果； CMPS（比较、选择、存储单元）指令在累加器高位和低位比较的基础上会修改TRN的内容

DSP 第二章 DSP芯片的基本结构和特征

1．存储器分配 TMS320C25具有4K字的片内程序ROM和544字的片内RAM。 RAM分为三块：B0、B1、B2。其中，B0块（256字）既可配置为数据存储器（用CNFD指令），也可配置为程序存储器（用CNFP指令）。其余288字（B1和B2块）只能是数据存储器。 544字的片内RAM可使C25能处理512字的数据阵列，如可进行 256点复数FFT运算，且尚有32字用作中间结果的暂存。 TMS320C25提供片外可直接寻址的程序和数据空间各64K字。寄存器组包含8个辅助寄存器（AR0~AR7），它们可用作数据存储器的间接寻址和暂存，从而增加芯片的灵活性和效率。这些寄存器既可用指令直接寻址，也可用3比特的辅助寄存器指针（ARP）间接寻址。辅助寄存器和ARP既可从数据存储器装数，也可装入立即数。寄存器的内容也可存入数据存储器中。辅助寄存器组与辅助寄存器算术单元（ARAU）相连接，用ARAU访问信息表无需CALU参与地址操作，这样可让CALU进行其他操作。
在哈佛结构中：由于程序和数据存储器在两个分开的空间中，因此取指和执行能完全重叠运行。 TMS320系列DSP芯片在基本哈佛结构的基础上作了改进：一是允许数据存放在程序存储器中，并被算术运算指令直接使用，增强了芯片的灵活性；二是指令存储在高速缓冲器（Cache）中，当执行此指令时，不需要再从存储器中读取指令，节约了一个指令周期的时间。如TMS320C30具有64个字的Cache。进一步提高了运行速度和灵
2.2.4 特殊的DSP指令DSP芯片的另一个特征:特殊的指令。指令DMOV：它完成数据移位功能。在数字信号处理中，延迟操作非常重要，这个延迟就是由DMOV来实现的。指令LTD：它在一个指令周期内完成LT、DMOV和 APAC（将乘法结果加到ACC中）三条指令。指令FIRS:

DSP课件第二章TMS320LF240x硬件结构

中断访问
当片内外设产生中断时，CPU响应中断并执行相应的中断服务程序对片内外设进行操作。
05
TMS320LF240x的电源管理和低功耗
模式
电源管理单元
电源管理单元（PMU）是TMS320LF240x芯片中的一个重要组成部分，负责控制芯片的电源供应和功耗管理。
PMU包含多个电源域，可独立控制各个电源域的开启和关闭，以实现灵活的功耗管理。
较
他设备进行数据交换，可配置为发送或接收模式。
器
比较器用于检测电压或电平是否达到预设值，输出电平
可配置为高或低，常用于 PWM控制或阈值检测。
看门狗定时器
片内外设的访问方式
直接访问
通过特定的寄存器地址直接读写片内外设的控制寄存器和数据寄存器。
间接访问
通过特定的寄存器地址读写片内外设的控制寄存器来配置片内外设，再通过数据寄存器进行数据传输。
PMU还具有过压和欠压保护功能，以确保芯片在异常电源条件下能够安全运行。
低功耗模式
TMS320LF240x支持多种低功耗模式，以便在不需要时降低芯
片功耗。
低功耗模式通过关闭不需要的内部时钟和电源域来实现功耗降低。
在低功耗模式下，芯片的某些功能将被禁用，但仍可以响应外部事件或中断，并在必要时唤醒。
需求。
输入输出电平
02
TMS320LF240x的输入输出电平一般为CMOS电平，能够与
TTL和CMOS电路兼容。
驱动能力
03
TMS320LF240x的驱动能力较强，能够驱动较大规模的外部电
路。
封装形式
• TMS320LF240x的封装形式一般为塑封或陶瓷封装，具体取决于应用需求和生产厂家。

DSP芯片的基本结构和特征

A BT 40 40 SXM ACC A 40 MUX AM MAC 输出 U B B 40 MUX 符号控制 Y
40
三、CPU
3.2 累加器
39 … 32 31 BG 保护位 … BH 16 15 … BL 低位字 0
保护
高位字
TMS32C54x累加器ACCB结构
三、CPU
3.2 累加器
.L1 .S1 .M1 .D1 .D2 .M2 .S2 .L2
TigerSHARC
ADSP-TS101 ADSP-TS201 ADSP-TS202 ADSP-TS203
3.2
十、小结
• 首先介绍了 DSP 芯片的基本结构，随后比较详细地介绍了TI公司的系列DSP芯片的基本特征，并简要介绍了AD等公司的DSP 芯片 • 由于 DSP 芯片的发展速度很快，用户在选用 DSP 芯片时，必须根据市场行情选用生产厂家主推的产品
SXM
TC (测试比特) ALU CSSU
桶形移位器 40 MSB/LSB 写选择 16 EB15 －EB0
三、CPU
3.4 乘累加单元
CB15 －CB0 DB15 －DB0 PB15 －PB0 T T D A：累加器A A P A D C B：累加器B C ：数据总线CB D：数据总线DB P：程序总线PB 符号控制 17 XM 17 YM A B MUX YA 加法器(40) 0 T：寄存器T 40 40 累加器A 累加器B
运行速度（最高）内部RAM 串行I/O口用户程序、数据ROM DMA控制器存储器宽度外部中断触发中断矢量表地址程序引导
电平/边沿触发可选电平/边沿触发可选
八、 TI浮点DSP芯片
九、其他DSP芯片

DSP芯片的基本结构和特征

DSP芯片的基本结构和特征引言DSP芯片（Digital Signal Processor，数字信号处理器）是一种专用于数字信号处理任务的微处理器。

它具有高处理速度和低功耗等特点，广泛应用于音频、视频、通信、雷达、图像处理等领域。

本文将介绍DSP芯片的基本结构和特征，以便读者更好地了解和应用该技术。

1. DSP芯片的基本结构DSP芯片的基本结构通常包括三个主要部分：中央处理单元（CPU）、存储器和数字信号处理模块。

下面将详细介绍这些部分的功能和特点。

1.1 中央处理单元（CPU）中央处理单元是DSP芯片的核心，负责控制和执行指令。

它通常由一个或多个运算单元（ALU）和一个控制单元组成。

ALU负责执行算术和逻辑运算，而控制单元则负责解码和执行指令序列。

中央处理单元是DSP芯片实现高速运算的关键部分。

1.2 存储器存储器是DSP芯片的重要组成部分，用于存储程序代码、数据和中间结果。

它通常包括两种类型的存储器：指令存储器（程序存储器）和数据存储器。

指令存储器用于存储程序代码和指令，而数据存储器用于存储数据和中间结果。

存储器的大小和访问速度对DSP芯片的性能有重要影响。

1.3 数字信号处理模块数字信号处理模块是DSP芯片的核心功能模块，用于执行数字信号处理任务。

它通常包括以下几个功能单元：时钟和定时器单元、数据通路单元、乘法器和累加器（MAC）单元以及控制逻辑单元。

时钟和定时器单元用于提供时序控制和定时功能，数据通路单元用于数据传输和处理，乘法器和累加器单元用于高速乘加运算，控制逻辑单元用于控制和协调各个功能单元的操作。

2. DSP芯片的特征DSP芯片相较于通用微处理器具有一些明显的特征，下面将介绍几个主要特征。

2.1 高速运算能力DSP芯片具有高速运算能力，主要得益于其专门的运算单元和并行处理能力。

相较于通用微处理器，DSP芯片能够更快地执行算术和逻辑运算，满足实时信号处理的需求。

2.2 低功耗设计DSP芯片在设计过程中注重功耗的控制，以满足移动设备和嵌入式系统等低功耗应用的需求。

DSP芯片的基本结构

DSP芯片的基本结构DSP芯片的基本结构包括：1.哈佛结构；2.流水线操作；3.专用的硬件乘法器；4.特殊的DSP指令；5.快速的指令周期。

哈佛结构哈佛结构的主要特点是将程序和数据存储在不同的存储空间中，即程序存储器和数据存储器是两个相互独立的存储器，每个存储器独立编址，独立访问。

与两个存储器相对应的是系统中设置了程序总线和数据总线，从而使数据的吞吐率提高了一倍。

由于程序和存储器在两个分开的空间中，因此取指和执行能完全重叠。

流水线与哈佛结构相关，DSP芯片广泛采用流水线以减少指令执行的时间，从而增强了处理器的处理能力。

处理器可以并行处理二到四条指令，每条指令处于流水线的不同阶段。

CLLOUT1，取指N N-1 N-2，译码N-1 N N-2，执行N-2 N-1 N，专用的硬件乘法器，乘法速度越快，DSP处理器的性能越高。

由于具有专用的应用乘法器，乘法可在一个指令周期内完成。

特殊的DSP指令DSP芯片是采用特殊的指令。

快速的指令周期哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSP指令再加上集成电路的优化设计可使DSP芯片的指令周期在200ns以下。

DSP芯片的选择方法一般而言，定点DSP芯片的价格较便宜，功耗较低，但运算精度稍低。

而浮点DSP芯片的优点是运算精度高，且C语言编程调试方便，但价格稍贵，功耗也较大。

例如TI的T MS320C2XX/C54X系列属于定点DSP芯片，低功耗和低成本是其主要的特点。

而TMS320C3X/C4X/C67X属于浮点DSP芯片，运算精度高，用C语言编程方便，开发周期短，但同时其价格和功耗也相对较高。

DSP应用系统的运算量是确定选用处理能力为多大的DSP芯片的基础。

运算量小则可以选用处理能力不是很强的DSP芯片，从而可以降低系统成本。

相反，运算量大的DSP系统则必须选用处理能力强的DSP芯片，如果DSP芯片的处理能力达不到系统要求，则必须用多个DSP芯片并行处理。

第二章DSP芯片结构和CPU外围电路

▪ 数据地址产生单元(DAGEN)和程序地址产生单元(PAGEN) ▪ 数据空间和和程序空间位同一物理空间，采用统一编址
第三页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
2.1.2 TMS320C55x CPU
CPU有4个功能单元：指令缓冲单元(I单元)，程序流程单元(P单元) ，地址数据流程单元 (A单元)和数据计算单元(D单元)
第十七页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
5、DPLL模式控制寄存器CLKMD
(1) BREAKLN为失锁指示(只读) ▪ 0：表示由于某种原因引起PLL失锁；
▪ 1：表示处于锁定状态，或发生对CLKMD寄存器的写操作。
(2) LOCK为锁定模式指示(只读) ▪ 0：表示DPLL处于旁路模式
时钟发生器由一个数字锁相环(DPLL)和一个模式控制寄存器
(CLKMD)组成。
CLKIN pin
DPLL
CLKOUT pin
CLKMD pin
CLKMD 寄存器
第十二页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
(3) 两种工作模式(模式控制寄存器标志位的定义)
▪ 若PLL_ENABLE＝0，DPLL工作于旁路(BYPASS)模式。 ▪ 若PLL_ENABLE＝1，DPLL工作于锁定(LOCK)模式。旁路模式中：DPLL只对输入时钟CLKIN作简单的分频，分频次数由
I单元的立即数和D单元的寄
存器值产生所需的地址，并将产生地址送到PAB。
第六页，编辑于星期四：一点七分。
第二章 DSP芯片结构和CPU外围电路
▪ 在程序流程单元中，控制和影响程序地址的寄存器有5类：

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

并行移位器：用于小数结果的调整。
允许文本交换的4×12位堆栈两个间接寻址的辅助寄存器
双通道串行口（TMS32011,TMS320C17/E17）协处理器接口（TMS320C17/E17）器件封装：40脚双列直插（DIP）/44脚塑封（PLCC）
h
12
2.3.1.2 TMS320C10 TMS32010采用改进的哈佛结构，即程序和数据
DSP芯片的特征就是有一个专用的硬件乘法器。在TMS320系列中，由于具有专用的硬件乘法器，乘法可在一个指令周期内完成。
h
9
2.2.4 特殊的DSP指令
DSP芯片的另一个特征:特殊的指令。指令DMOV：它完成数据移位功能。在数字信号处理中，延迟操作非常重要，这个延迟就是由DMOV来实现的。
第二章
DSP芯片的基本结构和特征
h
1
2.1 引言
可编程DSP芯片是一种具有特殊结构的微处理器。 DSP芯片一般都具有程序和数据分开的总线结构、流水线操作功能、单周期完成乘法的硬件乘法器以及一套适合数字信号处理的指令集。
本章内容：DSP芯片的基本结构，TI公司的各种 DSP芯片的特征及其他公司的DSP芯片的特点。
h
7
CLKOUT1
取指译码执行
N N－1 N－2
N＋1 N
N－1
N＋2 N＋1
N
h
8
2.2.3 专用的硬件乘法器
乘法是DSP的重要组成部分。滤波器常常做一次乘法和一次加法（XY）。乘法速度越快，DSP
处理器的性能就越高。在通用的微处理器中，乘法指令是由一系列加法来实现的，故需许多个指令周期来完成。
期使得DSP芯片能够实时实现许多DSP应用。
h
10
2.3 TI定点DSP芯片
TI定点DSP芯片：经历TMS32010（1982）DSP芯片TMS320C1X、
TMS320C2X/C2XX、TMS320C5X 、TMS320C54X、 TMS320C62X等几代产品，产品的性能价格比不断提高，
应用越来越广泛。
TMS320系列DSP芯片是软件可编程器件：具有通用
微处理器具有的方便灵活的特点。
h
3
2.2.1 哈佛结构哈佛结构：不同于传统的冯·诺曼（Von Neuman）
结构的并行体系结构。其主要特点：是将程序和数据存储在不同的
存储空间中，即程序存储器和数据存储器是两个相互独立的存储器，每个存储器独立编址，独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线两条总线，从而使数据的吞吐率提高了一
h
2
2.2 DSP芯片的基本结构
DSP芯片采用特殊的软硬件结构：快速地实现数字信号处
理运算。
TMS320系列DSP芯片的基本结构包括：
（1）哈佛结构；
（2）流水线操作；
（3）专用的硬件乘法器；
（4）特殊的DSP指令；
பைடு நூலகம்
（5）快速的指令周期。
DSP芯片可以实现快速的DSP运算，并使大部分运
算（例如乘法）能够在一个指令周期内完成。
一是允许数据存放在程序存储器中，并被算术运算指令直接使用，增强了芯片的灵活性；
二是指令存储在高速缓冲器（Cache）中，当
执行此指令时，不需要再从存储器中读取指令，
节约了一个指令周期的时间。如TMS320C30具
有64个字的Cache。进一步提高了运行速度和灵
h
5
2.2.2 流水线
DSP芯片广泛采用流水线以减少指令执行时间，从而增强了处理器的处理能力。TMS320系列处理器的流水线深度从2~6级不等。
第一代TMS320处理器采用二级流水线，第二代采用三级流水线，
而第三代则采用四级流水线。
h
6
TMS320C54X采用六级流水线：
在三级流水线操作中，取指、译码和
执行操作可以独立地处理，这可使指令执行能完全重叠。在每个指令周期内，三个不同的指令处于激活状态，每个指令处于不同的阶段。例如，在第N个指令取指时，前一个指令即第N-1个指令正在译码，而第 N-2个指令则正在执行。
倍。冯·诺曼结构：则是将指令、数据、地址存储在同一存储器中，统一编址，依靠指令计数器提供的地址来区分是指令、数据还是地址。取指令和取数据
都访问同一存储器，数据吞吐率低。
h
4
在哈佛结构中：由于程序和数据存储器
在两个分开的空间中，因此取指和执行能完全重叠运行。
TMS320系列DSP芯片在基本哈佛结构的基础上作了改进：
空间相互独立。
程序存储器可在片内（1.5K字）或片外（4K 字）。
片内数据RAM为144字。有四个基本的算术单元：算术逻辑单元（ALU）、
累加器（ACC）、乘法器和移位器。 (1) ALU：32位数据操作的通用算术逻辑单元。 ALU可进行加、减和逻辑运算； (2) ACC：它采用32位字长操作，分高16位和低16 位两部分。处理器提供高16位和低16位的专门指令：
2.3.1 TMS320C1X
2.3.1.1 基本特点第一代TMS320系列DSP芯片包括：TMS32010、 TMS32011、TMS320C10、 TMS320C15/E15和 TMS320C17/E17。这些芯片的典型工作频率为20MHz。
h
11
第一代DSP芯片的主要特点如下:
指令周期：160ns/200ns/280ns 片内RAM：144字/256字（TMS320C15/E15/C17/E17）片内ROM：1.5K字/4K字（TMS320C15/C17） 4K字片内程序EPROM（TMS320E15/E17） 4K字外部全速存储器扩展并行乘法器：乘积为32位桶形移位器：将数据从存储器移到ALU进行计算时，0～16位左移。
指令LTD：它在一个指令周期内完成LT、DMOV和 APAC（将乘法结果加到ACC中）三条指令。
指令FIRS:
哈佛结构、流水线操作、专用的硬件乘法器、特殊的 DSP指令再加上集成电路的优化设计，可使DSP芯片的指令周期在200ns 以下。TMS320系列处理器的指令周期已经从第一代的200ns降低至现在的20ns 以下。快速的指令周
SACH（高16位）和SACL（低16位）；
h
13
(3) 乘法器：16×16位并行乘法器由三个单元组成：T寄存器、P寄存器和乘法器阵列。T 寄存器存储被乘数，P寄存器存储32位乘积。
(4) 移位器：有两个移位器可用于数据移位。一个是桶形移位器，另一个是并行移位器。桶形移位器又称定标移位器。当数据存储器的数据送入累加器或与累加器中的数据进行运算时，先通过这个移位器进行0~16位左移，然后再进行运算。并行移位器即输出移位器，其作用是将累加器中的数据左移0、1或4位后再送入数据存储器中，以实现小数运算或小数乘积的调整。