TI公司三大系列DSP内部结构之比较

合集下载

浅谈C2000 C5000和C6000的内部结构及区别

浅谈C2000 C5000和C6000的内部结构及区别

浅谈C2000C5000和C6000的内部结构及区别姓名:王莎班级:SJ1239学号:201221902003摘要:随着计算机和数字信号处理技术的快速发展和广泛应用,数字信号处理(DSP)引发了工业设计的革命,成为了工程实现的关键。

本文通过TI公司的TMS320C2000、TMS320C5000和TMS320C6000三大主流芯片内部结构介绍和比较,得出了它们之间的不同和共同点,并对它们进行了对比性说明。

关键词:DSP;内部结构;比较Abstract:With the computer and digital signal processing technology rapid development and the widespread Abstract:application,digital signal processing (DSP)has brought the industrial design revolution and become the key to the realization of the project.This paper introduces the Texas instruments(TI) company three mainstream chip internal structures,TMS320C5000、TMS320C2000and TMS320C6000,which are introduced and compared for all series of chips to know the different and common points between them,and has carried on the comparative to their specifications.Keywords:DSP;Internal structure;comparison1.前言世界上第一个单片DSP芯片是1978年AMI公司发布的S2811,1979年美国Intel公司发布的商用可编程器件2920是DSP芯片发展史上一个重要的里程碑。

内容3--德州仪器(TI)的系列DSP

内容3--德州仪器(TI)的系列DSP
21:51:26 52
通过PB总线完成数据传递
PB总线能把存储在程序空间的数据操作 数(如系数表)传送到乘法器和加法器 中进行乘/累加运算,或者在数据移动指 令(MVPD和READA)中传送到数据空 间。这种能力再加上双操作数读的特 性,支持单周期3操作数指令的执行,如 FIRS指令。
21:51:26
21:51:26
15
第二部分 DSP硬件结构
在这一部分中,我们介绍:
TMS320LF240X的 硬件结构 TMS320VC3X的硬 件结构 TMS320C6201的 硬件结构 重点介绍: TMS320C54XX硬 件结构特点 ★
21:51:26 17
§2-1 TMS320LF240X的硬件 结构
各大公司定点DSP性能比较
21:51:26
13
浮点DSP的性能比较
21:51:26
14
DSP主要供应商的网站
德州仪器(TI):http:\\, http:\\ 模拟器件(ADI): http:\\ 郎讯科技:http:\\ 莫托罗拉:http:\\
21:51:26 11
定点DSP与浮点DSP
在DSP运用中的数据保真性很重 要,因此在定点DSP中必须要特别 考虑运算过程中可能出现的溢出等 情况。在定点DSP中,累加器一般 比存储器字长大,并特别设置了溢 出模式位,可以选择在溢出情况下 的处理方法,从而尽量降低数据失 真。
21:51:26 12
57
ALU框图:
21:51:26
58
累加器:
累加器ACCA和ACCB存放从ALU或乘 法器/加法器单元输出的数据,累加器也 能输出到ALU或乘法器/加法器中。
21:51:26
59

三大DSP系列结构之比较

三大DSP系列结构之比较

TI公司三大系列DSP芯片内部结构之比较班级:SJ1126 姓名:张晖学号:201120195012摘要:随着数字信号处理技术和集成电路技术的发展,以及数字系统的显著优越性,导致了DSP芯片的产生和迅速发展,DSP技术的地位凸显出来。

在世界上众多的DSP厂商中,德州仪器公司的DSP始终占据着较大的市场份额(45% ~60%),本文概略的介绍目前得到广泛应用的TI三大DSP处理器系列,TMS320C2000、TMS320C5000和TMS320C6000。

关键字:TI DSP正文:一、TMS320系列DSP命名TMS 320 F 2812 PGF A温度范围(缺省为L)前缀L=0 ~70℃TMX=A=-40 ~85℃TMP=Q=-40~125℃TMS=封装形式DSP PGF=176—引脚LQFP320=TMS320系列PAG=64—引脚塑料TQFPPGE=144-引脚塑料TQFPPZ=100-引脚塑料TQFP器件型号工艺C=COMSE=COMS EPROMF=Flash EEPROMLC=Low—voltage COMS(3.3V)VC=Low—voltage COMS(3V)TMS320包括了定点、浮点和多处理器数字信号处理芯片。

主要分为三种不同指令集的三大系列:TMS320C2000、TMS320C5000和TMS320C6000。

TMS320系列中的同一子系列产品具有相同的CPU结构,只是片内存储器和片内外设配置不同,同一子系列产品的软件完全兼容。

二、TMS320C2000系列TMS320C2000是作为优化控制的DS P系列。

TMS320C2000系列DSP集成CPU核和控制外设于一体,提供了高速的ADC和PWM发生器等,集成强大灵活的特定控制接口。

C2000 DSP既具有数字信号处理能力,又具有强大的事件管理能力和嵌入式控制功能,非常实用于工业、汽车、医疗和消费类市场中数字电机控制、数字电源和高级感应技术。

2.TIDSP系列及硬件结构解析

2.TIDSP系列及硬件结构解析
S

8
Biased Exponent -e
23
Mantissa -f
第2章TMS320C2的CPU结构和存储器配置

2.1 TMS320C2xx系列DSP结构1、结构2和结构3
主要的功能单元:´2DSP的CPU(或称为DSP内核)、内部存储器和外围 设备。所有‘C2系列产品(‘C24 ‘C20 ‘C240)都具有相同的CPU (DSP Core) 。
1.4 数字运算基础

数的定标
Q表示法:小数点放在i位之后称为Qi表示 D15 Di • D0
i越大,表示的数值范围越小(绝对值小于215-i),但精度越高 (小数精度为1/2i),最高位D15为符号位

转换
某数(x)转换为定点数(xq) Qi :xq = int[x*2i]把小数点左移i位
将Qi表示的定点数(xq)转换为数据(x):x = float [xq*2-i] 例如,数x=0.4,用Q15表示,则对应定点数为 xq=int[0.4*215 ]=13107
返回
各模块 的I/O引 脚比较 清楚
信号 第5章
返回
给出给 出了 F240更 具体的 内部结 构特点 给
返回
X240系 列引脚图
PQ= 132 引脚 bumper ed QFP
返回
2.2 'C2的总线结构
总线全部为16位
2.3 'C2系列CPU结构
CPU寄存器 包括: ACC、TREG PREG、 ST0、ST1
DSP定点数算术运算
定点加/减法必须保证两个操作数的定标值一样。 如果两个数据的Q值不同,在保证数据准确性的前提下调整Q值使数据精度 最高,即尽量将Q值小的数调整为与另一个数的Q一样大。 例如,|X|<1 |Y|<4 用Q13表示 定点数的乘法 两个16位定点数的乘法分以下几种情况: 小数乘小数(即数用Q15表示) Q15*Q15=Q30,两位符号位,左移一位 整数乘整数(即数用Q0表示法) Q0*Q0=Q0 混合表示法(操作数采用Q0与Q15之间的表示法) 非线性运算 库函数math.h、查表法和混合法

TI公司DSP系列概述解析

TI公司DSP系列概述解析

8-level hardware stack
Repeat count
2 status registers
Peripheral Bus
WD Timer CAN SCI SPI
A/D Converter
10 bits, 16 channels
C2000™: 参数选择列表
‘F240 ‘C240 ‘F241 ‘C242 ‘F243 ‘LF2402 ‘LC2402 ‘LC2404 ‘LF2406 ‘LC2406 ‘LF2407
Event Managers
Ultra-Fast 12-bit ADC
▪ 16.7 MSPS Conversion Speed ▪ Dual s/h enable simultaneous sampling ▪ Auto Sequencer, up to 16 conversions w/o CPU Communications Ports
PRODUCTION Yr 2000 10Ku Pricing
20 20 20 20 20 30/40 30/40 30/40 30/40
16K 8K 8K
8K
32K
16K 4K
4K
16K
544 544 544 544 544 544
544
1.5K 2.5K
Yes
Yes
3
3
2
2
2
Memory Sub-System
Fast program execution out of both RAM and Flash memory
▪ 110-120 MIPS with Flash Acceleration Technology ▪ 150 MIPS out of RAM for time-critical code CCoonnttrrooll PPoerrtispherals

TI公司三大系列DSP内部结构之比较

TI公司三大系列DSP内部结构之比较

TI公司三大系列DSP内部结构之比较摘要:本文介绍了德州仪器(TI)公司的三大主流系列DSP的内部结构,并对它们进行了对比性说明。

关键词:TI;DSP;内部结构;比较Abstract:This paper introduces the Texas instruments (TI) company three mainstream series DSP internal structure, and to them of kriging instructions.Keywords:TI;DSP;Internal structure;comparison一 TI公司的DSP芯片德州仪器(Texas Instruments),简称TI,是全球领先的半导体公司,为现实世界的信号处理提供创新的数字信号处理(DSP)及模拟器件技术。

除半导体业务外,还提供包括传感与控制、教育产品和数字光源处理解决方案。

TI总部位于美国得克萨斯州的达拉斯,并在25多个国家设有制造、设计或销售机构[1]。

本文主要介绍的是TI公司的DSP芯片。

TI公司常用的DSP芯片可以归纳为三大系列:(1)TMS320C2000系列,称为DSP控制器,集成了flash存储器、高速A/D转换器以及可靠的CAN模块及数字马达控制的外围模块,适用于三相电动机、变频器等高速实时工控产品等需要数字化的控制领域。

(2)TMS320C5000系列,这是16位定点DSP。

主要用于通信领域,如IP电话机和IP电话网关、数字式助听器、便携式声音/数据/视频产品、调制解调器、手机和移动电话基站、语音服务器、数字无线电、小型办公室和家庭办公室的语音和数据系统。

(3)TMS320C6000系列DSP 采用新的超长指令字结构设计芯片。

其中2000年以后推出的C64x,在时钟频率为1.1GHz时,可达到8800MIPS以上,即每秒执行90亿条指令。

其主要应用领域为:①数字通信完成FFT、信道和噪声估计、信道纠错、干扰估计和检测等。

TI公司三大系列DSP芯片指令系统比较

TI公司三大系列DSP芯片指令系统比较摘要:DSP技术已成为目前电子工业领域发展最迅速的技术,在各行各业的应用越来越广泛。

DSP微处理器是以数字信号来处理大量信息的器件,已成为电子工业领域增长最迅速的产品之一。

TI公司作为最早从事DSP微处理器研究的厂商之一,已经形成了三大系列的DSP芯片,在电子行业各个领域占有很大的市场份额。

本文通过对TI公司三大系列DSP芯片的简要介绍,对这三大系列芯片的指令系统进行了比较。

关键词:TI DSP芯片指令系统比较一、前言在经历整整二十年的市场拓展之后,DSP所树立的高速处理器地位不仅不可动摇,而且业已成为数字信息时代的核心引擎。

与此同时,DSP的市场正在蓬勃发展。

从TI推出业界第一颗商用DSP开始,陆续有公司设计出适合于DSP处理技术的处理器,于是DSP开始成为一种高性能处理器的名称。

TI在1982年发表一款DSP处理器名为TMS32010,其出色的性能和特性倍受业界的关注,当努力使DSP处理器每MIPS成本也降到了适合于商用的低于$10美元范围时,DSP不仅在在军事,而且在工业和商业应用中不断获得成功。

1991年TI推出的DSP批量单价首次低于$5美元而可与16 位的微处理器相媲美,但所能提供的性能却是其5至10倍。

多家公司跻身于DSP领域与TI进行市场竞争。

TI首家提供可定制DSP,称作cDSP。

cDSP 基于内核DSP的设计可使DSP具有更高的系统集成度,大加速了产品的上市时间。

同时TI瞄准DSP 电子市场上成长速度最快的领域,适时地提供各种面向未来发展的解决方案。

到九十年代中期,这种可编程的DSP器件已广泛应用于数据通信、海量存储、语音处理、汽车电子、消费类音频和视频产品等等,其中最为辉煌的成就是在数字蜂窝电话中的成功,逐渐形成了现今TI三大系列主流DSP芯片。

TI通过不断革新,推陈出新,DSP业务也一跃成为TI的最大的业务,并始终处于全球DSP市场的领导地位。

第二章TITMS320C2000系列DSPCPU内核结构


TXRXINT 异步串行口发送/接收中断
3. 4. 5.
C2000系列中断相关寄存器
中断标志寄存器IFR:
表示出中断状态,或指出挂起的中断
6.
7.
中断屏蔽寄存器IMR:
屏蔽或使能中断处理
8.
9. 10.
中断控制寄存器ICR:
控制某些中断处理过程 中断标志寄存器
15
6 保 留
0
5 TXRX INT
IFR的操作:
读IFR可了解可屏蔽中断是否被挂起; 写IFR可清除已被挂起的中断,向IFR的某位写1可清除该中断 请求;

中断屏蔽寄存器IMR
6 保 留 0 5 TXRX INT R/W-0 4 XINT R/W-0 3 RINT R/W-0 2 TINT R/W-0 1 0 INT2/I HOLD/I NT3 NT1 R/W-0 R/W-0
SXM=0,未使用的高位填0,不进行符号扩展; 结 论: SXM=1,输入移位器的高位进行符号扩展,在高 在进行 dsp编程时,应根据操作数的类型(有符 位填符号位 0/1; 号数、无符号数)对状态寄存器 ST0的符号扩展 例,设输入移位器的输入 =(97F3h),左移 4位: 位SXM则输出为 进行初始化,应在主程序中完成!!! 当SXM=0, 00097F30h; 当SXM=1,则输出为FFF97F30h;
PRDB 程序读数据总 线 DRAB 数据读地址总 线 DWA B 数据写地址总 线
提供读数据存储器地址
提供写数据存储器地址 将数据存储器中内容送至CPU
DRDB 数据读数据总 线 DWEB 数据写数据总 线
将数据送至程序存储器和数据存储器
与微处理器8088和单片机8051总线相比,DSP的总

c2000,c5000,c6000系列DSP编程方法

二、TI公司三大系列内部结构的简介 1、C2000系列的内部结构1,C2000系列基于改进的哈佛结构,支持分开的程序空间和数据空间。

还有第三个空间,即I/O空间,用于片外总线接口。

外设总线映射到数据空间,因此,运行在数据空间的所有指令,都可以运行于所有的外设寄存器。

C2000系列的CPU包括:一个32位的中心算术逻辑单元(CALU)、一个32位的累加器(ACC)、CALU具有输入和输出数据定标移位器、一个16x16位乘法器、一个乘积定标移位器、数据地址产生逻辑:包括8个辅助寄存器和1个辅助寄存器算术单元(ARAU)、程序地址产生单元C2000系列采用2xLPASIC核,其内部设有6组16位的数据与程序总线。

这6组总线是:PAB(ProgramAddr.Bus)程序地址总线DRAB(Data-ReadAddr.Bus)数据读地址总线; DWAB(Data-WriteAddr.Bus)数据写地址总线; PRDB(ProgramReadBus)程序读总线;DRDB(DataReadBus)数据读总线;DWEB(DataWriteBus)数据写总线。

将数据读地址总线(DRAB)和数据写地址总线(DWAB)分开,CPU就可以在同一个机器周期内读和写数据。

C2000系列具有以下类型的片内存储器:双访问RAM(DARAM),即一个机器周期内可以访问两次的存器;FlashEEPROM或工厂掩模的ROM。

C2000系列的存储器分为单独可选择的4个空间,总共的地址范围为224K字:程序存储器(64K字);局部数据存储器(32K字);全局数据存储器(64K字);输入/输出(64K字)。

2、C5000系列的内部结构C5000系列中央处理单元CPU包括算术逻辑单元、乘法器、累加器、移位寄存器、各种专门用途的寄存器、地址发生器、比较选择单元、指数编码器。

具体内容如下①先进的多总线结构,具有1条程序存储器数据总线、3条数据存储器数据总线和4条地址总线;②40位算术逻辑单元(ALU),包括40位的桶形移位寄存器和2个独立的40位的累加器;③17位乘17位的并行乘法器与一个40位的专用加法器结合在一起,用于单周期乘/累加操作;④比较、选择和存储单元(CSSU),用于Viterbi操作(一种通信的编码方式)中的加/比较选择;⑤指数编码器用于在单周期内计算40位累加器的指数值;⑥2个地址生成器,包括8个辅助寄存器和2个辅助寄存器算术单元[6]。

浅谈C2000、C5000、C6000的内部结构和区别

浅谈C2000、C5000、C6000的内部结构和区别浅谈C2000、C5000和C6000的内部结构和区别摘要:德仪公司的DSP分为多种系列,其中TI公司的TMS320系列的DSP在全球应用中较为广泛。

本文重点对TMS320系列下的C2000系列,C5000系列,C6000系列的内部结构做重点介绍,并对其内部结构进行比较。

为了更好地了解其内部结构下面主要从三大方面进行总结,分别是:中央处理单元(CPU)、存储器和I/O空间、外围设备。

关键词:内部结构C2000系列C5000系列C6000系列Introduction to the internal structure and distinction ofC2000,C5000,C6000Abstract:The digital signal processors of the TI company are the widely used for many years.the IT company's DSP is divided into several series,in which TMS320 series have an wide application in the global .Toward the C2000 series, C5000 series, C6000 series which belong to TMS320 series,this paper mainly makes summary and comparison about their internal structure. In order to better understand its internal structure below summarizes mainly from three aspects, respectively is: the central processing unit (CPU), memory and I/O space, and peripheral devices.Keywords:Digital signal processing The internal structure C2000 series C5000 series C6000 series 一、引言在生产数字信号处理的全球企业中,美国的德仪公司生产的数字信号处理器多年来一直占据了较大的DSP生产市场,并且在不断的扩大。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

TI公司三大系列DSP内部结构之比较摘要:本文介绍了德州仪器(TI)公司的三大主流系列DSP的内部结构,并对它们进行了对比性说明。

关键词:TI;DSP;内部结构;比较Abstract:This paper introduces the Texas instruments (TI) company three mainstream series DSP internal structure, and to them of kriging instructions.Keywords:TI;DSP;Internal structure;comparison一 TI公司的DSP芯片德州仪器(Texas Instruments),简称TI,是全球领先的半导体公司,为现实世界的信号处理提供创新的数字信号处理(DSP)及模拟器件技术。

除半导体业务外,还提供包括传感与控制、教育产品和数字光源处理解决方案。

TI总部位于美国得克萨斯州的达拉斯,并在25多个国家设有制造、设计或销售机构[1]。

本文主要介绍的是TI公司的DSP芯片。

TI公司常用的DSP芯片可以归纳为三大系列:(1)TMS320C2000系列,称为DSP控制器,集成了flash存储器、高速A/D转换器以及可靠的CAN模块及数字马达控制的外围模块,适用于三相电动机、变频器等高速实时工控产品等需要数字化的控制领域。

(2)TMS320C5000系列,这是16位定点DSP。

主要用于通信领域,如IP电话机和IP电话网关、数字式助听器、便携式声音/数据/视频产品、调制解调器、手机和移动电话基站、语音服务器、数字无线电、小型办公室和家庭办公室的语音和数据系统。

(3)TMS320C6000系列DSP 采用新的超长指令字结构设计芯片。

其中2000年以后推出的C64x,在时钟频率为1.1GHz时,可达到8800MIPS以上,即每秒执行90亿条指令。

其主要应用领域为:①数字通信完成FFT、信道和噪声估计、信道纠错、干扰估计和检测等。

②图像处理完成图像压缩、图像传输、模式及光学特性识别、加密/解密、图像增强等[2]。

二 TMS320C2000系列DSPTMS320C2000器件是具有高性能集成外设(针对实时控制应用而设计)的32位微处理器。

其优化的内核可在严苛控制应用所需的速度下,执行多种复杂的控制算法。

这些功能强大的集成外设与SPI、UART、I2C、CAN和McBSP通信外设配合使用,TMS320C2000器件成为最理想的单芯片控制解决方案。

TI 提供了定点和浮点 C2000 微处理器,它们具有各种外设和存储器配置,可满足不同的控制应用要求。

TMS320C2000系列主要包括24X 16位、28X 32位两个子系列[3]。

TMS320C2000MCU系列拥有32位架构、高级外设、高度的模拟集成以及从32至256引脚等多个封装版本,能使各种应用实现卓越的性能及实时控制功能。

功能齐备的独特外设拥有无与伦比的片上12.5 MSPS ADC、高分辨率PWM以及显著增强的捕获单元等众多特性优异的组件。

C28X 32位内核具有单周期32*32位硬件乘法器以及单周期原子指令执行能力。

TMS320C2000MCU具备96个中断矢量,可帮助项目的设计实现终极灵活性。

其中C28X 微处理器内核专为实时控制而精心设计,其快速中断能实现10个周期的上下文环境开关。

通过改进的哈佛结构,32位数据与外设总线可确保内核、存储器以及外设能够实现高效互动。

高度安全的内存、RAM与ROM能保护自己的知识产权不被盗用。

其中,部分器件还提供6通道DMA.新型Delfino MCU TMS320F283XX系列拥有集成型硬件浮点处理单元,从而可提供原生浮点处理功能。

某些Piccolo 32位微处理器中的控制律加速器(CLA)能够为更丰富的应用提供浮点功能。

对于其他定点F28XX微处理器而言,IQ Math库允许浮点代码至IQ Math代码的快速转换,从而缩短从仿真到最终产品的开发时间。

定点处理器需要缩放及转(scaling and shifting)以保持计算的数字精度,而该IQ Math库免除了此类需求,并可充分利用C28x微处理器的32位架构优势。

IQ Math由C28X MCU编译器全面支持,并包含了数十种算法、三角法则以及数值转换函数等[4-5]。

TMS320C2000器件平台拥有业界领先的独特外设接口,不仅可显著改善系统性能,而且还能能大幅提高灵活性。

(1)TMS320C2000微处理器平台可支持多达16条模拟输入通道,其12位ADC采样速率高达12.5MSPS,堪称业界最快的嵌入式ADC;(2)基于32位定时器的增强型捕获单元可实现高精度传感及更高灵活性;(3)高分辨率的PWM生成器可为300MHz Delfino器件提供最高150ps以及最低56ps的精度,从而能够控制电源电子产品实现无与伦比的高精度。

(4)全面可编程的跳变区检测(trip-zone detection)与死时生成器(dead-time generator)能针对故障与浪涌电流情况提供全面的系统保护。

图 1 TMS320C2000系列的功能结构图三 TMS320C5000系列DSPTMS320C5000是一个低功耗高性能,16位定点,速度40~200MIPS的DSP器件。

其中,TMS320C5000包括旧有的C5x、当前主流的C54x和最新的C55x。

主要用途是有线和无线通信、IP、便携式信息系统、寻呼机、助听器等[6]。

C55x和C54x源代码兼容,而C5x和C2x源代码兼容。

C54x关注于低功耗,而C55x 则将低功耗提到一个新水平:300MHz的C55x和120MHz的C54x相比,性能提高5倍,而功耗则降到六分之一。

尽管C5x还在全线生产,但公司已经将新设计转向C54x 和C55x。

C54x 和C55x采用改进的哈佛结构。

C55x 具有12组独立的总线,而C54x则有8组。

它们都有一组程序总线和相应的程序地址总线。

C54x总线的宽度为16-bit,而C55x总线的宽度为32-bit。

C55x有三组数据读总线和两组数据写总线,而C54x有两组数据读总线和一组数据写总线。

每组数据总线都有其相应的地址总线。

C55x的数据地址总线的宽度为24-bit,而C54x的数据地址总线的宽度为16-bit。

C54x使用两个辅助寄存器算术单元,在每个周期内产生一个或两个数据存储器地址。

这四组内部总线和两个地址发生器使其可以进行多操作数运算[7]。

C55x的地址-数据流单元(ADFU)包含了专门的硬件来管理五组数据总线。

该ADFU 也可以作为通用的16-bit ALU,用于简单的算术运算。

该ALU从指令缓冲单元(IU)接收立即数,和存储器、ADFU寄存器、数据计算单元(DCU)寄存器、程序流单元(PFU)寄存器作双向通信。

无论是ALU,还是三个地址寄存器ALU(ARAU)中的一个,都可以修改作间接寻址的九个地址寄存器。

这三个ARAU为C55x的三组数据读总线提供独立的地址。

这种并行性保证了在每个CPU周期内DCU去读两个16-bit的操作数和一个16-bit的系数。

C55x的DCU包含了两个MAC单元,在单周期内作两个17217-bit的MAC运算。

它还包含了一个40-bit的ALU和四个40-bit的累加器寄存器、一个桶型移位器、以及专门的Viterbi 算法硬件。

每个MAC单元包含一个乘法器和带32-或40-bit饱和逻辑的加法器。

三个数据读总线将两个数据流和一个公共系数流送给两个MAC单元。

用户可以用ALU作32-bit的运算,或分开作两个16-bit的运算。

除开接受从DCU的40-bit Acc寄存器来的输入外,ALU还从IU接受立即数,并和存储器、ADFU寄存器、PFU寄存器作双向通信。

C54x是单17217-bit MAC机器,有一个40-bit的加法器、两个40-bit的Acc和一个分开的40-bit的ALU。

与C55x相类似,C54x的ALU也可以作成两个16-bit的配置,完成两个单周期运算。

乘法器输出处的40-bit的加法器允许作非流水的MAC运算,以及并行的两个加法和乘法。

单周期归一化和指数编码支持浮点数运算。

两个系列的结构都支持一个桶型移位器,将40-bit的Acc的值左移或右移最多达31bit。

该桶型移位器将移位后的值送给DCU的ALU,以便作进一步的运算。

指令集中关于二操作数、三操作数和32-bit操作数的指令,支持结构的并行性。

八个可以独立寻址的辅助寄存器和软件堆栈提高了C编译器的效率。

C55x可以执行可变长度的指令,这和C54x有显著的不同。

C54x的指令长度为固定的16-bit,而C55x的指令长度则从8到48 bit。

C55x的IU缓存64 byte的代码,且有一个解码逻辑来确认可变长度指令中各指令的区别。

局部循环指令使用指令缓冲队列来循环执行代码块。

指令缓冲队列还可以在执行条件程序流控制指令的条件测试时,推测性地提取指令。

指令解码器按排列顺序对指令解码,而不是执行动态时序,从而可以在预定的时间得到结果。

C55x的PFU跟踪程序的执行点,并为多达16Mbyte的程序存储器产生24-bit的地址。

该单元的硬件,可用于循环、灵活性转移、条件执行、以及流水保护。

单独的程序计数器可以保证从子程序或中断服务子程序快速返回。

该PFU还包括管理指令流水和四个CPU状态寄存器的逻辑。

它以硬件方式可以提供四层块循环嵌套。

其硬件还支持条件循环。

PFU处理流水控制冒险,并对读后写及写后读提供保护。

当在指令流中这种冒险发生时,流水保护逻辑就插入一些周期,保证程序的正确执行。

集成的软件等待状态发生器使用户可以使用较慢的外部存储器。

该系列的所有DSP都支持片内双访问RAM(DARAM),用户可以将其配置为程序存储器或数据存储器。

C55x还有扩展的同步突发性RAM、同步DRAM和异步SRAM及DRAM。

片内的锁相环(PLL)允许用户抑制时钟,但C55x核还可以激活与自动管理片内外设和存储器的功耗。

当程序不再访问片内存储器时,它们就会被切换到低功率模式。

处理器对片内外设也提供类似的控制。

C55x还设置了用户可控的低功率IDLE域,包括CPU、DMA、外设、外部存储器接口、指令队列、以及时钟发生电路[8]。

图2 C54x功能结构图图3 TMS320C54x的总线结构四 TMS320C6000系列DSPTI的TMS320C6000是基于超长指令字(VLIW)结构的通用DSP系列。

该结构包括定点的C62x、浮点的C67x和新的C64x。

C64x和C62x代码兼容,但结构有显著的加强,其初期的工作频率可达750MHz。

相关文档
最新文档