用定点DSP处理器实现浮点DSP仿真

合集下载

DSP入门教程(非常经典)

2)对于 C3x 系列：硬件等待信号为/RDY，低电平是不等待。软件等待由总线控制寄存器中的 SWW 和 WTCNY 决定，可以加入最多 7 个等待，但等待是不分段的，除了片内之外全空间有效。
3)对于 C5000 系列：硬件等待信号为 READY，高电平时不等待。软件等待由 SWWCR 和 SWWSR 寄存器决定，可以加入最多 14 个等待。其中程序存储器、控制程序存储器和数据存储器及 I/O 可以分别设置。
4）地址译码、IO 扩展等用 CPLD 或者 FPGA 来做，将 DSP 的地址线、数据线、控制信号线如 IS/PS/DS 等都引进去有利于调试
5、如何高效开始 TI DSP 的软件开发如果你不是纯做算法，而是在一个目标版上进行开发，需要使用 DSP 的片上外设，需要控制片外接口电路，那么建议在写程序前先好好将这个目标版的电路设计搞清楚。最重要的是程序、数据、I/O 空间的译码。不管是否纯做算法还是软硬结合， DSP 的 CPU,memory,program memory addressing, data mem.ory addressing 的资料都需要看.
1）看 CCS 的使用指南
2）明白 CMD 文件的编写
3）明白中断向量表文件的编写，并定位在正确的地方
4）运行一个纯 simulator 的程序，了解 CCS 的各个操作
5）到 TI 网站下相关的源码，参考源码的结构进行编程
6）不论是 C 编程还是 ASM 编程，模块化是必须的
6、选择 C 还是选择 ASM 进行编程记住一条原则，TI 的工程师在不断改进 CCS 的 C 程序优化编译器，现在 C 优化的效率可达到手工汇编的 90％甚至更高。当然有的时候如果计算能力和内存资源是瓶颈，ASM 还是有优势，比如 G.729 编解码。但是针对一般的应用开发，C 是最好的选择。新手编程则选择 C 和汇编混合编程更有利一些

DSP解密

DSP解密DSP芯片，也称数字信号处理器，是一种具有特殊结构的微处理器。

DSP芯片的内部采用程序和数据分开的哈佛结构，具有专门的硬件乘法器，广泛采用流水线操作，提供特殊的DSP指令，可以用来快速的实现各种数字信号处理算法。

DSP解密又叫单片机解密，DSP芯片解密，DSP IC 解密，就是指DSP解密攻击者凭借专用设备或自制设备，利用单片机设计上的漏洞或软件缺陷，通过多种专业技术手段，直接提取加密单片机中烧写文件的关键信息，并可以自己复制烧写芯片或反汇编后自己参考研究。

DSP芯片特点根据数字信号处理的要求，DSP芯片一般具有如下的一些主要特点：（1）在一个指令周期内可完成一次乘法和一次加法。

（2）程序和数据空间分开，可以同时访问指令和数据。

（3）片内具有快速RAM，通常可通过独立的数据总线在两块中同时访问。

（4）具有低开销或无开销循环及跳转的硬件支持。

（5）快速的中断处理和硬件I/O支持。

（6）具有在单周期内操作的多个硬件地址产生器。

（7）可以并行执行多个操作。

（8）支持流水线操作，使取指、译码和执行等操作可以重叠执行。

与通用微处理器相比，DSP芯片的其他通用功能相对较弱些。

DSP芯片算法DSP芯片的算法有多种。

绝大多数的DSP处理器使用定点算法，数字表示为整数或-1.0到+1.0之间的小数形式。

有些处理器采用浮点算法，数据表示成尾数加指数的形式：尾数×2指数。

浮点算法是一种较复杂的常规算法，利用浮点数据可以实现大的数据动态范围(这个动态范围可以用最大和最小数的比值来表示)。

浮点DSP（字宽为32位）在应用中，设计工程师不用关心动态范围和精度一类的问题。

浮点DSP比定点DSP（字宽为16位）更容易编程，但是成本和功耗高。

所以，一般批量产品选用定点DSP。

编程和算法设计人员通过分析或仿真来确定所需要的动态范围和精度。

如果要求易于开发，而且动态范围很宽、精度很高，可以考虑采用浮点DSP。

也可以在采用定点DSP的条件下由软件实现浮点计算，但是这样的软件程序会占用大量处理器时间，因而很少使用。

基于定点dsp的自然对数运算快速算法

关键词：定点 DSP；自然对数；快速算法
中图分类号：TP312 文献标识码：A
文章编号：1009-3044(2019)31-0294-02
开放科学(资源服务)标识码(OSID)：
1 背景
DSP 芯片采用特殊设计的哈佛结构，用来实现各种数字信号处理算法[1]。按照 DSP 芯片工作的数据格式来分类，DSP 芯片可分为定点 DSP 和浮点 DSP。 TI 公司的 TMS320C54X, TMS320C55X、TMS320C671x 等系列的 DSP 芯片属于定点 DSP 芯片，由于这类 DSP 芯片运行功耗低，在现代的电子系统设计中还在广泛采用。在数字信号处理运算过程中，取自然对数时一种常用的运算，但定点 DSP 由于没有浮点乘法器，所以在进行该运算时运算速度较慢，无法满足对运行时间要求严格的场合。本文分析了浮点数据的存储格式，运用对数基本运算规则，提出一种快速取对数的算法并用 C 语言进行了仿真实现。
0.210853365, 0.219125891, 0.227243782, 0.235212711,
0.243038049, 0.250724877, 0.258278015, 0.265702033,
0.273001272, 0.280179857, 0.287241711, 0.294190571
};
float Qlog10(float x)
{Int *ptr, decim ,index;
ptr = (int *)&x;
index =(*ptr>>23)-127;
//获取指数
decim =((*ptr>>18) & 0x1f); //截取 5 位尾数

DSP技术总结

DSP技术知识要点(电信)CHAP11、冯、诺依曼结构和哈佛结构的特点冯、诺依曼结构：该结构采用单存储空间，即程序指令和数据共用一个存储空间，使用单一的地址和数据总线，取指令和取操作数都是通过一条总线分时进行。

当进行高速运算时，不但不能同时进行取指令和取操作数，而且还会造成数据传输通道的瓶颈现象，其工作速度较慢。

哈佛结构：该结构采用双存储空间，程序存储器和数据存储器分开，有各自独立的程序总线和数据总线，可独立编址和独立访问，可对程序和数据进行独立传输，使取指令操作、指令执行操作、数据吞吐并行完成，大大地提高了数据处理能力和指令的执行速度，非常适合于实时的数字信号处理。

2、DSP芯片的特点（为何适合数据密集型应用）采用哈佛结构；采用多总线结构；采用流水线技术；配有专用的硬件乘法-累加器；快速的指令周期3、定点DSP芯片和浮点DSP芯片的区别及应用特点若数据以定点格式工作的——定点DSP芯片。

若数据以浮点格式工作的——浮点DSP芯片。

浮点DSP芯片，精度高、动态范围大，产品相对较少，复杂成本高。

但不必考虑溢出的问题。

用在精度要求较高的场合。

4、定点DSP的表示（Qm.n，精度和范围与m、n的关系）及其格式转换（1）数的总字长：m+n+11位符号位：最高位是符号位，0代表正数，1代表负数m表示数的2的补码的整数部分的位数n表示数的2的补码的小数部分的位数正数：补码=原码负数：补码=原码取反＋1（2）m越小，n就越大，则数值范围越小，但精度越高；m越大，n就越小，则数值范围越大，但精度越低。

（3）十进制转换成Qm.n形式:先将数乘以2^n 变成整数，再将整数转换成相应的Qm.n形式不同Qm.n形式之间的转换:不同Qm.n形式的数进行加减运算时，通常将动态范围小的数据格式转换成动态范围大的数据格式。

即n大的数据格式向n小的数据格式转换。

方法：将n 大的数向右移相差的位数，这时原数低位被移出，高位则进行符号扩展。

什么是DSP__DSP 处理器与通用处理器的比较

什么是DSP (2009-03-05 19:22:36)转载▼标签：it 分类：基础学堂DSP（digital singnal processor）是一种独特的微处理器，是以数字信号来处理大量信息的器件。

其工作原理是接收模拟信号，转换为0或1的数字信号，再对数字信号进行修改、删除、强化，并在其他系统芯片中把数字数据解译回模拟数据或实际环境格式。

它不仅具有可编程性，而且其实时运行速度可达每秒数以千万条复杂指令程序，源源超过通用微处理器，是数字化电子世界中日益重要的电脑芯片。

它的强大数据处理能力和高运行速度，是最值得称道的两大特色。

DSP芯片，也称数字信号处理器，是一种特别适合于进行数字信号处理运算的微处理器，其主机应用是实时快速地实现各种数字信号处理算法。

根据数字信号处理的要求，DSP芯片一般具有如下主要特点：（1）在一个指令周期内可完成一次乘法和一次加法；（2）程序和数据空间分开，可以同时访问指令和数据；（3）片内具有快速RAM，通常可通过独立的数据总线在两块中同时访问；（4）具有低开销或无开销循环及跳转的硬件支持；（5）快速的中断处理和硬件I/O支持；（6）具有在单周期内操作的多个硬件地址产生器；（7）可以并行执行多个操作；（8）支持流水线操作，使取指、译码和执行等操作可以重叠执行。

当然，与通用微处理器相比，DSP芯片的其他通用功能相对较弱些DSP 处理器与通用处理器的比较(2009-03-05 19:24:35)转载▼分类：基础学堂标签：it考虑一个数字信号处理的实例，比如有限冲击响应滤波器（FIR）。

用数学语言来说，FIR 滤波器是做一系列的点积。

取一个输入量和一个序数向量，在系数和输入样本的滑动窗口间作乘法，然后将所有的乘积加起来，形成一个输出样本。

类似的运算在数字信号处理过程中大量地重复发生，使得为此设计的器件必须提供专门的支持，促成了了DSP器件与通用处理器（GPP）的分流：1 对密集的乘法运算的支持GPP不是设计来做密集乘法任务的，即使是一些现代的GPP，也要求多个指令周期来做一次乘法。

DSP原理及应用-(修订版)--课后习题答案

第一章：1、数字信号处理的实现方法一般有哪几种？答：数字信号处理的实现是用硬件软件或软硬结合的方法来实现各种算法。

(1) 在通用的计算机上用软件实现；(2) 在通用计算机系统中加上专用的加速处理机实现；(3) 用通用的单片机实现，这种方法可用于一些不太复杂的数字信号处理，如数字控制；(4)用通用的可编程 DSP 芯片实现。

与单片机相比，DSP 芯片具有更加适合于数字信号处理的软件和硬件资源，可用于复杂的数字信号处理算法；(5) 用专用的 DSP 芯片实现。

在一些特殊的场合，要求的信号处理速度极高，用通用 DSP 芯片很难实现（ 6）用基于通用 dsp 核的asic 芯片实现。

2、简单的叙述一下 dsp 芯片的发展概况？答：第一阶段， DSP 的雏形阶段（ 1980 年前后）。

代表产品： S2811。

主要用途：军事或航空航天部门。

第二阶段， DSP 的成熟阶段（ 1990 年前后）。

代表产品： TI 公司的 TMS320C20主要用途：通信、计算机领域。

第三阶段， DSP 的完善阶段（ 2000 年以后）。

代表产品：TI 公司的 TMS320C54 主要用途：各个行业领域。

3、可编程 dsp 芯片有哪些特点？答： 1、采用哈佛结构（ 1）冯。

诺依曼结构，（ 2）哈佛结构（ 3）改进型哈佛结构2、采用多总线结构 3.采用流水线技术4、配有专用的硬件乘法-累加器5、具有特殊的 dsp 指令6、快速的指令周期7、硬件配置强8、支持多处理器结构9、省电管理和低功耗4、什么是哈佛结构和冯。

诺依曼结构？它们有什么区别？答：哈佛结构：该结构采用双存储空间，程序存储器和数据存储器分开，有各自独立的程序总线和数据总线，可独立编址和独立访问，可对程序和数据进行独立传输，使取指令操作、指令执行操作、数据吞吐并行完成，大大地提高了数据处理能力和指令的执行速度，非常适合于实时的数字信号处理。

冯。

诺依曼结构：该结构采用单存储空间，即程序指令和数据共用一个存储空间，使用单一的地址和数据总线，取指令和取操作数都是通过一条总线分时进行。

dsp应用系统设计流程

DSP应用系统设计流程：有以下几步：(1)确定系统性能指标；（2）核心算法模拟和验证；（3）选择DSP芯片及其他系统组件；（4）硬件设计和调试；（5）软件设计和测试；（6）系统测试、集成。

芯片选择：芯片选择要注意几个因素：（1）预算速度；（2）算法格式和数据宽度；（3）存储器；(4)功耗；（5）开发工具。

DSP芯片选择中通常有下列几条应注意的：（1）精度：表数格式（定点或浮点），通常可以用定点器件解决的问题，尽量用定点器件，因为它经济、速度快、成本低，功耗小。

但是在编程时要关注信号的动态范围，在代码中增加限制信号动态范围的定标运算。

（2）字长的选择：一般浮点DSP芯片都用32位的数据字，大多数定点DSP芯片是16位数据字。

而MOTOROLA公司定点芯片用24位数据字，以便在定点和浮点精度之间取得折中。

字长大小是影响成本的重要因素，它影响芯片的大小、引脚数以及存储器的大小，设计时在满足性能指标的条件下，尽可能选用最小的数据字。

（3）存储器安排：包括存储器的大小，片内存储器的数量，总线寻址空间等。

片内存储器的大小决定了芯片运行速度和成本，例如TI公司同一系列的DSP芯片，不同种类芯片存储器的配置等硬件资源各不相同。

（4）开发工具：在DSP系统设计中，开发工具是必不可少的，一个复杂的DSP系统，必须有功能强大的开发工具支持。

开发工具包括软件和硬件两部分。

软件开发工具主要包括：C编译器、汇编器、链接器、程序库、软件仿真器等，在确定DSP算法后，编写的程序代码通过软件仿真器进行仿真运行，来确定必要的性能指标。

硬件开发工具包括在线硬件仿真器和系统开发板。

在线硬件仿真器通常是JTAG周边扫描接口板，可以对设计的硬件进行在线调试；在硬件系统完成之前，不同功能的开发板上实时运行设计的DSP软件，可以提高开发效率。

甚至在有的数量小的产品中，直接将开发板当作最终产品。

（5）功耗与电源管理：在一些手提便携式的消费类电子产品中，供电电源的节省是很重要的问题，因而目前DSP生产厂商越来越重视这方面。

IQmath的应用

IQmath库的定点DSP算法设计引言DSP数字信号处理器DSP数字信号处理器是一个实时处理信号的微处理器，分为定点和浮点两种基本类型，它们之间最大差异在于浮点DSP比定点DSP具有更强大的计算能力和更大范围的动态精度。

浮点DSP内部设有专门支持浮点运算的硬件单元，对浮点格式的数据可以直接通过代码加入硬件运算中，因此运算速度很高。

而定点DSP没有定点运算单元，它对浮点格式的实数必须通过软件才能实现，这样就增加了指令代码，间接地使得定点DSP运算速度低于浮点DSP，典型的浮点处理器，如TI公司的C6000系列，几乎所有的嵌入式微控制器都为定点处理器，如TI公司的C2000系列。

因为浮点DSP的价格更加昂贵，因此定点DSP仍然有其巨大的优势。

但是任何算法都需要进行浮点运算，因此如何提高在定点DSP 上进行的浮点运算的速度和精度，就成为了用户开发时必须要考虑的关键问题。

TI公司专门为定点处理器TMS320C2000系列提供的IQmath库为解决上述问题提供了良好的实现方法。

数字信号处理（Digital Signal Processing，简称DSP）是一门涉及许多学科而又广泛应用于许多领域的新兴学科。

20世纪60年代以来，随着计算机和信息技术的飞速发展，数字信号处理技术应运而生并得到迅速的发展。

在过去的二十多年时间里，数字信号处理已经在通信等领域得到极为广泛的应用。

数字信号处理是利用计算机或专用处理设备，以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理，以得到符合人们需要的信号形式。

1 数的定标：Q格式有符号数的表示法，机器数（出现在电脑的二进位数值）有3个特点，无符号或符号转换成数值来表示，没有+10101这样的资料，而是以010101来表示，只表示单纯的整数或小数，小数点的位置预设在一定的位置而较少变动，它的长度受到电脑硬体的限制，而不能无限增长。

Q格式，就是将一个小数放大若干倍后，用整数来表示小数定点DSP不能直接处理小数，编程时处理小数有3种方法：①把变量定义成float类型。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

用定点DSP处理器实现浮点DSP仿真
作者：61IC 文章来源：本站原创点击数：1454 更新时间：2005-8-30
DSP处理器可以分为两大类：定点和浮点。

一般说来，先进的定点DSP家族速度快，功耗低，价格也便宜；而浮点DSP则计算精确，动态范围大。

设计师在设计DSP时，如果对于设计的应用仅仅要求它具备很少的浮点功能时，则往往陷入了十分尴尬的困境，通常的解决办法是勉强采用价格高的浮点DSP设计。

然而现在，由于定点处理器可以运行在相当高的时钟速度，因此可以仿真浮点的运算。

这时设计师可以牺牲浮点的计算效率来换取较低的成本和较小的功耗。

这样的设计，虽然并不能适应真正的浮点应用；但是却给设计师提供了一个难得的机会，使他们能够从尴尬的困境中解脱出来。

在表达固定小数点数字时，小数点位置的确定决定于究竟是准备采用分数运算，还是整数运算。

如何选择小数点的位置，将直接影响数值运算是否简单，存储器需求的多寡；也表现为是在数值的动态范围与数值精度之间的一种折衷选择。

如果所表达的数值既要求动态范围宽广，又要求数值的精度十分精确，最好选择小数点的位置可以根据数值的大小进行移动的表达方式。

浮点数由指数部分和尾数部分组成，既可以表达很大的数值，也可以表达数值很小的数。

而浮点数的指数与尾数部分，则可以分别用定点数格式来表示。

规格化了的浮点数不包含额外的符号位，也就是说所有的字符位都是有效位。

规格化后的数字，对于一定的位数，可以实现最充分的利用。

规格化以后还可以简化两个数值的比较运算。

对于指数不同的数值，指数大的数，数值大；对于指数相同的数，才需要比较尾数的大小。

绝大多数的运算程序都假定输入和输出都是规格化的数。

在应用定点DSP进行仿真浮点计算时，究竟是采用完整的IEEE-754格式，还是采用非IEEE兼容的格式，需要根据在计算时首先考虑数值的动态范围，还是首先考虑数值的精度来决定。

有时还需要采用双精度浮点模式才能满足要求。

可以通过C/C++语言或者汇编语言来调用。

这些程序库应用定点逻辑进行浮点的仿真运算。

为了简化计算，有时使用修改后的IEEE-754更方便。

这样可能降低运算周期达10倍之多。

应用定点DSP进行浮点计算的算法
Blackfin DSP的寄存器堆包(file)含有16个16-bit寄存器，也可以把它当作8个32-bit寄存器来使用。

有两个计算单元，数据寄存器堆可以存放32-bit数据。

整套的算术计算和逻辑运算指令集都支持仿真浮点计算，非IEEE格式；也支持可以显著简化计算要求的多重精度的定点表示方法。

为了能够充分利用DSP的寄存器堆包资源，仿真浮点计算程序可以使用双字格式，即用一个16-bit字表示指数，另一个16-bit字表示尾数。

两个字都使用带符号位的2的补码表示法。

DSP的体系结构，除了可以将16-bit与32-bit寄存器结合使用以外，还包括有可以简化浮点运算算法的特殊指令：SIGNBITS指令，是将数的符号位返还给该数值。

实际是直接传给ASHIFT，而ASHIFT则可以移动小数点的位置，将尾数格式化。

可以将一个定点数变化为一个浮点数。

变化的方法是：首先通过确定符号位数，再将小数点按照符号位数移动，然后再将尾数格式化。

反之，一个浮点数也可以通过移动尾数的小数点位置，来变换成为定点数。

小数点移动的位数就是符号位的位数。

可以采用下述方法，实现浮点数的加法：以两个数中具有较大指数的指数作为和数的指数；向右移动比较小的数的尾数，移动的位数等于两个数的指数的差；将尾数相加，得到和数的分数部分；将和数格式化。

两个用浮点格式表示的数，进行乘法运算时，比进行加法运算更简单。

因为不需要将两个数的小数点位对齐。

乘法的运算算法如下所述：将两个数的指数相加；将两个数的尾数相乘，即为乘积数的分数部分；将乘积数格式化。

浮点的乘/累加过程则是先依次求两个操作数的积，累计求N次，再计算其总和。

可以首先重复调用浮点乘法程序，再调用加法程序。

但是如果使用乘/累加程序函数，则由于省去了内务开销而更有效率。

乘/累加算法可以按以下的方式实现：先求第一组两个操作数的乘积，并对此积进行规格化；取第二组操作数，求乘积，再对其进行规格化；将求得的积，和累加的和进行比较，对其中的积，或累加的和进行移位，使小数点对齐；将这个乘积，和累加的和相加，并对求得的结果进行规格化；重复进行第2到第4过程，一直到将全部操作数都进行完毕为止。

双倍精度，定点表示方法
对于许多应用场合，16-bit定点数据的精度显得有些不够；而因此就采用浮点仿真运算则又感觉到计算量太大。

在这种情况下，如果采用扩展精度的定点仿真运算则能满足系统的要求。

使用高速定点DSP可以保证显著地节省所需要进行的处理过程。

扩展精度的数值，可以使用31-bit或者32-bit定点格式表示。

对于16-bit的定点DSP处理器，可以很容易地使用软件来进行扩展，以便进行32-bit的算术计算。

如果处理器的32-bit寄存器组可以当作两个16-bit的半字来进行访问时，结合起来使用，就可以表示一个32-bit 的定点数值。

Blackfin处理器的硬件组成可以在单周期内实现32-bit的加法；32-bit的乘法则可以通过执行一个指令来实现，但是需要经过5个时钟周期。

当进行多次32-bit乘，再累加求和时；如果使用16-bit数相乘，要求结果的精度达到32-bit，则只需要3个时钟周期。

而仅要求达到31-bit精度时，则只需要2个时钟周期。

这个技术对于高档的音响系统特别具有吸引力。

因为这些音响系统至少需要24-bit精度。

如果使用每一位6db的规则，16bit的记录可以具有96db的动态范围，而24-bit的定点运算则可以将动态范围提高到144 db。

最低有效位半字的乘积对于最后结果的影响不大。

事实上，如果将结果截取到1.31，这样，其结果只影响到最低有效位。

对于许多应用场合，精度的损失不大，所换来的计算速度的提高却是很高的。

与32-bit乘法相比，可以省去一次16-bit的乘，一次移位，和一次加法运算。

现在的定点DSP处理器由于性能的提高，已经可以在某些应用场合进行仿真的浮点运算，从而达到系统的要求，而不必采用浮点DSP处理器了。

设计师可以根据实际的要求，在动态范围与计算精度之间取得合理的平衡，以便决定究竟是选择浮点DSP处理器，还是选择扩展精度的定点处理器。

这样设计师可以有更广的空间，来控制掌握DSP处理器的实现方案。

■。