基于TMS320C6678 DSP的程序优化技术的研究

合集下载

TMS320C6678多核DSP的加载配置和实现方法

TMS320C6678多核DSP的加载配置和实现方法

TMS320C6678多核DSP的加载配置和实现方法邓豹【期刊名称】《航空计算技术》【年(卷),期】2017(047)001【摘要】The software code correct programming ,loading and operating is the foundation of multicore dsp application.The paper gives analysis to the DSP′s BootLoader and the code loading process.Taking the multicore DSP TMS320C6678 as an example,the article introduces the configuration management mode and processing flow of the multicore dsp,and detailed describes the EMIF16 boot implement ways used Nor FLASH.With these ways can be achieved correct and reliably software operating.%程序代码正确的固化加载运行是多核DSP应用的前提和基础.简要介绍了DSP的加载器和加载过程,阐述了多核处理器件的加载配置管理方法.以TI公司的多核DSPTMS320C6678为例,介绍了多核DSP的加载模式和流程,详细阐述了EMIF16的Nor FLASH加载实现方法,可以实现多核DSP软件的正确、可靠加载运行.【总页数】5页(P107-111)【作者】邓豹【作者单位】中航工业西安航空计算技术研究所,陕西西安 710068【正文语种】中文【中图分类】TP368.1【相关文献】1.基于TMS320C6678的多核程序加载研究与实现 [J], 李飞平;卿粼波;滕奇志;舒君;何小海2.TMS320C6678多核DSP的核间通信方法 [J], 吴灏;肖吉阳;范红旗;付强3.基于TMS320C6678的多核DSP加载模式研究 [J], 张乐年;关榆君4.基于TMS320C6678的多核DSP上电加载技术 [J], 刘章文;刘七华;谢川林;袁学文5.TMS320C6678多级程序加载模式的实现 [J], 杨舟;吉沛琦因版权原因,仅展示原文概要,查看原文内容请购买。

基于TMS320C6678的多核DSP上电加载技术

基于TMS320C6678的多核DSP上电加载技术

基于TMS320C6678的多核DSP上电加载技术
0 引言
在视频检测、医疗影像及红外图像快速跟瞄系统应用中,越来越复杂的二维、三维甚至四维的图像处理,需要并行化的处理系统,并能够运行复杂的算法。

要实现这些复杂的系统,高端FPGA+高性能DSP是目前普遍采
用的方案,而单个DSP的性能已发展至极限,所以解决复杂的并行算法,多核DSP是现在发展的全新方向,其中多核DSP的根加载技术是其难点之一。

TI公司推出的DSP芯片TMS320C6678(C6678)具有8个内核的高性能DSP,每个内核工作频率均达1 GHz。

其支持的Boot 模式有SPI、I2C、EMAC、SRIO 和并口Emif16 NOR-FLASH。

其中Emif16 NOR-FLASH模式是不用上位机参与、比较简单、独立成系统的一种,大多独立DSP系统采用该方式。

网上能搜索到关于C6472和C6678零星一些加载资料,都是借助于。

基于多片TMS320C6678的程序交互机制设计

基于多片TMS320C6678的程序交互机制设计

交互层次之间的互联,提高整个系统通信的灵活性,
系统将 4 个处理器的所有 32 个核心进行统一编号,设
置 为 全 局 核 号 ,用 g_globalCoreID 表 示 ,并 且 用 g_
globalCoreID 对 8 取整得到各处理器的 SRIO 端口号,
这样由一个全局核号即可知道对应于哪一个 DSP 的
shared variables,and the communication of each thread in the core is realized through semaphore. In order
to verify the practicability and efficiency of the mechanism,a signal processing experiment of large amount
Core_0 根据目的核全局核号 g_globalCoreID,计算其
所 处 SRIO 端 口 号 ,加 之 传 输 变 量 的 源 地 址 addrSur
与目的地址 addrDest 进行 SRIO 数据传输,将源处理
器共享内存中的相应变量传输到目的处理器共享内
存 中 。 SRIO 数 据 发 送 之 后 源 处 理 器 Core_0 发 送
技术,
主要解决了嵌入式系统中板卡与板卡、
芯片与芯
片之间的高速数据交换的问题[11-12]。TMS320C6678 的
SRIO 支 持 两 种 数 据 传 输 机 制 :DirectIO 和 Message,
其 中 DirectIO 模 式 适 合 大 数 据 量 传 输 ,因 此 通 信 采
用 DirectIO 模 式 ,在 SRIO 进 行 传 输 时 ,需 要 对 SRIO

基于TMS320C6678的国产DSP操作系统引导程序设计

基于TMS320C6678的国产DSP操作系统引导程序设计
某 些 特 定 领 域 对 多 节 点 DSP 的加 载 时 间 有 特 殊 要 求 , 如 多 个 节 点 (64或 128个 ) 同 时加 载 , 必 须 在 很 短 的 时 间 内通 过 网络 将 操 作 系 统 完 全 加 载 成 功 , 并 且 达 到 可 用 状 态 。 实 验 结果表 明,RBOOT可 以用并行化 的方式从 TFTP服 务 器 加 载 程 序 , 完 全 满 足 多节 点 同 时 加载 的性能指标。
BOOTMODE[I2:0]用 于 引 导 方 式 的 设 置 。 上 的高 性 能 国产 基 础 软 件 解 决 方 案 , 其 内 核 完 全
电后 ,内核 0执行 RBL代码 ,并采样这 13个 自主 设 计 ,并 针对 TI公 司 TMS320C6678芯
引 脚 的 状 态 , 决 定 采 用 哪 种 引 导 方 式 。 管脚 配 片 进 行 了系 统 优 化 。
启 动 其 它 DSP节 点 是 一 种 非 常 高 效 的 引 导 方
本 文 的 引 导 是 针 对 于 带 有 操 作 系 统 的 镜
式 。
像 ,操 作系 统选用 国产 的锐 华 DSP实时操 作
TMS320C6678芯 片 有 13个 外 部 引 脚 系 统,该操 作系统提 供 了面 向主 流 DSP芯片
2 DSP启 动 方 式
RBL是 固化 在 DSP内 部 的 一 段 程 序 ,非 常精简 ,但是 无法直 接对 ELF格 式 的文件进 行解析 。为 了实现镜 像 的加载 ,必须通 过 TI 提 供 的一系列 的工 具将 ELF文件 转换 成特定 的格式,而 且不同接 口转换后 的格 式也不尽相 同 , 例 如 通 过 网 络 、SPI、 I2C、EMIF等 加 载 必须通过不同的方法完成转换 ,通用性极差 。

基于TMS320C6678的通用嵌入式软件开发平台的研究

基于TMS320C6678的通用嵌入式软件开发平台的研究

基于TMS320C6678的通用嵌入式软件开发平台的研究殷耀文(昆山登云科技职业学院,江苏昆山215300)[摘要]论述了基于TMS320C6678DSP通用嵌入式软件开发平台构建过程,从时钟、外设、资源分配三个维度的构建进行论述。

通用嵌入式软件平台具有高度集成性、通用性、可扩展性。

平台的构建成功为使用此款DSP开发的人员提供了极大的便利性。

[关键词]TMS320C6678;通用嵌入式软件开发平台;外设;时钟;资源[中图分类号]TP319[文献标志码]A[文章编号]2096-0603(2019)12-0158-02TMS320C6678是德州仪器公司研发的一款高性能定点计算和浮点计算数字信号处理器(DSP),基于TI 的KeyStone多核体系结构,集成了八个C66X CORIPAC DSP,每个DSP的主频为1~1.25GHz,最高能达到10GHz 主频。

该DSP功耗低,支持高性能信号处理应用,广泛应用于机器视觉领域、通信、雷达领域、嵌入式分析领域、高端机床领域、多媒体领域、成像领域和计算机处理等领域。

一、概述由于该DSP高速外设较多,主要有SRIO、PCIe、HyperLink、Gigabit Ethernet、64-Bit DDR3、EMIF、UART。

如此多的外设加上时钟、电源、存储资源划分的配置,通常情况下,都是按需选取一两种外设进行开发使用。

笔者结合多年的嵌入式软件开发工作经验,借鉴软件无线电的思想,将众多的外设、时钟配置、RAM存储资源整合在一个通用的软件开发平台上。

本文将重点论述构建此平台的过程。

构建此平台的核心思想是追求通用性与易用性,能确保使用此款DSP芯片的开发者不用关心芯片的各种外设和使用细节,开发者所要做的只是在这个平台上部署自己的编程逻辑,通过与各种封装好的函数来操控DSP,平台达到了封装DSP硬件细节的作用,通过在实际项目过程中的实际应用,极大地简化了发者的开发过程。

基于TMS320C6678核相关滤波器跟踪算法实现及改进

基于TMS320C6678核相关滤波器跟踪算法实现及改进
(School of Electronics and Information Engineering,Sichuan University,Chengdu 610064,China)
Abstract: Object tracking has become an important branch of computer vision eu ̄enf ly.In recent year s,because the tracking al—
做 了 改 进 ,提 出 了一 种 尺 度 更 新 算 法 以 及 目标 跟 踪 丢 失 后 由粗 到 精 的 重 定 位 算 法 , 最 后 算 法 在 8核 DSP 处 理 器
TMS320C6678上 成 功 实 现 了移 植 。 通 过 多核 并 行 处 理 ,达 到 30帧 /s的 实 时 跟 踪 帧 率 。
gorithm with kernel correlation filter rises the properties of circulant matr ix.the main operation is element—wise product in the fre— quency domain. It achieved the great performance and speed than the previous tracking a lgor ithm .However,when the target size changes and the target is seriously blocked, it couldn ’t track accurately. Based Of the above reasons, a scale updating algorithm and acoarse—to—fine target relocation algorithm are proposed to improve the KCF algor ithm .The algor ithm is transplanted on the eight—core DSP processor TMS320C6678 successfully.Through multi—core parallel processing.it achieved 30  ̄ames/s real—time tracking fram e rate. Key words:kernel correlation filter;scale update;target relocation;TMS320C6678

基于TMS320C6678的多核程序加载研究与实现

基于TMS320C6678的多核程序加载研究与实现

基于TMS320C6678的多核程序加载研究与实现
李飞平;卿粼波;滕奇志;舒君;何小海
【期刊名称】《电子技术应用》
【年(卷),期】2015(041)003
【摘要】针对多核DSP系统程序加载复杂的问题,基于TMS320C6678对多核程序加载进行了研究与设计.从一级引导程序出发,设计并优化了多核程序内容存储格式.设计了简洁的二级引导程序,以修正一级引导程序只识别主核程序入口地址,而从核入口地址缺失的现象.为了快速生成特定格式的多核程序内容,设计了多个工具用于添加SPI启动参数表、DDR3启动表、从核程序入口地址以及完成程序内容格式的转换.实现了SPI Flash多核程序加载以及基于I2C主模式的Nand Flash多核程序加载.
【总页数】4页(P31-34)
【作者】李飞平;卿粼波;滕奇志;舒君;何小海
【作者单位】四川大学电子信息学院,四川成都610064;四川大学电子信息学院,四川成都610064;四川大学电子信息学院,四川成都610064;四川大学电子信息学院,四川成都610064;四川大学电子信息学院,四川成都610064
【正文语种】中文
【中图分类】TP368
【相关文献】
1.基于TMS320C6678的多核DSP加载模式研究 [J], 张乐年;关榆君
2.基于DSP的动态程序加载的研究与实现 [J], 李鹏;张营;陈立锋;吕永田
3.基于TMS320C6678的多核DSP上电加载技术 [J], 刘章文;刘七华;谢川林;袁学文
4.基于PC总线的HOST/DSP系统大型程序加载方法研究与实现 [J], 刘小勇;黄一川;施仁
5.基于DSP在线程序加载的研究与实现 [J], 祖文祥;丁劲涛
因版权原因,仅展示原文概要,查看原文内容请购买。

基于TMS320C6678 DSP的雷达数字信号处理软件设计

基于TMS320C6678 DSP的雷达数字信号处理软件设计

50 | 电子制作 2021年06月复杂的算法,但同时也要满足实时性要求。

在现阶段,雷达信号处理的架构大都是采用FPGA+DSP 的方式,FPGA 主要负责中频信号的采集、波束形成、脉冲压缩等算法逻辑操作,而DSP 主要负责实现MTI、MTD、CFAR、杂波图等较复杂的算法。

TMS320C6678 DSP 作为业界目前最先进的多核DSP、一共集成了8个核,每个内核有512Kbyte 的核内L2数据存储区、32KByte 的L1D 数据存储区和 32KByte 的L1P 程序存储区,片上集成了4MByte 的共享存储区,支持RapidIO 高速数据传输、支持外围扩展DDR3存储器,支持片内多核间EDMA 硬件传输数据 最高主频达到了1.25GHz,同时还提供了丰富的软件库函数,如算术操作库、数字信号处理库、图像库等,丰富的硬件与软件资源为其成为雷达信号处理的平台提供了保障。

1 雷达软件结构在某低慢小目标探测雷达设计中,雷达采用方位上360度机械扫描、俯仰上发射宽波束,接收上通过数字波束合成形式形成多个俯仰指向的多波束完成对俯仰空域的覆盖。

雷达的软件结构如图1所示。

雷达软件主要包含DBF (数字波束形成)软件、信号处理软件、数据处理软件、操控终端软件。

其中DBF 软件主要对雷达天线接收的回波信号进行数字采样,并且下变频到中频信号,最后通过形成多个指向的数字波束数据,并将数据传输到信号处理软件,信号处理软件主要完成脉冲压缩、相参积累与点迹检2 雷达信号处理软件某低慢小目标探测雷达共有4个波束,根据带宽和处理速度分析,雷达系统中信号处理共使用1片V7 FPGA+ 2片C6678 DSP 的硬件结构,首先在FPGA 内完成4路DBF 处理数据的数据提取、脉冲压缩、乒乓处理等,波束1和波束2的数据输出到DSP1,波束3和波束4的数据输出到DSP2,分别完成4路回波数据的数据重排、MTD、CFAR、杂波图处理等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
并 对该 架构 D S I 的 汇编语 言有 一定 的 了解 ,再 合理 的利 用D S P 底层 存储 资源 分配 、c 语 言的优 化 、软 件 流 水以及 编 译 器的优 化 等方 法 达到预
期 的优 化 效 果
【 关键 词 】 I ) S F ' 程序 优 化 ;存储 资 源分 配 ;C 语 言 的优 化 ;软件 流 水 :编译 器的优 化

f e r e n t me t h o d s a p p r o p r i a t e l y t o a c h i e v e t h e d e s i r e d o p t i mi z a t i o n r e s u l t s . Th e me t h o d s i nc l u de di s t r i b u t i o n o f t he me mo y r r e s o u r c e s , op t i mi z a t i o n o f C c o d e, s of t wa r e pi p e l i n e・ op t i mi z a t i o n o ft h e c o mp i l e r ,a n d s o o n. Al s o, DSP p r o g r a m o p t i mi z a t i o n i s t h e p r o c e s s of c o mbi n i n g t h e o r y wi t h p r a c t i c e
Re s e a r c h o n pr o g r a m o p t i mi z a t i o n t e c hn i qu e ba s e d o n DSP TM S3 2 0 C6 6 7 8 Wa ng Gu n— g a n g , Ya n g Yu n — ga o

Ke y wor ds : DSP p r o g r a m o p t i mi z a t i o n: di s t r i b u t i o n of t h e me mo y r r e s o u r c e s :o p t i mi z a t i o n o fC c o d e: s of t wa r e pi p e l i n e :o p t i mi z a t i o n o ft h e c o mp l i e r
0 引言
数卞 信 处理 ( Di g i t a l S i g n a l P r o c e s s i n g ,简 称 DS P)技 术发
2 基于T MS 3 2 0 C6 6 7 8 DS P 程序优化的技术
2 . 1 底层 存储 资 源的 合理 分 配
胰 迅 速 ,现 已广 泛 应 川 j 像 处理 技 术 、通 信 、 自动控 制 系统 等 许 彩新 技术 领域 … 荚 德州 仪 器 公司 推 … 了一款 摹 于K e y S t o n e 多 核 心 架 构 体 系 的高 能 数 7 ’ 处 理器 T MS 3 2 0 C 6 6 7 8 。该 处砰 器
E L E C T R ONI C S W OR L D・ 技 术 交流
基 于T MS 3 2 0 C 6 6 7 8 D SP 的 程序 I /  ̄ 1 1 J 技 市硇 研 究
海军驻 第七一 六研 究所军代 室 王 国刚
江 苏 自动化研 究所 杨 云 高
【 摘 要 】基  ̄ - T MS 3 2 0 C 6 6 7 8 1 3 S I 的程 序优 化是 一 个 完整的技 术体 系 程 序优 化首 先要 对 所用DS P @ 架构体 系和 存储 资源 有一 个清 晰的 认识 .
(1 . Na v a l Re p r e s e n t a t i ve O衔 c e o ft h e 7l 6 I n s t i t u t e o fCSI C , Li a n y un g a n g 2 2 20 6】 , Ch i n a: 2 . J i a ng s u Aut o ma t i o n Re s e a r c h I ns t i t ut e o f CSI C , Li a n y un g a n g 2 2 2 06 l , Ch i n a) Abs t r a c t : Pr og r a m o p t i mi z a t i o n b a s e d o n DSP TM S3 2 0 C6 6 7 8 i s a c o mp l e t e t e c h n i c a l s y s t e m T o o p t i mi z e t h e DSP p r o g r a m , we mu s t h a v e a c l e a r v i s i o n o l ’ t h e a r c hi t e c t u r e a nd t h e l r l e n l o r y r e s o u r c e s of t h e DSP, a n d un d e r s t a n d t h e a s s e mbl y l a n g u a g e o f t he e x h a v e t he a bi l i t y t o a p pl y d i f -
相关文档
最新文档