社区首页
技术讨论创新帖
全部新帖
资料区
社区活动
联系管理员
★ 社区积分制度
★ 新手必读
★ 申请版主★
请
登录
后使用快捷导航
没有帐号?
注册
首页
|
电子技术
|
嵌入式
模拟电子
单片机
电源管理
传感器
半导体
电子应用
|
工业控制
物联网
汽车电子
网络通信
医疗电子
手机便携
测试测量
安防电子
家用电子
机器人
新能源
电子头条
|
社区
|
论坛
测评
博客
大学堂
|
下载
|
下载中心
电路图
精品文集
电路图
|
参考设计
|
Datasheet
|
活动
|
直播
datasheet
datasheet
文章
搜索
登录
注册
中文
En
论坛
切换旧版
电子工程世界-论坛
»
论坛
›
专业技术中心
›
TI技术论坛
›
DSP 与 ARM 处理器
›
基于DSP的图像旋转算法数据调度策略
返回列表
发新帖
回复
阅
4244
|
回
0
咖啡不加糖
当前离线
五彩晶圆(初级)
最后登录
2008-10-30
在线时间
4 小时
威望
3213分
芯积分
0分
(兑换)
E金币
0枚
(兑换)
(兑换)
好友
0
咖啡不加糖
100
帖子
0
TA的资源
五彩晶圆(初级)
+ 好友
私信
楼主
发表于2008-10-31 10:05
只看该作者
基于DSP的图像旋转算法数据调度策略
[复制链接]
图像旋转是一种应用广泛的数字图像处理技术,随着应用水平的不断提高,对在嵌入式系统中实现高分辨率大图像旋转的需求也越来越高。如在航空领域的高分辨率数字地图图像的显示处理过程中,由于现有的显示芯片均不能支持图像旋转功能,就需要在资源有限的嵌入式平台上实现大幅面地图图像的实时旋转。采用DSP平台是一种实现方式,具体实现时需仔细考虑两个方面的问题,一是选用计算量小的旋转算法,二是充分发挥DSP平台强大的并行计算能力。
目前,已经有很多有效降低计算量的图像旋转算法,基于图像线性存储结构的旋转方法[1]就是其中之一。然而,在DSP平台上,有限的高速存储资源限制了这些算法效率的直接发挥,需要针对算法及DSP平台的性能结构特点进行高效的数据调度。对于图像旋转问题而言,数据调度还需要克服由于存在大量非连续图像像素地址访问而严重影响DSP数据存取及CPU效率发挥的问题。这是图像旋转本身的特殊性,在其他图像处理技术中是不存在的。本文主要讨论如何利用TI公司TMS320DM642芯片的资源特点,进行高效图像旋转的大规模数据调度,从而实现适用于大图像的DSP实时图像旋转。
1 基于图像线性存储结构的旋转方法介绍
目前,图像旋转大多采用基于视口映射的处理。视口是指屏幕上的显示区域范围,方法是先计算出旋转后视口图像像素在源图像中的坐标地址值,再依据该地址在源图像中对应读取像素值,最后利用读取的像素值进行插值,得到最终旋转后视口图像。实际上,由于存在对称性,一幅图像任意角度的旋转可分解为一次90%26#176;或180%26#176;或270%26#176;的旋转,再加上一次%26#177;45%26#176;以内的旋转。
传统的图像旋转一般通过矩阵乘法实现:
其中,α为旋转角度。
本文选用的张克黛[1]等人提出的基于图像线性存储结构的旋转方法是一种理论上运算效率较高的方法。下面具体介绍。
由于图像是线性存储的,各个像素点之间的相对位置关系确定。如图1(a)所示,图像旋转前,任意像素点P(x,y)和P1(x1,y1)、P2(x2,y2)及A(xA,yA)在几何上是矩形的四顶点关系。由于旋转变换是线性变换,如图1(b)所示,图像旋转后,各个像素点之间的相对位置关系不发生变化,
所以,对图像作旋转变换,只需对第一行和第一列的像素用式(1)作矩阵乘法运算,对除第一行和第一列以外的像素,用式(2)进行简单的加减运算即可。这样避免了对整幅图像的每个像素作矩阵乘法运算,可节省5~6倍的CPU周期。
另外,对于旋转计算后非整数像素地址的插值,本文采用双线性插值法,基本能够满足对图像质量的要求。
2 图像旋转的DSP结构优化
2.1 TMS320DM642结构特点
该芯片的结构如图2所示,它基于C64x内核,采用TI的第二代高级超长指令字结构,可在600MHz时钟频率下工作,每个指令周期可并行8条32位指令,可达到4 800MIPS的峰值计算速度。DM642具有64个增强DMA(EDMA)通道,可进行高效的一维及二维数据传输,二维数据传输可用于一个矩形图像数据块的高速搬移。
DM642的存储空间由片内和片外两级存储体系构成,其中片内存储器又分为L1和L2两层。第一层L1为CPU Cache,其访问速度与CPU的速度相匹配,包括相互独立的L1P(16KB)和L1D(16KB);第二层L2(256KB)具有灵活的RAM/Cache分配。片外存储器具备32位的访问地址,通过EDMA控制器和EMIF外部存储器接口进行数据访问。其中,片内存储器和片外存储器在访问速度方面存在很大差异。
此外,作为多媒体处理专用芯片,DM642具有用于视频数据I/O的专用接口,易于实现视频信号的显示输出。
2.2 旋转算法的结构优化
针对DM642性能结构特点的算法结构优化,其目的是使上述大图像旋转快速算法的效率能够在DSP平台上得到充分发挥,其核心思想是合理优化存储空间分配和数据传输流,使CPU能连续不断地处理图像数据,消除处理过程中的等待延迟。
由DSP的结构特点可知,只有在数据和程序均位于片内存储器当中的条件下,DSP的效率才能得到最大化的发挥。在大图像旋转算法中,由于涉及的图像数据量远大于DSP的片内存储器容量,源图像和最终视口图像等数据必须被存放在片外存储器中。在这种情况下,为了保证DSP CPU高速处理能力的发挥,必须优化数据流,将源图像分块,依次搬移至片内处理,并设法保证CPU当前要处理的图像数据块已经事先在片内存储器中准备好了。因此在算法整体优化结构上采用Ping-Pong双缓冲技术,利用EDMA与CPU并行工作来隐藏图像数据块在片内和片外之间的传输时间,使CPU能连续不断地处理数据,中间不会出现空闲等待。
Ping-Pong双缓冲是一种同时利用两个数据缓冲区的数据传输技术,它将SRAM分成两大块,一块用于存储源图像块,另一块用于存储旋转后的图像块;每一个存储块又分为两个区(Ping区和Pong区),轮流用于图像块传输和处理。其具体并行工作流程如图3所示。
图3 Ping-Pong双缓冲处理技术
至于如何在Ping-Pong双缓冲数据传输机制中设计和安排传输的图像数据块,则必须考虑针对图像旋转本身的特点,设计出具体的适用于旋转算法的DSP数据调度策略。
3 旋转算法的DSP数据调度策略
旋转算法的数据调度目的是使算法能够按照一定的规则,将源图像数据有规律地分块,并按次序分别传输到DSP片内存储器中,完成计算后,形成视口图像块,再将视口图像块按同样的顺序进行排列,形成旋转后的视口图像。整个过程要求调入和调出的图像数据均是规则分块的,并且调入的源图像块中应该包含计算视口图像块的过程中所需要的全部像素数据,尤其需要解决其中的大量非连续图像像素地址访问问题,这样才能正确地发挥DSP EDMA和Ping-Pong双缓冲技术的性能。
3.1 非连续像素地址访问
Ping-Pong双缓冲数据传输机制中图像数据块在片内、片外存储空间的传输,主要依靠EDMA设置,在后台进行二维数据传输。Ping-Pong双缓冲数据传输机制下的EDMA的数据传输要求待传输的图像块具有统一的规律,即每次旋转的图像数据的传输过程不应该因旋转角度的变化而改变。
但是,旋转后的视口图像像素的地址排列与其在源图像中的不同,不再具有连续的地址变化特征,并且视口图像的像素地址在源图像中的排列关系随旋转角度的变化而变化,没有固定的规律,给Ping-Pong双缓冲数据传输机制下的EDMA的数据传输操作带来很大困难,从而导致对源图像块的大量非连续像素地址访问的问题。该问题是图像旋转本身所特有的,如果得不到很好解决,Ping-Pong双缓冲数据传输机制就无法发挥作用,旋转算法的实际DSP执行效率也就得不到真正的提高。因此,实现满足调入/调出图像块关系的数据调度就成为实现高效图像旋转的关键。
3.2 旋转算法的DSP数据调度策略
本文提出的基于视口图像块覆盖的源图像数据分块及其调度策略的思想是实现源图像及视口图像按块处理,源图像块的范围覆盖视口图像块,且易于在源图像块内进行像素数据访问寻址,使源图像块内像素地址变化具有连续的特征,以充分发挥出DSP EDMA的效率,并满足Ping-Pong数据流程的规律性。旋转算法DSP数据调度策略示意图分别如图4和图5所示,其要点如下(以视口顺时针旋转为例):
(1)视口输出图像分块
如图4(a)所示,将视口图像分成矩形块,作为每次旋转运算的基本单位,图像块之间依次排列。
(2)源图像块的取法
如图4(b)所示,每个源图像块对应一个视口图像块,源图像块的尺寸取为视口图像块尺寸的4倍(如视口块尺寸为20%26#215;20像素,则源图像块就取为40%26#215;40像素),且源图像块的上边框中点与相应的视口图像块旋转后的左上角顶点对应,这样可保证顺时针旋转角度在0%26#176;~90%26#176;之间的任意情况下,源图像块始终覆盖其对应的旋转后的视口图像块。
(3)两图像块顶点地址对应关系
设第N个源图像块为fN(x,y),旋转后的视口图像块为f′N(x,y),则源图像块的顶点局部坐标地址值与旋转后视口图像块的顶点局部坐标地址值之间的对应关系为:
其中width指源图像块的宽度。
视口逆时针旋转的情况与此类似(如图5所示)。区别有以下两点:
①源图像块的左边框中点与相应的视口图像块旋转后的左上角顶点对应;
②源图像块的顶点局部坐标地址值与视口图像块的顶点局部坐标地址值之间的对应关系式应为:
其中height指源图像块的高度。
(4)图像块的调度
由式(3)或式(4)计算出将要从源图像中取出的对应规则图像块的左上角顶点坐标(即源图像块的起始地址),然后用EDMA的二维数据传输将其调入片内L2 SRAM中。可以看出,源图像块不再随旋转角度的变化而倾斜,其内部像素的排列存在固定规律,像素地址具有连续变化的特征,故可使Ping-Pong双缓冲数据传输机制下的EDMA二维数据传输顺利进行。
这种基于视口图像块覆盖的旋转算法DSP数据调度策略有效地解决了图像旋转中大量非连续像素地址访问的问题,体现了空间换时间的思想,通过充分利用EDMA的高效数据传输,保证了整个旋转处理的高速运算节奏。
4 实验及其结果
实验采用自行研制的高分辨率图像处理平台,以TMS320DM642芯片为主处理芯片,时钟为600MHz,片外为64MB SDRAM。实验中源图像通过调试JTAG口输入,旋转后的视口图像结果从VPORT口经D/A转换后,以VGA信号输出。实验分别实现两种尺寸(400%26#215;400像素和1024%26#215;768像素)的视口图像旋转,相应的源图像数据分别为1024%26#215;768像素和1920%26#215;1920像素的BMP格式的数字地图图像,采用0.005弧度旋转角度递增间隔,对分别采用式(1)的传统像素逐点矩阵相乘方法、基于图像线性存储结构方法以及基于本文数据调度策略的结构优化的线性存储结构方法三种实现方式进行对比,分别统计其平均每帧运行时间并转换成帧率,其结果如表1所示。
从实验结果可以看出,基于图像线性存储结构的旋转算法比传统的逐点相乘法的确在运算量上有了大幅度削减,因而有效地提高了旋转速度,但其仍然满足不了实际大图像旋转的实时性要求。通过采用本文提出的数据调度策略对算法结构及数据调度进行优化后,算法的DSP执行效率得到了显著提高,可以满足对DSP大图像旋转的实时性要求。
本文结合TMS320DM642的性能结构特点,针对图像旋转算法在DSP平台上具体实现过程中存在的严重影响DSP CPU效率发挥的大量非连续图像像素地址访问的问题,提出了切实有效的基于视口图像块覆盖的DSP数据调度策略;对算法的结构流程、数据调度等进行了优化调整,并在此基础上,在TI TMS320DM642 DSP上实现了一种实时高质量大图像旋转方案。实验表明,本文提出的适用于图像旋转算法的DSP数据调度策略,保证了DSP大图像旋转的实时性,达到了实用性要求。
参
旋转
,
算法
,
分辨率
,
能力
,
资源
此帖出自
DSP 与 ARM 处理器论坛
点赞
关注
(0)
TI DSP论坛
德州仪器DSP论坛
dsp代码
回复
分享
扫一扫,分享给好友
复制链接分享
链接复制成功,分享给好友
举报
提升卡
变色卡
千斤顶
返回列表
发新帖
回复
您需要登录后才可以回帖
登录
|
注册
发表回复
回帖后跳转到最后一页
活动
更多>>
有奖直播 | ADI 超低功耗 MCU MAX326xx 系列介绍
走近 AI 重磅新品 STM32N6,解锁在 MCU 部署高性能、节能型边缘 AI!答题有好礼~还有开发板等你拿!
Microchip 直播|多相降压电源控制技术的发展与探讨 报名中!
安世半导体智能工业应用探索站,闯关赢好礼!
24年年终盘点来啦!精选强推:原创、测评、拆解、视频、资料
PI 电源小课堂:集成式半桥驱动IC BridgeSwitch 2, 助力高效永磁同步电机逆变器的设计
Microchip喊你探索dsPIC33A 芯片,70份好礼等你赢!
【瓜分2500元红包】票选2024 DigiKey “感知万物,乐享生活”创意大赛人气作品TOP3!
开源项目
更多>>
使用 Aimtec 的 AM9GH-4812DZ 的参考设计
彩色丝印|arduino uno 可爱风格开发板
使用 MaxLinear, Inc 的 AS2733T5-3.3 的参考设计
使用 MaxLinear, Inc 的 SPX385AN-1.2 的参考设计
MIKROE-2705,7x10 G CLICK 板可用于在具有 5x7 字体分辨率的显示器上显示字母,基于 70 个绿色 LED 矩阵
LTM4648EY 2.375V 至 5.5V 输入、1.5V 输出 DC/DC 模块稳压器的典型应用电路
迷你蓝桥杯单片机开发板
L78L05AB正压稳压器Edit boost电路的典型应用
VG7050EAN-EVB、VG7050EAN 评估板,通过 I2C 总线设置寄存器
STM_GD32_桌面时钟
随便看看
求可以pin to pin替代MT3420B的电源芯片
我的一个设计使用了MT3420B这款电源芯片,这款芯片的输入电压范围是2.3~6V。原来使用的5V供电,现在想使用12V供电,又不想改设计,想换一款能pintopin替换的大于12V输入的芯片。不过我找了很多,12V输入和STO32-6的芯片有很多,因为MT3420B的管脚顺序比较特殊 ...
JavaScript -练习册(2) 函数
JavaScript -练习册(1)hello world
请问 X^(a^2) 如何换算成 (X^a)^? ?代表多少次方
msp430f149设置pwm波
LM358电路分析
大家来找茬,刚画的一个51基础板
电脑上的开关电源问题
查找数据手册?
搜索
EEWorld Datasheet 技术支持
热门标签
源代码
单片机
放大器
TI
ST
电源
分立器件
传感器
测试测量
模拟
电压电流转换器
数字互感器
光纤滤波器
液力变矩器
PCB设计软件
偏置电流
DA转换器
bcstack
DHT11
PIN
相关文章
更多>>
德州仪器 2024年Q4财报解析:中国市场增长亮眼,目前没有收到反垄断调查通知
在 2024 年第四季度收益电话会议上,德州仪器(TI)向外界展示了一些好消息,尤其是凸显了中国市场在其全球布局中的关键地位。 第四季度,TI 收入为 40 亿美元,环比下降 3%,比去年同期下
欧盟提议成立高级研究机构:专注于AI等战略技术以加强竞争力
据彭博社报道,欧盟将提议仿照美国政府实体建立一个高级研究项目机构,对战略技术进行投资,以此作为提高欧盟竞争力的更广泛努力的一部分。 欧盟还将呼吁为 AI 建设新的超级计算基础设施。知情人士及文件显示
传台积电报废三万片晶圆,三万片受损
晶圆代工龙头厂台积电位于南科的晶圆厂,受地震影响的机台设备移位、晶圆破损经过抢修后,供应链传出,3、 5纳米的先进制程晶圆十八厂,预计将于23日达100%复机,准备恢复正常生产,晶圆十四厂复机还没有
中国芯片出口连续14个月增长
特朗普退出巴黎协定,芯片业碳中和完了没?
汇顶科技 2024 年业绩亮眼,展现强劲发展韧性
谷歌母公司:美国AI难保证对华领先 不少方面是落后
消息称三星电子砍半晶圆代工部门 2025 年设备投资预算,陡降至 5 万亿韩元
史上最佳表现:SK 海力士 2024 年营业利润 23.5 万亿韩元
宇树发布“踢足球”机器人G1-Comp,网友:国足有救了
新帖速递
STM32和无源蜂鸣器播放声音的问题
车规级AECQ200介绍,混合铝电解电容器的选择
嵌入式教程_DSP技术_DSP实验箱操作教程:2-28 搭建轻量级WEB服务器实验
OPA847IDBVR运放器国产替代
AG32VF407测试UART
【得捷电子Follow Me第二期】第一章 收到货物的分享
请问这个红外接收头是什么型号?能用哪个型号代替?谢谢
出售全新未拆封ZYNQ 7Z020 FPGA核心板
用在锂电池供电的水表设置上的LORA模块,当有100块水表集中安装在一个楼道内时,节能
请问一下,当某个端口被设置为 RX0后,这个端口的输入输出方向还有必要设置吗
今年怎么这么难,比疫情时还难,三十了面临失业好迷茫
请教稳压管测试问题
【小华HC32F448测评】关于小华半导体的UART中断发送和PRINTF构造和重定向
【BIGTREETECH PI开发板】 HDMI输出测试
【BIGTREETECH PI开发板】+08.音频测试(zmj)
开发板申请:拥有 AI 加持的 STM32N6570-DK 免费试用 !
申请时间:即日起-3月2日
查看 »
安世半导体智能工业应用探索站,闯关赢好礼!
点击页面内“开始探索”按钮,填写并提交表单;
请根据序号依次完成3个安世半导体智能工业应用的探索,并根据给出的资料完成共计9题(每个应用3题),答对5题以上的玩家即可获得抽奖资格;
每人仅有一次参与答题的机会,请慎重作答,活动结束后,我们将抽取30位玩家赠送礼品。
查看 »
Microchip 直播|多相降压电源控制技术的发展与探讨 报名中!
直播主题:多相降压电源控制技术的发展与探讨
直播时间:2025年2月25日(星期二)上午10:30-11:30
快来报名!
查看 »
回帖赢好礼 | 关于无线技术的那些事儿
【活动时间】即日起—2025年1月31日
【活动好礼】50元京东卡
查看 »
答题赢好礼,PI电源小课堂第3期来啦!
本期内容:集成式半桥驱动IC BridgeSwitch 2, 助力高效永磁同步电机逆变器的设计
活动时间:即日起-2月28日
看视频答题即可赢取京东卡!
查看 »
DigiKey应用探索站重磅上线!潮流应用,硬核技术探秘,N多干货,一站get!
当月好物、热门技术资源、潮流应用技术、特色活动、DigiKey在线实用工具,干货多多~
查看 »
本周精选下载推荐:电源管理基础Dummies
本周小编给大家带来一本超简单、超干货的电子书——《电源管理基础Dummies》!内容深入浅出,排版舒服简洁,分分钟能get到电源管理最核心的知识内容。
查看 »
关闭
站长推荐
1
/7
电子工程世界版权所有
京B2-20211791
京ICP备10001474号-1
电信业务审批[2006]字第258号函
京公网安备 11010802033920号
Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复
返回顶部
返回列表
论坛首页
版块列表
专业技术中心
TI技术论坛
ST传感器与低功耗无线技术论坛
ADI参考电路
DigiKey得捷技术专区
ADI · 世健工业技术
电子技术交流
边缘AI
嵌入式系统
单片机
国产芯片交流
电机控制
FPGA/CPLD
模拟电子
电源技术
无线连接
传感器
PCB设计
综合技术交流
下载中心专版
大学堂专版
测评中心专版
行业应用
汽车电子
机器人开发
工业自动化与控制
能源基础设施
医疗电子
消费电子
创意与实践
电子竞赛
DIY/开源硬件专区
淘e淘
创意市集
休息一下
聊聊、笑笑、闹闹
工作这点儿事
为我们提意见&公告
EEWorld颁奖专区
信息发布
最新帖子
最新帖子
最新回复
精华
消灭零回复
测评中心
活动中心
积分兑换
E金币兑换
芯积分
厂商专区
TI技术论坛
ST传感器与低功耗无线技术论坛