社区首页
技术讨论创新帖
全部新帖
资料区
社区活动
联系管理员
★ 社区积分制度
★ 新手必读
★ 申请版主★
请
登录
后使用快捷导航
没有帐号?
注册
首页
|
电子技术
|
嵌入式
模拟电子
单片机
电源管理
传感器
半导体
电子应用
|
工业控制
物联网
汽车电子
网络通信
医疗电子
手机便携
测试测量
安防电子
家用电子
机器人
新能源
电子头条
|
社区
|
论坛
测评
博客
大学堂
|
下载
|
下载中心
电路图
精品文集
电路图
|
参考设计
|
Datasheet
|
活动
|
直播
datasheet
datasheet
文章
搜索
登录
注册
中文
En
论坛
切换旧版
电子工程世界-论坛
»
论坛
›
专业技术中心
›
TI技术论坛
›
DSP 与 ARM 处理器
›
基于DSP的图像旋转算法数据调度策略
返回列表
发新帖
回复
阅
4239
|
回
0
咖啡不加糖
当前离线
五彩晶圆(初级)
最后登录
2008-10-30
在线时间
4 小时
威望
3213分
芯积分
0分
(兑换)
E金币
0枚
(兑换)
(兑换)
好友
0
咖啡不加糖
100
帖子
0
TA的资源
五彩晶圆(初级)
+ 好友
私信
楼主
发表于2008-10-31 10:05
只看该作者
基于DSP的图像旋转算法数据调度策略
[复制链接]
图像旋转是一种应用广泛的数字图像处理技术,随着应用水平的不断提高,对在嵌入式系统中实现高分辨率大图像旋转的需求也越来越高。如在航空领域的高分辨率数字地图图像的显示处理过程中,由于现有的显示芯片均不能支持图像旋转功能,就需要在资源有限的嵌入式平台上实现大幅面地图图像的实时旋转。采用DSP平台是一种实现方式,具体实现时需仔细考虑两个方面的问题,一是选用计算量小的旋转算法,二是充分发挥DSP平台强大的并行计算能力。
目前,已经有很多有效降低计算量的图像旋转算法,基于图像线性存储结构的旋转方法[1]就是其中之一。然而,在DSP平台上,有限的高速存储资源限制了这些算法效率的直接发挥,需要针对算法及DSP平台的性能结构特点进行高效的数据调度。对于图像旋转问题而言,数据调度还需要克服由于存在大量非连续图像像素地址访问而严重影响DSP数据存取及CPU效率发挥的问题。这是图像旋转本身的特殊性,在其他图像处理技术中是不存在的。本文主要讨论如何利用TI公司TMS320DM642芯片的资源特点,进行高效图像旋转的大规模数据调度,从而实现适用于大图像的DSP实时图像旋转。
1 基于图像线性存储结构的旋转方法介绍
目前,图像旋转大多采用基于视口映射的处理。视口是指屏幕上的显示区域范围,方法是先计算出旋转后视口图像像素在源图像中的坐标地址值,再依据该地址在源图像中对应读取像素值,最后利用读取的像素值进行插值,得到最终旋转后视口图像。实际上,由于存在对称性,一幅图像任意角度的旋转可分解为一次90%26#176;或180%26#176;或270%26#176;的旋转,再加上一次%26#177;45%26#176;以内的旋转。
传统的图像旋转一般通过矩阵乘法实现:
其中,α为旋转角度。
本文选用的张克黛[1]等人提出的基于图像线性存储结构的旋转方法是一种理论上运算效率较高的方法。下面具体介绍。
由于图像是线性存储的,各个像素点之间的相对位置关系确定。如图1(a)所示,图像旋转前,任意像素点P(x,y)和P1(x1,y1)、P2(x2,y2)及A(xA,yA)在几何上是矩形的四顶点关系。由于旋转变换是线性变换,如图1(b)所示,图像旋转后,各个像素点之间的相对位置关系不发生变化,
所以,对图像作旋转变换,只需对第一行和第一列的像素用式(1)作矩阵乘法运算,对除第一行和第一列以外的像素,用式(2)进行简单的加减运算即可。这样避免了对整幅图像的每个像素作矩阵乘法运算,可节省5~6倍的CPU周期。
另外,对于旋转计算后非整数像素地址的插值,本文采用双线性插值法,基本能够满足对图像质量的要求。
2 图像旋转的DSP结构优化
2.1 TMS320DM642结构特点
该芯片的结构如图2所示,它基于C64x内核,采用TI的第二代高级超长指令字结构,可在600MHz时钟频率下工作,每个指令周期可并行8条32位指令,可达到4 800MIPS的峰值计算速度。DM642具有64个增强DMA(EDMA)通道,可进行高效的一维及二维数据传输,二维数据传输可用于一个矩形图像数据块的高速搬移。
DM642的存储空间由片内和片外两级存储体系构成,其中片内存储器又分为L1和L2两层。第一层L1为CPU Cache,其访问速度与CPU的速度相匹配,包括相互独立的L1P(16KB)和L1D(16KB);第二层L2(256KB)具有灵活的RAM/Cache分配。片外存储器具备32位的访问地址,通过EDMA控制器和EMIF外部存储器接口进行数据访问。其中,片内存储器和片外存储器在访问速度方面存在很大差异。
此外,作为多媒体处理专用芯片,DM642具有用于视频数据I/O的专用接口,易于实现视频信号的显示输出。
2.2 旋转算法的结构优化
针对DM642性能结构特点的算法结构优化,其目的是使上述大图像旋转快速算法的效率能够在DSP平台上得到充分发挥,其核心思想是合理优化存储空间分配和数据传输流,使CPU能连续不断地处理图像数据,消除处理过程中的等待延迟。
由DSP的结构特点可知,只有在数据和程序均位于片内存储器当中的条件下,DSP的效率才能得到最大化的发挥。在大图像旋转算法中,由于涉及的图像数据量远大于DSP的片内存储器容量,源图像和最终视口图像等数据必须被存放在片外存储器中。在这种情况下,为了保证DSP CPU高速处理能力的发挥,必须优化数据流,将源图像分块,依次搬移至片内处理,并设法保证CPU当前要处理的图像数据块已经事先在片内存储器中准备好了。因此在算法整体优化结构上采用Ping-Pong双缓冲技术,利用EDMA与CPU并行工作来隐藏图像数据块在片内和片外之间的传输时间,使CPU能连续不断地处理数据,中间不会出现空闲等待。
Ping-Pong双缓冲是一种同时利用两个数据缓冲区的数据传输技术,它将SRAM分成两大块,一块用于存储源图像块,另一块用于存储旋转后的图像块;每一个存储块又分为两个区(Ping区和Pong区),轮流用于图像块传输和处理。其具体并行工作流程如图3所示。
图3 Ping-Pong双缓冲处理技术
至于如何在Ping-Pong双缓冲数据传输机制中设计和安排传输的图像数据块,则必须考虑针对图像旋转本身的特点,设计出具体的适用于旋转算法的DSP数据调度策略。
3 旋转算法的DSP数据调度策略
旋转算法的数据调度目的是使算法能够按照一定的规则,将源图像数据有规律地分块,并按次序分别传输到DSP片内存储器中,完成计算后,形成视口图像块,再将视口图像块按同样的顺序进行排列,形成旋转后的视口图像。整个过程要求调入和调出的图像数据均是规则分块的,并且调入的源图像块中应该包含计算视口图像块的过程中所需要的全部像素数据,尤其需要解决其中的大量非连续图像像素地址访问问题,这样才能正确地发挥DSP EDMA和Ping-Pong双缓冲技术的性能。
3.1 非连续像素地址访问
Ping-Pong双缓冲数据传输机制中图像数据块在片内、片外存储空间的传输,主要依靠EDMA设置,在后台进行二维数据传输。Ping-Pong双缓冲数据传输机制下的EDMA的数据传输要求待传输的图像块具有统一的规律,即每次旋转的图像数据的传输过程不应该因旋转角度的变化而改变。
但是,旋转后的视口图像像素的地址排列与其在源图像中的不同,不再具有连续的地址变化特征,并且视口图像的像素地址在源图像中的排列关系随旋转角度的变化而变化,没有固定的规律,给Ping-Pong双缓冲数据传输机制下的EDMA的数据传输操作带来很大困难,从而导致对源图像块的大量非连续像素地址访问的问题。该问题是图像旋转本身所特有的,如果得不到很好解决,Ping-Pong双缓冲数据传输机制就无法发挥作用,旋转算法的实际DSP执行效率也就得不到真正的提高。因此,实现满足调入/调出图像块关系的数据调度就成为实现高效图像旋转的关键。
3.2 旋转算法的DSP数据调度策略
本文提出的基于视口图像块覆盖的源图像数据分块及其调度策略的思想是实现源图像及视口图像按块处理,源图像块的范围覆盖视口图像块,且易于在源图像块内进行像素数据访问寻址,使源图像块内像素地址变化具有连续的特征,以充分发挥出DSP EDMA的效率,并满足Ping-Pong数据流程的规律性。旋转算法DSP数据调度策略示意图分别如图4和图5所示,其要点如下(以视口顺时针旋转为例):
(1)视口输出图像分块
如图4(a)所示,将视口图像分成矩形块,作为每次旋转运算的基本单位,图像块之间依次排列。
(2)源图像块的取法
如图4(b)所示,每个源图像块对应一个视口图像块,源图像块的尺寸取为视口图像块尺寸的4倍(如视口块尺寸为20%26#215;20像素,则源图像块就取为40%26#215;40像素),且源图像块的上边框中点与相应的视口图像块旋转后的左上角顶点对应,这样可保证顺时针旋转角度在0%26#176;~90%26#176;之间的任意情况下,源图像块始终覆盖其对应的旋转后的视口图像块。
(3)两图像块顶点地址对应关系
设第N个源图像块为fN(x,y),旋转后的视口图像块为f′N(x,y),则源图像块的顶点局部坐标地址值与旋转后视口图像块的顶点局部坐标地址值之间的对应关系为:
其中width指源图像块的宽度。
视口逆时针旋转的情况与此类似(如图5所示)。区别有以下两点:
①源图像块的左边框中点与相应的视口图像块旋转后的左上角顶点对应;
②源图像块的顶点局部坐标地址值与视口图像块的顶点局部坐标地址值之间的对应关系式应为:
其中height指源图像块的高度。
(4)图像块的调度
由式(3)或式(4)计算出将要从源图像中取出的对应规则图像块的左上角顶点坐标(即源图像块的起始地址),然后用EDMA的二维数据传输将其调入片内L2 SRAM中。可以看出,源图像块不再随旋转角度的变化而倾斜,其内部像素的排列存在固定规律,像素地址具有连续变化的特征,故可使Ping-Pong双缓冲数据传输机制下的EDMA二维数据传输顺利进行。
这种基于视口图像块覆盖的旋转算法DSP数据调度策略有效地解决了图像旋转中大量非连续像素地址访问的问题,体现了空间换时间的思想,通过充分利用EDMA的高效数据传输,保证了整个旋转处理的高速运算节奏。
4 实验及其结果
实验采用自行研制的高分辨率图像处理平台,以TMS320DM642芯片为主处理芯片,时钟为600MHz,片外为64MB SDRAM。实验中源图像通过调试JTAG口输入,旋转后的视口图像结果从VPORT口经D/A转换后,以VGA信号输出。实验分别实现两种尺寸(400%26#215;400像素和1024%26#215;768像素)的视口图像旋转,相应的源图像数据分别为1024%26#215;768像素和1920%26#215;1920像素的BMP格式的数字地图图像,采用0.005弧度旋转角度递增间隔,对分别采用式(1)的传统像素逐点矩阵相乘方法、基于图像线性存储结构方法以及基于本文数据调度策略的结构优化的线性存储结构方法三种实现方式进行对比,分别统计其平均每帧运行时间并转换成帧率,其结果如表1所示。
从实验结果可以看出,基于图像线性存储结构的旋转算法比传统的逐点相乘法的确在运算量上有了大幅度削减,因而有效地提高了旋转速度,但其仍然满足不了实际大图像旋转的实时性要求。通过采用本文提出的数据调度策略对算法结构及数据调度进行优化后,算法的DSP执行效率得到了显著提高,可以满足对DSP大图像旋转的实时性要求。
本文结合TMS320DM642的性能结构特点,针对图像旋转算法在DSP平台上具体实现过程中存在的严重影响DSP CPU效率发挥的大量非连续图像像素地址访问的问题,提出了切实有效的基于视口图像块覆盖的DSP数据调度策略;对算法的结构流程、数据调度等进行了优化调整,并在此基础上,在TI TMS320DM642 DSP上实现了一种实时高质量大图像旋转方案。实验表明,本文提出的适用于图像旋转算法的DSP数据调度策略,保证了DSP大图像旋转的实时性,达到了实用性要求。
参
旋转
,
算法
,
分辨率
,
能力
,
资源
此帖出自
DSP 与 ARM 处理器论坛
点赞
关注
(0)
TI DSP论坛
德州仪器DSP论坛
dsp代码
回复
分享
扫一扫,分享给好友
复制链接分享
链接复制成功,分享给好友
举报
提升卡
变色卡
千斤顶
返回列表
发新帖
回复
您需要登录后才可以回帖
登录
|
注册
发表回复
回帖后跳转到最后一页
活动
更多>>
走近 AI 重磅新品 STM32N6,解锁在 MCU 部署高性能、节能型边缘 AI!答题有好礼~还有开发板等你拿!
Microchip 直播|多相降压电源控制技术的发展与探讨 报名中!
安世半导体智能工业应用探索站,闯关赢好礼!
PI 电源小课堂:集成式半桥驱动IC BridgeSwitch 2, 助力高效永磁同步电机逆变器的设计
Microchip喊你探索dsPIC33A 芯片,70份好礼等你赢!
【瓜分2500元红包】票选2024 DigiKey “感知万物,乐享生活”创意大赛人气作品TOP3!
DigiKey应用探索站重磅上线!潮流应用,硬核技术探秘,N多干货,一站get!
验证并选择心仪MOSFET,探寻选型奥秘!注册、体验双重好礼等你拿~
开源项目
更多>>
OP284FSZ-REEL输出过载恢复运放测试电路典型应用
使用 NXP Semiconductors 的 TJA1041 的参考设计
使用 ROHM Semiconductor 的 BD46465 的参考设计
NCP300LSN47T1 4.7V 窗口电压检测器的典型应用
冰墩墩四倍快乐版
使用 Diodes Incorporated 的 AH280 的参考设计
用于便携式的 1W、1 通道、AB 类音频功率放大器
使用 Analog Devices 的 LT1372HVIN8 的参考设计
LTC3624IDD-25 5V 输出电压、2A 同步降压型稳压器的典型应用,具有 1MHz、突发模式操作
OP484FSZ 缓冲网络补偿容性负载的典型应用
随便看看
碳化硅功率器件的特点和应用领域
[i=s]本帖最后由火辣西米秀于2025-1-2209:20编辑[/i]相对于第一代硅基半导体,碳化硅功率器件禁带宽度大,电导率高、热导率高,具有更强的耐高压、高功率能力,体积更小,更适合作为衬底材料。通常半导体外延的材料在高压和高可靠性的需求下,通常会选择碳化 ...
开发基于碳化硅的25 kW快速直流充电桩:方案概述
新年积分兑换专场兑换的零食礼包到了,有图片。
【创龙TL570x-EVM】开箱
lpc1114开发板原理图
「ADI模拟大学堂」如何查看数据手册
H.264和 MPEG-4两种标准关系
51单片机小精灵,据说不懂单片机也能编程
查找数据手册?
搜索
EEWorld Datasheet 技术支持
热门标签
源代码
单片机
放大器
TI
ST
电源
分立器件
传感器
测试测量
模拟
永磁无刷直流电机
差分放大电路
差动放大器
普通晶闸管
ITO导电玻璃
跨阻放大器
功放的作用
振荡器
EN62493
SDCC
相关文章
更多>>
台积电 CFO:2024 年四季度已获首笔 15 亿美元美国《CHIPS》法案资金
1 月 21 日消息,台积电财务长(CFO)黄仁昭在接受美媒 CNBC 采访时表示,该企业已于 2024 年四季度获得了 15 亿美元(IT之家备注:当前约 109.52 亿元人民币)的首笔美国《C
Rapidus 与 IBM 合作在美制造 2nm GAA 原型晶圆亮相,在日试产 4 月启动
1 月 21 日消息,据日媒 EE Times Japan 报道,日本先进半导体制造商 Rapidus 在 2024 年 12 月 11~13 日举行的 SEMICON Japen 2024 上,展
断供先进芯片非本意!黄仁勋:英伟达不能没有中国
1月21日消息,英伟达CEO黄仁勋没有去参加美国当选总统特朗普的就职典礼,现身北京参加公司年会。 期间黄仁勋也是接受媒体的采访,其公开表示,英伟达不能没有中国。 “我们有很多合作伙伴在中国,我们在这
苹果M4 Mac mini曝出USB-C接口问题!随机间歇性断开连接
消息称 SK 海力士有望 2 月启动业界最先进 1c nm 制程 DRAM 内存量产
未经同意出售用户数据,通用汽车遭美国 FTC 处罚
日本三井住友银行推出半导体设备抵押贷款,铠侠已率先获益
联想宣布收购Infinidat,扩充高端企业存储业务
台积电董事长:我们不是美积电 最先进制程不会搬到美国
曝台积电拒绝代工三星Exynos处理器:理由是怕泄密
新帖速递
STM32和无源蜂鸣器播放声音的问题
车规级AECQ200介绍,混合铝电解电容器的选择
嵌入式教程_DSP技术_DSP实验箱操作教程:2-28 搭建轻量级WEB服务器实验
OPA847IDBVR运放器国产替代
AG32VF407测试UART
【得捷电子Follow Me第二期】第一章 收到货物的分享
请问这个红外接收头是什么型号?能用哪个型号代替?谢谢
出售全新未拆封ZYNQ 7Z020 FPGA核心板
用在锂电池供电的水表设置上的LORA模块,当有100块水表集中安装在一个楼道内时,节能
请问一下,当某个端口被设置为 RX0后,这个端口的输入输出方向还有必要设置吗
今年怎么这么难,比疫情时还难,三十了面临失业好迷茫
请教稳压管测试问题
【小华HC32F448测评】关于小华半导体的UART中断发送和PRINTF构造和重定向
【BIGTREETECH PI开发板】 HDMI输出测试
【BIGTREETECH PI开发板】+08.音频测试(zmj)
开发板申请:拥有 AI 加持的 STM32N6570-DK 免费试用 !
申请时间:即日起-3月2日
查看 »
安世半导体智能工业应用探索站,闯关赢好礼!
点击页面内“开始探索”按钮,填写并提交表单;
请根据序号依次完成3个安世半导体智能工业应用的探索,并根据给出的资料完成共计9题(每个应用3题),答对5题以上的玩家即可获得抽奖资格;
每人仅有一次参与答题的机会,请慎重作答,活动结束后,我们将抽取30位玩家赠送礼品。
查看 »
Microchip 直播|多相降压电源控制技术的发展与探讨 报名中!
直播主题:多相降压电源控制技术的发展与探讨
直播时间:2025年2月25日(星期二)上午10:30-11:30
快来报名!
查看 »
回帖赢好礼 | 关于无线技术的那些事儿
【活动时间】即日起—2025年1月31日
【活动好礼】50元京东卡
查看 »
答题赢好礼,PI电源小课堂第3期来啦!
本期内容:集成式半桥驱动IC BridgeSwitch 2, 助力高效永磁同步电机逆变器的设计
活动时间:即日起-2月28日
看视频答题即可赢取京东卡!
查看 »
Microchip喊你探索 dsPIC33A 芯片,70份好礼等你赢!
活动时间:即日起-1月26日
活动奖励:随身Wi-Fi、家用多功能电烤箱、20000mAh充电宝、50元京东卡
查看 »
DigiKey应用探索站重磅上线!潮流应用,硬核技术探秘,N多干货,一站get!
当月好物、热门技术资源、潮流应用技术、特色活动、DigiKey在线实用工具,干货多多~
查看 »
本周精选下载推荐:电源管理基础Dummies
本周小编给大家带来一本超简单、超干货的电子书——《电源管理基础Dummies》!内容深入浅出,排版舒服简洁,分分钟能get到电源管理最核心的知识内容。
查看 »
下载资料赢好礼!看Vicor模块化电源解决方案如何推动创新
活动时间:即日起-2024年12月31日
如何参与:点击活动页内您想了解的模块,找到资料下载即可参与抽奖,活动结束后统一发奖!
查看 »
关闭
站长推荐
1
/9
电子工程世界版权所有
京B2-20211791
京ICP备10001474号-1
电信业务审批[2006]字第258号函
京公网安备 11010802033920号
Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复
返回顶部
返回列表
论坛首页
版块列表
专业技术中心
TI技术论坛
ST传感器与低功耗无线技术论坛
ADI参考电路
DigiKey得捷技术专区
ADI · 世健工业技术
电子技术交流
嵌入式系统
单片机
国产芯片交流
电机驱动控制
FPGA/CPLD
模拟电子
电源技术
PCB技术
RF/无线
传感器
综合技术交流
下载中心专版
大学堂专版
测评中心专版
创意与实践
电子竞赛
DIY/开源硬件专区
淘e淘
创意市集
行业应用
汽车电子
移动便携
医疗电子
工控电子
安防电子
休息一下
聊聊、笑笑、闹闹
工作这点儿事
为我们提意见&公告
EEWorld颁奖专区
信息发布
最新帖子
最新帖子
最新回复
精华
消灭零回复
测评中心
活动中心
积分兑换
E金币兑换
芯积分
厂商专区
TI技术论坛
ST传感器与低功耗无线技术论坛