2526|0

3836

帖子

19

TA的资源

纯净的硅(中级)

楼主
 

TI DSP定点算术运算之三 [复制链接]

非线性运算的定点快速实现

在数值运算中,除基本的加减乘除运算外,还有其他许多非线性运算,如对数运算、开方运算、指数运算、三角函数运算等,实现这些非线性运算的方法一般有:(1)调用DSP编译系统的库函数;(2)查表法;(3)混合法。下面分别介绍这三种方法。

1.调用DSP编译系统的库函数

TMS320C2X/C5X C编译器提供了比较丰富的运行支持库函数。在这些库函数中,包含了诸如对数、开方、三角函数、指数等常用的非线性函数。在C程序中(也可在汇编程序中)只要采用与库函数相同的变量定义,就可以直接调用。例如,在库函数中,定义了以10为底的常用对数log10( )

include

double  log10(double x);

C程序中按如下方式调用:

float x,y;

x = 10.0;

y = log10(x);

从上例可以看出,库函数中的常用对数log10( )要求的输入值为浮点数,返回值也为浮点数,运算的精度完全可以保证。直接调用库函数非常方便,但由于运算量大,很难在实时DSP中得到应用。

2.查表法

在实时DSP应用中实现非线性运算,一般都采取适当降低运算精度来提高程序的运算速度。查表法是快速实现非线性运算最常用的方法。采用这种方法必须根据自变量的范围和精度要求制作一张表格。显然输入的范围越大,精度要求越高,则所需的表格就越大,即存储量也越大。查表法求值所需的计算就是根据输入值确定表的地址,根据地址就可得到相应的值,因而运算量较小。查表法比较适合于非线性函数是周期函数或已知非线性函数输入值范围这两种情况,例3.12和例3.13分别说明这两种情况。

例3.12  已知正弦函数y=cos(x),制作一个512点表格,并说明查表方法。

由于正弦函数是周期函数,函数值在-1至+1之间,用查表法比较合适。

由于Q15的表示范围为-132767/32768之间,原则上讲-1至+1的范围必须用Q14表示。但一般从方便和总体精度考虑,类似情况仍用Q15表示,此时+132767来表示。

(1) 产生512点值的C语言程序如下所示:

#define  N  512

#define  pi  3.14159

int  sin_tab[512];

void  main( )

{

int i;

for(i=0;i=(int)(32767*sin(2*pi*i/N));

}

(2) 查表

查表实际上就是根据输入值确定表的地址。设输入x0~2p之间,则x对应于512点表的地址为:index = (int)(512*x/2p),则 y = sin(x) = sin_tab[index]

如果xQ12定点数表示,将512/2p用Q8表示为 20861,则计算正弦表的地址的公式为:index = (x*20861L)>>20

例3.13  用查表法求以2为底的对数,已知自变量取值范围为0.5~1,要求将自变量范围均匀划分为10等分。试制作这个表格并说明查表方法。

(1) 做表:

y = log2(x),由于x0.51之间,因此y在-10之间,xy均可用Q15表示。由于对x均匀划分为10段,因此,10段对应于输入x的范围如表3.2所示。若每一段的对数值都取第1点的对数值,则表中第1段的对数值为y0(Q15) = (int)(log2(0.5)×32768),第2段的对数值为y1(Q15) = (int)(log2(0.55)×32768),依次类推。

3.2  logtab0 10点对数表(输入0.5~1)

地址
输入值
对数值(Q15)
0
0.50~0.55
-32768
1
0.55~0.60
-28262
2
0.60~0.65
-24149
3
0.65~0.70
-20365
4
0.70~0.75
-16862
5
0.75~0.80
-13600
6
0.80~0.85
-10549
7
0.85~0.90
-7683
8
0.90~0.95
-4981
9
0.95~1.00
-2425

(2) 查表:

查表时,先根据输入值计算表的地址,计算方法为:index=((x-16384)×20)>>15。式中,index就是查表用的地址。例如,已知输入x= 26869,则index=6,因此y=-10549

3.混合法

(1) 提高查表法的精度

上述方法查表所得结果的精度随表的大小而变化,表越大,则精度越高,但存储量也越大。当系统的存储量有限而精度要求也较高时,查表法就不太适合。那么能否在适当增加运算量的情况下提高非线性运算的精度呢?下面介绍一种查表结合少量运算来计算非线性函数的混合法,这种方法适用于在输入变量的范围内函数呈单调变化的情形。

混合法是在查表的基础上采用计算的方法以提高当输入值处于表格两点之间时的精度。提高精度的一个简便方法是采用折线近似法,如图3.1所示。

仍以求以2为底的对数为例(3.13)。设输入值为x,则精确的对数值为y,在表格值的两点之间作一直线,用y'作为y的近似值,则有:

y'=y0 y

3.1  提高精度的折线近似法

< xmlnamespace prefix ="w" ns ="urn:schemas-microsoft-com:office:word" />其中y0由查表求得。现在只需在查表求得y0的基础上增加 y即可。 y的计算方法如下:

y=( x/ x0) y= x( y0/ x0)

式中 y0/ x0对每一段来说是一个恒定值,可作一个表格直接查得。此外计算 x时需用到每段横坐标的起始值,这个值也可作一个表格。这样共有三个大小均为10的表格,分别为存储每段起点对数值的表logtab0、存储每段 y0/ x0 值的表logtab1和存储每段输入起始值x0的表logtab2,表logtab1和表logtab2可用下列两个数组表示:

int     logtab1[10]={22529,20567,18920,17517,16308,

             15255,14330,13511,12780,12124};  

int     logtab2[10]={16384,18022,19660,21299,22938,

             24576,26214,27853,29491,31130};  

综上所述,采用混合法计算对数值的方法可归纳为:

①根据输入值,计算查表地址:index=((x-16384)×20)>>15;

②查表得y0=logtab0[index];

③计算 x=x-logtab2[index];

④计算 y( x×logtab1[index])>>13;

⑤计算得结果y=y0+ y

例3.14  已知x=0.54,求log2(x)

0.54的精确对数值为y=log2(0.54)=-0.889

混合法求对数值的过程为:

①定标Q15,定标值x=0.54*32768=17694

②表地址index=((x-16384)×20)>>15=0;

③查表得y0=logtab0[0]=-32768;

④计算 x=x-logtab2[0]=17694-16384=1310;

⑤计算 y( xlogtab1[0])>>13=(1310*22529L)>>13=3602;

⑥计算结果y=y0+ y=-32768+3602=-29166

结果yQ15定标,折算成浮点数为-29166/32768=-0.89,可见精度较高。

(2) 扩大自变量范围

如上所述,查表法比较适用于周期函数或自变量的动态范围不是太大的情形。对于像对数这样的非线性函数,输入值和函数值的变化范围都很大。如果输入值的变化范围很大,则作表就比较困难。那么能否比较好地解决这个问题,既不使表格太大,又能得到比较高的精度呢?下面讨论一种切实可行的方法。

x是一个大于0.5的数,则x可以表示为下列形式:

x =

式中,0.5m1.0e为整数。则求 x 的对数可以表示为:

log2(x) = log2( ) = log2(m) + log2( ) = e + log2(m)

也就是说,求x的对数实际上只要求 m的对数就可以了,而由于m的数值在0.5~1.0之间,用上面介绍的方法是完全可以实现的。例如:

log2(10000) = log2(0.61035× ) = log2(0.61035) + 14 = 13.2877

可见,如果一个数可以用比较简便的方法表示为上面的形式,则求任意大小数的对数也是比较方便的。TMS320C2X/C5X指令集提供了一条用于对ACC中的数进行规格化的指令 NORM ,该指令的作用就是使累加器中的数左移,直至数的最高位被移至累加器的第30位。例如,对数值10000进行规格化的TMS320C25程序为:

LAC       #10000

SACL     TEMP

ZALH     TEMP

LAR       AR1,#0FH

RPT       14

NORM    *

上述程序执行后,AR1=#0eHACCH=2000(10进制)。对一个16位整数 x 进行上述程序处理实际上就是做这样一个等效变换:

x =

其中,寄存器AR1包含的值为15-Q,累加器ACC16位包含的值为 ,其数值在16384~32768之间。

例3.15  实现以2为底的对数的C定点模拟程序

int    logtab0[10]{-32768,-28262,-24149,-20365,-16862,

            -13600,-10549,-7683,-4981,-2425};

int    logtab1[10]{22529,20567,18920,17517,16308,

            15255,14330,13511,12780,12124};  

int    logtab2[10]{16384,18022,19660,21299,22938,

            24576,26214,27853,29491,31130};  

int    log2_fast(int   Am)

{

int     point,point1;

int     index,x0,dx,dy,y;

point0;

while(Am<16384) {point++AmAm<<1;}      

point1(15-point-4)*512;           

index((Am-16384)*20L)>>15;              

dxAm-logtab2[index];

dy((long)dx*logtab1[index])>>13;

y(dy+logtab0[index])>>6;         

ypoint1+y;

return (y);

}

上述程序中,输入值Am采用Q4表示,输出采用Q9表示,如果输入输出的Q值与上面程序中的不同,则应做相应的修改。


点赞 关注
 

回复
举报
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/10 下一条
立即报名 | 2025 瑞萨电子工业以太网技术日即将开启!
3月-4月 深圳、广州、北京、苏州、西安、上海 走进全国6城
2025瑞萨电子工业以太网技术巡回沙龙聚焦工业4.0核心需求,为工程师与企业决策者提供实时通信技术最佳解决方案。
预报从速,好礼等您拿~

查看 »

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表