(三)寄存器变量
在一个函数中,定点C编译器可以自由使用多至两个寄存器变量。如果要在函数中使用寄存器变量,则应在函数的参数表或函数的第一块中定义。否则,作为一般的变量处理。编译器用AR6和AR7作为寄存器变量,其中AR6分配给第一个寄存器变量,AR7分配给第二个寄存器变量。由于在运行时建立一个寄存器变量约需4个指令周期,因此,只有当一个变量访问2次以上,使用寄存器变量的效果才能明显地体现出来。
三、函数调用规则
定点C编译器也规定了一组严格的函数调用规则。除了特殊的运行支持函数外,任何调用C函数或被C函数所调用的函数都必须遵循这些规则,否则就会破坏C环境,造成不可预测的后果。
(一)参数传递
将参数传递给一个C函数时,必须遵循下列规则:
(1)函数调用前,将多数压入运行堆栈。。
(2)以逆序传递参数。也就是说。第一个参数(最左边)最后压栈,而最后一个参数(最右边)最先压栈。
(3)若参数是浮点数或长整型数,则低位字先压栈,高位字后压栈。
(4)传递结构时,采用多字方式。
(二)局部帧的产生
函数被调用时,编译器在运行栈中建立一个帧以存储信息。当前函数帧称为局部帧。C环境利用局部帧来保护调用者的有关信息、传递参数和生成局部变量。每调用一个函数,就建立一个新的帧。
上面已经介绍,寄存器AR1为SP,AR0为FP,SP指向栈顶,FP指向局部帧。编译器在建立局部帧时完成如下工作:
(1)从TMS320C2X/C5X的内部堆栈中弹出返回地址,并压人C运行堆栈。
(2)将旧的FP的内容压人C运行堆栈,并将FP设置为当前的SP。
(3)增加SP。增加的值等于需要保存的局部变量的字的个数加1,其中,额外的一个字位于帧的开始,用于存储临时变量。
(4)若函数使用AR6和AN7作为寄存器变量,则将它们的内容压人堆栈,然后装人相应局部变量的地址。
下面是完成上述工作的TMS320C2X的汇编程序,其中SIZE是局部帧的长度。
例2.1 调用函数时的初始处理
POPD * + ;将返回地址压人C堆栈
SAR AR0, * + ;保护旧FP
SAR AR1, *
LARK AR0, SIZE
LAR ARO, * 0 + ;FP= 旧的SP,SP=SP+ SIZE
SAR AR6,* + ;保护AR6
SAR AR7, * + ;保护AR7
下面是一些产生局部帧时的注意事项:
(1)函数进入时,编译器认为ARP为1。
(2)没有独立的参数表指针。指向参数时,帧指针用负偏移,指向局部变量时,用正偏移;
(3)帧指针AR0指向一个独立的字,这个字在局部变量前分配,用于存储临存值,通过AR0直接访问。
(4)编译器用AR2来计算局部变量的地址。一般来说,局部变量的偏移值放在AR2中,然后加上AR0。
(5)对TMS320C5X来说上面的程序稍有不同,但作用是一样的。
(三)函数结束
函数结束返回时,必须完成如下工作以恢复C调用环境:
(1)处理要传递给调用者的返回值;
(2)如果使用了AR6和AR7,则必须予以恢复;
(3)撤销为局部变量和临存值分配的空间;
(4)恢复原来的帧指针;
(5)将返回地址压人TMS320C2X/C5X的堆栈并返回调用程序。
下面是完成上述工作的TMS320C2X汇编程序。
例2.2 TMS320C2X C函数的结束处理
LAR AR7,* - ;恢复AR7
LAR AR6, * - ;恢复0柏
SBRK SIZE ;撤销局部帧
LAR AR0,* - ;恢复FP
PSHD* ;返回地址压人内部堆栈
RET ;返回
需要注意的是:
(1)函数在ACC中返回函数值。整数和指针在ACC的低16位中返回,浮点数和长整型数使用ACC全部32位返回。
(2)由于用ACC返回函数值,因此,必须保证ACC不被结束程序所修改。
(3)参数不是由被调用的函数弹出堆栈,而是必须由调用函数弹出。因此,调用者可以传递任意数目的参数至函数,同时,函数也不必知道有多少个参数传递。
(4)从函数返回时,ARP指向AR1.
四、中断函数
在定点C编译器中,中断可以用C函数直接处理。每个中断采用固定的程序名。如下所示:
c_int0 系统复位中断
c_int1 外部中断0
c_int2 外部中断1
c_int3 外部中断2
c_int4 内部定时器中断
C_int5 串行口接收中断
c_int6 串行口发送中断
c_int7 TDM 口接收中断
c_int8 TDM口发送中断
c_int9 外部中断3
调用上述中断程序时,首先调用一个名为I$$SAVE的子程序,这个子程序保护了所有的寄存器。同样,在函数返回时,调用一个名为1$$REST的子程序用于恢复被保护的寄存器。
用C语言编写中断程序时,必须注意以下几点:
(1)对由SP(AR1)指向的字,编译器可能正在使用,因此必须加以保护。
(2)中断的屏蔽和使能必须由程序员设置,设置的方法是用嵌人汇编语句的方法修改IMR寄存器。这样修改不会破坏C环境或C指针。
(3)中断程序没有参数传递,即使说明,也将被忽略。
(4)由于用C编写中断程序时,需要保护所有的寄存器,因此效率不高。
(5)将一个程序与某个中断关联时,必须在相应的中断矢量处放置一条跳转指令。采用.sect汇编指令建立一个简单的跳转指令表就可以实现这个功能。
(6)在汇编语言中,注意必须在中断程序名前加一下划杠。例如,c语言中的c_int1,在汇编语言中为_c_int1。
(7)中断程序或在中断程序中需要调用的程序都不能用_oe选项进行优化编译。
五、表达式分析
当C程序中需要计算整型表达式时,必须注意到以下几点:
1. 算术上溢和下溢。即使采用16位操作数,TMS320C2X/C5X也产生32位结果。因此,算术溢出是不能以一种可预测的方式进行处理的。
2. 整除和取模。TMS320C2X/C5X没有直接提供整除指令,因此,所有的整除和取模运算都需要调用库函数来实现。这些函数将运算表达式的右操作数压人堆栈,将左操作数放入累加器的低16位。函数的计算结果在累加器中返回。
3. 32位表达式分析。下面的的一些运算在函数调用时并不遵循标准的C调用规则,目的在于提高程序运行速度和减少程序代码空间。
(1)通过变量的左移(2)通过变量的右移(3)除法(4)取模(5)乘法
4. C代码访问16位乘法结果的高16位。采用如下方法可以访问16乘法结果的高16位。无需调用32位乘法的库函数。
(1)有符号结果:
int m1,m2,result;
result=((long)ml*(long)m2) >> 16;
(2)无符号结果:
unsign m1,m2,result;
result=((unsigned long)m1*(unsigned long)m2) >> 16;
TMS320C2X/C5X的C编译器将浮点数表示为IEEE单精度格式。单精度数和双精度数都表示位32位,两者没有任何区别。在TMS320C2X/C5X的浮点库中提供了一组浮点数学库函数,如加法、减法。乘法、除法、比较、整数和浮点数转换、标准的错误处理等。这些函数也不遵循标准的C调用规则。调用这些函数时,C编译器先将参数压人运行堆栈,然后调用浮点库函数。函数执行时,首先将参数从堆栈中弹出,然后执行函数运算,最后将运算结果压人堆栈返回。
有些浮点库函数需要整型或长整型参数或返回整型或长整型结果,对这些函数,用累加器的低16位传递或返回整型数,而用累加器的所有32位传递或返回长整型数。
六、TMS320C2X/C5X C语言程序开发举例
本节我们以TMS320C2X为例,说明定点DSP芯片C程序的开发过程。软件开发过程与浮点DSP芯片的开发过程相类似,主要分以下几个步骤:
1. 用编辑器(如EDIT、PE2等)编辑一个或多个C程序,如example1.c,example2.c。
2. 用一步编译程序dspcl.exe对C程序编译汇编形成目标文件,如example1.obj,example2.obj:
dspcl_v25_g_mn_o2 example1.c
dspc_v25_g_mn_o2 example2.c
命令选项中的_v25表示是TMS320C2X,若是TMS320C5X,则选项为_v50。
3. 根据实际应用编辑一个链接命令文件,如example.cmd。下面是一个典型的TMS320C25的链接命令文件:
例2.3 TMS320C25链接命令文件
example.cmd /* 命令文件名*/
-c /*ROM初始化*/
-o example.out /*输出文件名为example.out*/
-m example.map /*同时产生映象文件example.map*/
example1.obj /*第一个C目标文件*/
example2.obj /*第二个C目标文件*/
-l rts25.lib /*链入TMS320C25运行支持库*/
-l flib25.lib /*链入TMS320C25浮点库*/
MEMORY
PAGE0:VECS: origin=0h len=30h
PAGE0ROG: orgin=30h len=0EFDOh /*程序空间*/
PAGE1ATA: origin=800h len=OE800h /*数据空间*/
SECTIONS
vecs:{}>VECS /*中断矢量*/
.text:{}>PROG PAGE0 /*代码*/
.cinit:{}> PROG PAGE0 /*C初始化表*/
.switch:{}>PROG PAGE0 /*switch语句表*/
.bss:{}>DATA PAGE1 /*变量*/
.const:{}>DATA PAGE1 /*常数变量*/
.stack:{}>DATA PAGE1 /*系统堆栈*/
.sysmem:{}>DATA PAGE1 /*动态存储器*/
4. 链接形成example.out:
dsplnk example.cmd
5. 用C源码调试器进行调试(模拟器、硬件仿真器等)。
例2.4 用C语言编写一个TMS320C5X的输入输出程序,并用simulator进行调试。
/*本程序是TMS320C5X的一个I/O口输入和输出程序,程序从I/O口地址0x0读人8位数据并存人数组中,同时将另一数组的数值写至I/O口地址0x1*/
#include "ioports.h" /*包含ioports.h头文件*/
#define RD_PORT Ox00; /*定义输入I/O口*/
#define WR_PORT Ox01; /*定义输出I/O口*/
1nt indata[5],outdata[5]; /*定义全局数组*/
main()
int i;
for(i=0;i<5;i++) outdata=i<<2; /*初始化outdata数组*/
for(i=0;i<5;i++) /*循环5次*/
inport(RD_PORT,&indata); /*读I/O口*/
outport(WR_PORT,outdata); /*写I/O口*/
用TMS320C5X simulator调试I/O口时,将I/O口与一文件相关联。这里我们建立两个文件RD.DAT和WR.DAT,并将RD.DAT文件初始化为:
0x0011
0x0022
0x0033
0x0044
0x0055
上述程序运行结束后,可以观察数组indata及文件WR.DAT。正确的结果应为indata[5]={0x11,0x22,0x33,0x44,0x55},文件WR.DAT应为
0x0000
0x0004
0x0008
0x00C0
0x0010
例2.5 用C语言编写一个具有中断功能的TMS320C50程序,用硬件仿真器进行调试。
/*本程序是TMS320C50的一个串行口输入输出程序。TMS320C50与PCM编译码器MC14LC5480通过串行口相接。中断程序从串行口读人8位数据,并将它写回串行口*/
#define VEC_ADDR(volatile int * )0x00; /*矢量地址*/
Fvolatile int * RCV_ADD=(volatile int *)0x20; /*C50串行口接收寄存器地址*/
volatile int * XMT_ADD=(volatile int *)0x21; /*C50串行口发送寄存器地址*/
int indata; /*定义全局变量*/
main()
{
volatile int * INTVEC=VEC_ADDR; /*矢量指针*/
INTVEC[]=(volatile int)c_int5; /*置串行口接收中断矢量*/
/*初始化串行口*/
asm("SPLK #0CH,SPC "; /*F0=FSM=1,DLB=MCM=TXM=0*/
asm("OPL #0C0H,SPC "; /*XRST=RRST=1*/
for(;; /*等待中断*/
}
void c_int5() /*串行口接收中断*/
{
indata=RCV_ADD[0];
XMT_ADD[0]=indata;
以上附录中我们介绍了用C语言开发DSP芯片的方法。用C语言开发DSP芯片缩短了开发周期,提高了程序开发的效率,也使程序的可读性和可移植性大大提高,对于系统的改进和升级换代也带来了极大的便利。当然,用目前的C编译器生成的程序代码,其效率还不能完全与手工编写的效率相比拟“,因此实际DSP应用系统中往往采用C和汇编的混合编写方法.