用C语言实现TMS320C2X/C5X应用

Aguilera · 发表于2017-11-11 23:04

用C语言实现TMS320C2X/C5X应用 [复制链接]

一、存储器模式

TMS320C2X/C5X定点处理器有两种类型的存储器：程序存储器和数据存储器。在程序存储器中主要包含可执行的程序代码，在数据存储器中，则主要包含外部变量、静态变量和系统堆栈。由C程序生成的每一块程序或数据存放于存储空间的一个连续块中。

（一）C编译器生成的块

由TMS320C2X/C5X编译器编译生成的块共有六种，可分为两大类。在六种块中，除了具有浮点C编译器生成的五种块之外，还有一个.switch块，它是一个已初始化块，包含为 .switoh语句建立的表格。

（二）C系统堆栈

定点C系统堆栈的作用与浮点c编译器的C系统堆栈的作用完全相同，管理堆栈的方法也基本类似。但管理C相同堆栈所用的寄存器是不一样的。定点C编译器采用下面两个寄存器来管理这个堆栈：

AR1——是堆栈指针（SP）。它指向堆栈的顶部。

AR0——帧指针（FP）。指向当前帧的开始。

激活每个函数时，都在堆栈中建立一个新的帧，以用于分配局部变量和临时变量。C环境能够自动管理这些寄存器。如果需要编写用到运行堆栈的汇编程序，必须正确使用这些寄存器。

与浮点C编译器一样，定点C编译器的堆栈长度也由链接器确定，全局符号_STACK_SIZE的值等于堆栈长度，单位为字节，缺省值为1K字节。同样，需要改变堆栈长度时，在链接时用-stack选项，并在其后指定一个数值。

（三）动态存储器分配

在运行支持库中，有几个允许在运行时进行动态存储器分配的函数，如malloc、calloc、realloc，动态存储器分配的方法与浮点C编译器的动态存储器分配完全相同。

（四）静态和全局变量的存储器分配

在C程序中说明的每一个外部或静态变量被分配给一个唯一的连续空间。空间的地址

由链接器确定。编译器保证这些变量的空间分配在多个字中以使每个变量按字边界对准。

（五）域/结构的对准

编译器为结构分配空间时，它分配足够的字以包含所有的结构成员，在一组结构中，每个结构开始于字边界。

所有的非域类型对准于字的边界。对域分配足够多的比特，相邻域组装进一个字的相邻比特，但不跨越两个字。如果一个域要跨越两个字，则整个域分配到下一个字中。

二、寄存器规则

与浮点C编译器一样，在定点c编译器中也定义了严格的寄存器使用规则。这些规则对于编写汇编语言与C语言的接口非常重要。如果编写的汇编程序不符合寄存器使用规则，则C环境将被破坏。

C编译器使用寄存器的方法在使用和不使用优化器时是不一样的。因为优化器需要使用额外的寄存器作为寄存器变量以提高程序的运行效率。但函数调用时保护寄存器的规则在使用和不使用优化器时是一样的。下面我们来介绍定点C编译器使用寄存器的规则。

（一）特定寄存器

定点C环境中保留了三个寄存器：AR0、AR1、AR2，它们的作用如下：

AR0——帧指针

AR1——堆栈指针

AR2——局部变量指针（用于计算局部变量的地址）

（二）寄存器使用

汇编用于函数中，可以使用辅助寄存器、T寄存器和P寄存器、各种状态寄存器，在使用时必须符合下列规则：

1. 辅助寄存器（ARP和AR0 ~ AR7）

函数进入和返回时，ARP必须为1，也就是说当前的辅助寄存器为AR1。函数执行时可以是其它值。

AR0和AR1可以在函数执行过程中修改，但它们必须恢复。

AR2、AR3、AR4和AR5可以自由使用，也就是说，在函数执行过程中可以修改，也不必恢复。

AR6和AR7用作寄存器变量。如果在函数中被修改，必须加以保护和恢复。

2. 状态寄存器

在C编译器中，始终假定PM状态位为0。如果函数改变PM值，则在函数返回时必须将PM重新设置为0。在TMS320C5X中，TRM位必须保持为0，硬件复位时TRM为0。对其它状态位既可以修改，也不必恢复。如DP、C、FSM、HM、INTM、OV、OVM、SXM、TC、TXM、CNF、FO和XF等。

3. 其它寄存器

累加器ACC可以自由使用，不必保护和恢复。ACC可以用来返回整数、指针和浮点值、P和T寄存器也可以自由使用

（三）寄存器变量

在一个函数中，定点Ｃ编译器可以自由使用多至两个寄存器变量。如果要在函数中使用寄存器变量，则应在函数的参数表或函数的第一块中定义。否则，作为一般的变量处理。编译器用AR6和AR7作为寄存器变量，其中AR6分配给第一个寄存器变量，AR7分配给第二个寄存器变量。由于在运行时建立一个寄存器变量约需4个指令周期，因此，只有当一个变量访问2次以上，使用寄存器变量的效果才能明显地体现出来。

三、函数调用规则

定点C编译器也规定了一组严格的函数调用规则。除了特殊的运行支持函数外，任何调用C函数或被C函数所调用的函数都必须遵循这些规则，否则就会破坏C环境，造成不可预测的后果。

（一）参数传递

将参数传递给一个C函数时，必须遵循下列规则：

（1）函数调用前，将多数压入运行堆栈。。

（2）以逆序传递参数。也就是说。第一个参数（最左边）最后压栈，而最后一个参数（最右边）最先压栈。

（3）若参数是浮点数或长整型数，则低位字先压栈，高位字后压栈。

（4）传递结构时，采用多字方式。

（二）局部帧的产生

函数被调用时，编译器在运行栈中建立一个帧以存储信息。当前函数帧称为局部帧。C环境利用局部帧来保护调用者的有关信息、传递参数和生成局部变量。每调用一个函数，就建立一个新的帧。

上面已经介绍，寄存器AR1为SP，AR0为FP，SP指向栈顶，FP指向局部帧。编译器在建立局部帧时完成如下工作：

（1）从TMS320C2X/C5X的内部堆栈中弹出返回地址，并压人C运行堆栈。

（2）将旧的FP的内容压人C运行堆栈，并将FP设置为当前的SP。

（3）增加SP。增加的值等于需要保存的局部变量的字的个数加1，其中，额外的一个字位于帧的开始，用于存储临时变量。

（4）若函数使用AR6和AN7作为寄存器变量，则将它们的内容压人堆栈，然后装人相应局部变量的地址。

下面是完成上述工作的TMS320C2X的汇编程序，其中SIZE是局部帧的长度。

例2.1 调用函数时的初始处理

POPD * + ；将返回地址压人C堆栈

SAR AR0, * + ；保护旧FP

SAR AR1, *

LARK AR0, SIZE

LAR ARO, * 0 + ；FP= 旧的SP，SP＝SP+ SIZE

SAR AR6,* + ；保护AR6

SAR AR7, * + ；保护AR7

下面是一些产生局部帧时的注意事项：

（1）函数进入时，编译器认为ARP为1。

（2）没有独立的参数表指针。指向参数时，帧指针用负偏移，指向局部变量时，用正偏移；

（3）帧指针AR0指向一个独立的字，这个字在局部变量前分配，用于存储临存值，通过AR0直接访问。

（4）编译器用AR2来计算局部变量的地址。一般来说，局部变量的偏移值放在AR2中，然后加上AR0。

（5）对TMS320C5X来说上面的程序稍有不同，但作用是一样的。

（三）函数结束

函数结束返回时，必须完成如下工作以恢复C调用环境：

（1）处理要传递给调用者的返回值；

（2）如果使用了AR6和AR7，则必须予以恢复；

（3）撤销为局部变量和临存值分配的空间；

（4）恢复原来的帧指针；

（5）将返回地址压人TMS320C2X/C5X的堆栈并返回调用程序。

下面是完成上述工作的TMS320C2X汇编程序。

例2.2 TMS320C2X C函数的结束处理

LAR AR7，* - ；恢复AR7

LAR AR6, * - ；恢复0柏

SBRK SIZE ；撤销局部帧

LAR AR0，* - ；恢复FP

PSHD* ；返回地址压人内部堆栈

RET ；返回

需要注意的是：

（1）函数在ACC中返回函数值。整数和指针在ACC的低16位中返回，浮点数和长整型数使用ACC全部32位返回。

（2）由于用ACC返回函数值，因此，必须保证ACC不被结束程序所修改。

（3）参数不是由被调用的函数弹出堆栈，而是必须由调用函数弹出。因此，调用者可以传递任意数目的参数至函数，同时，函数也不必知道有多少个参数传递。

（4）从函数返回时，ARP指向AR1.

四、中断函数

在定点C编译器中，中断可以用C函数直接处理。每个中断采用固定的程序名。如下所示：

c_int0 系统复位中断

c_int1 外部中断0

c_int2 外部中断1

c_int3 外部中断2

c_int4 内部定时器中断

C_int5 串行口接收中断

c_int6 串行口发送中断

c_int7 TDM 口接收中断

c_int8 TDM口发送中断

c_int9 外部中断3

调用上述中断程序时，首先调用一个名为I$$SAVE的子程序，这个子程序保护了所有的寄存器。同样，在函数返回时，调用一个名为1$$REST的子程序用于恢复被保护的寄存器。

用C语言编写中断程序时，必须注意以下几点：

（1）对由SP（AR1）指向的字，编译器可能正在使用，因此必须加以保护。

（2）中断的屏蔽和使能必须由程序员设置，设置的方法是用嵌人汇编语句的方法修改IMR寄存器。这样修改不会破坏C环境或C指针。

（3）中断程序没有参数传递，即使说明，也将被忽略。

（4）由于用C编写中断程序时，需要保护所有的寄存器，因此效率不高。

（5）将一个程序与某个中断关联时，必须在相应的中断矢量处放置一条跳转指令。采用.sect汇编指令建立一个简单的跳转指令表就可以实现这个功能。

（6）在汇编语言中，注意必须在中断程序名前加一下划杠。例如，c语言中的c_int1，在汇编语言中为_c_int1。

（7）中断程序或在中断程序中需要调用的程序都不能用_oe选项进行优化编译。

五、表达式分析

当C程序中需要计算整型表达式时，必须注意到以下几点：

1. 算术上溢和下溢。即使采用16位操作数，TMS320C2X/C5X也产生32位结果。因此，算术溢出是不能以一种可预测的方式进行处理的。

2. 整除和取模。TMS320C2X/C5X没有直接提供整除指令，因此，所有的整除和取模运算都需要调用库函数来实现。这些函数将运算表达式的右操作数压人堆栈，将左操作数放入累加器的低16位。函数的计算结果在累加器中返回。

3. 32位表达式分析。下面的的一些运算在函数调用时并不遵循标准的C调用规则，目的在于提高程序运行速度和减少程序代码空间。

（1）通过变量的左移（2）通过变量的右移（3）除法（4）取模（5）乘法

4. C代码访问16位乘法结果的高16位。采用如下方法可以访问16乘法结果的高16位。无需调用32位乘法的库函数。

（1）有符号结果：

int m1,m2,result；
result=((long)ml*(long)m2) >> 16;

（2）无符号结果：

unsign m1,m2,result;
result=((unsigned long)m1*(unsigned long)m2) >> 16;

TMS320C2X/C5X的C编译器将浮点数表示为IEEE单精度格式。单精度数和双精度数都表示位32位，两者没有任何区别。在TMS320C2X/C5X的浮点库中提供了一组浮点数学库函数，如加法、减法。乘法、除法、比较、整数和浮点数转换、标准的错误处理等。这些函数也不遵循标准的C调用规则。调用这些函数时，C编译器先将参数压人运行堆栈，然后调用浮点库函数。函数执行时，首先将参数从堆栈中弹出，然后执行函数运算，最后将运算结果压人堆栈返回。

有些浮点库函数需要整型或长整型参数或返回整型或长整型结果，对这些函数，用累加器的低16位传递或返回整型数，而用累加器的所有32位传递或返回长整型数。

六、TMS320C2X/C5X C语言程序开发举例

本节我们以TMS320C2X为例，说明定点DSP芯片C程序的开发过程。软件开发过程与浮点DSP芯片的开发过程相类似，主要分以下几个步骤：

1. 用编辑器（如EDIT、PE2等）编辑一个或多个C程序，如example1.c，example2.c。

2. 用一步编译程序dspcl.exe对C程序编译汇编形成目标文件，如example1.obj，example2.obj：

dspcl_v25_g_mn_o2 example1.c

dspc_v25_g_mn_o2 example2.c

命令选项中的_v25表示是TMS320C2X，若是TMS320C5X，则选项为_v50。

3. 根据实际应用编辑一个链接命令文件，如example.cmd。下面是一个典型的TMS320C25的链接命令文件：

例2.3 TMS320C25链接命令文件

example.cmd /* 命令文件名*/

-c /*ROM初始化*/

-o example.out /*输出文件名为example.out*/

-m example.map /*同时产生映象文件example.map*/

example1.obj /*第一个C目标文件*/

example2.obj /*第二个C目标文件*/

-l rts25.lib /*链入TMS320C25运行支持库*/

-l flib25.lib /*链入TMS320C25浮点库*/

MEMORY

PAGE0:VECS: origin=0h len=30h

PAGE0ROG: orgin=30h len=0EFDOh /*程序空间*/

PAGE1ATA: origin=800h len=OE800h /*数据空间*/

SECTIONS

vecs:{}>VECS /*中断矢量*/

.text:{}>PROG PAGE0 /*代码*/

.cinit:{}> PROG PAGE0 /*C初始化表*/

.switch:{}>PROG PAGE0 /*switch语句表*/

.bss:{}>DATA PAGE1 /*变量*/

.const:{}>DATA PAGE1 /*常数变量*/

.stack:{}>DATA PAGE1 /*系统堆栈*/

.sysmem:{}>DATA PAGE1 /*动态存储器*/

4. 链接形成example.out：

dsplnk example.cmd

5. 用C源码调试器进行调试（模拟器、硬件仿真器等）。

例2.4 用C语言编写一个TMS320C5X的输入输出程序，并用simulator进行调试。

/*本程序是TMS320C5X的一个I/O口输入和输出程序，程序从I/O口地址0x0读人8位数据并存人数组中，同时将另一数组的数值写至I/O口地址0x1*/

＃include  "ioports.h"          /*包含ioports.h头文件*/
＃define  RD_PORT  Ox00;    /*定义输入I/O口*/
＃define  WR_PORT  Ox01;    /*定义输出I/O口*/
1nt indata[5],outdata[5];          /*定义全局数组*/
main()
int i;
for(i=0;i<5;i++) outdata=i<<2;    /*初始化outdata数组*/
for(i=0;i<5;i++)                /*循环5次*/
inport(RD_PORT,&indata);    /*读I/O口*/
outport(WR_PORT,outdata);    /*写I/O口*/

用TMS320C5X simulator调试I/O口时，将I/O口与一文件相关联。这里我们建立两个文件RD.DAT和WR.DAT，并将RD.DAT文件初始化为：

0x0011

0x0022

0x0033

0x0044

0x0055

上述程序运行结束后，可以观察数组indata及文件WR.DAT。正确的结果应为indata[5]={0x11,0x22,0x33,0x44,0x55}，文件WR.DAT应为

0x0000

0x0004

0x0008

0x00C0

0x0010

例2.5 用C语言编写一个具有中断功能的TMS320C50程序，用硬件仿真器进行调试。

/*本程序是TMS320C50的一个串行口输入输出程序。TMS320C50与PCM编译码器MC14LC5480通过串行口相接。中断程序从串行口读人8位数据，并将它写回串行口*/

#define VEC_ADDR(volatile int * )0x00;    /*矢量地址*/
Fvolatile int * RCV_ADD=(volatile int *)0x20; /*C50串行口接收寄存器地址*/
volatile int * XMT_ADD=(volatile int *)0x21; /*C50串行口发送寄存器地址*/
int indata;                               /*定义全局变量*/
main()
{
volatile int * INTVEC=VEC_ADDR;    /*矢量指针*/
INTVEC[]=(volatile int)c_int5;          /*置串行口接收中断矢量*/
/*初始化串行口*/
asm("SPLK #0CH,SPC ";             /*F0=FSM=1,DLB=MCM=TXM=0*/
asm("OPL #0C0H,SPC ";                /*XRST=RRST=1*/
for(;;                            /*等待中断*/
}
void c_int5()                         /*串行口接收中断*/
{
indata=RCV_ADD[0];
XMT_ADD[0]=indata;

以上附录中我们介绍了用C语言开发DSP芯片的方法。用C语言开发DSP芯片缩短了开发周期，提高了程序开发的效率，也使程序的可读性和可移植性大大提高，对于系统的改进和升级换代也带来了极大的便利。当然，用目前的C编译器生成的程序代码，其效率还不能完全与手工编写的效率相比拟“，因此实际DSP应用系统中往往采用C和汇编的混合编写方法.