★ 社区积分制度 ★ 新手必读 ★ 申请版主★

电子工程世界-论坛»论坛 › 专业技术中心 › TI技术论坛 › DSP 与 ARM 处理器 › TMS320C66x学习笔记之内联指令

返回列表发新帖回复

阅 1804|回 0

3836 帖子	19 TA的资源

纯净的硅（中级）

楼主

发表于2018-9-23 18:48 只看该作者

TMS320C66x学习笔记之内联指令 [复制链接]

/*****************************************************************************/
/*  C6X.H v7.4.12                                                          */
/*****************************************************************************/

#include "vect.h"

  typedef double __float2_t;//__float2_t双精度浮点型

  #define _lltof2  _lltod
  #define _f2toll  _dtoll //将一个__float2_t解释成一个long long
  #define _ftof2 _ftod
  #define _hif2 _hif
  #define _lof2 _lof
  #define _f2tol _dtol    //将一个__float2_t解释成一个__int40
  #define _ltof2 _ltod

  #define _amem8_f2       _amemd8    //加载和存储8bytes，指针必须8byte对齐，必须包含c6x.h
  #define _amem8_f2_const _amemd8_const //加载8bytes，指针必须8byte对齐，必须包含c6x.h
  #define _mem8_f2          _memd8       //从内存里加载一个64位值
  #define _mem8_f2_const    _memd8_const
  #define _fdmv_f2          _fdmv
  #define _hif2_128       _hid128
  #define _lof2_128       _lod128
  #define _f2to128          _dto128
  #define _fdmvd_f2       _fdmvd

/*从src2里提取csta和cstb指定的区域且符号扩展到32位。提取出的区域先符号左移再右移。*/
int    _ext    (int src2,    unsigned csta, unsigned cstb);
int    _extr    (int src2,    int src1);//同上，区别左右移的位数由src1的低10位指定
unsigned  _extu    (unsigned src2, unsigned csta, unsigned cstb);//同上上，区别最后是0扩展到32位
unsigned  _extur (unsigned src2, int src1);//同上，区别左右移的位数由src1的低10位指定

/*通过cstb和csta指定需要置1的首位和尾位*/
unsigned  _set    (unsigned src, unsigned csta, unsigned cstb);
unsigned  _setr    (unsigned src2, int src1);//将src2中指定位置1，置1的首位和末位有src1的低10位指定

/*通过cstb和csta指定需要清0的首位和尾位*/
unsigned  _clr    (unsigned src, unsigned csta, unsigned cstb);
unsigned  _clrr    (unsigned src2, int src1);//将src2中指定位清0，清0的首位和末位有src1的低10位指定

/*将src1和src2相加，且饱和其结果*/
int    _sadd    (int,    int);
__int40_t _lsadd (int, __int40_t);
/*从src1中减去src2并饱和结果*/
int       _ssub    (int src1,    int src2);
__int40_t _lssub (int, __int40_t);

/*将一个40bit的long转换成一个32bit的有符号int，如有需要，对结果进行饱和*/
int    _sat    (__int40_t);

/*将src2左移src1位，结果饱和在32位*/
int    _sshl    (int src2,    unsigned src1);
/*把src1的高、低16位和src2的高、低16位分别相加，放入结果的高、低16位*/
int       _add2    (int,    int);
int       _sub2    (int,    int);/*把src1的高、低16位减去src2的高、低16位，放入结果的高、低16位*/

/*有条件减和左移（常用于除法）*/
unsigned  _subc    (unsigned, unsigned);
/*搜索src2里面的1或0,1或0是由src1的LSB决定的，返回比特位变换的位数*/
unsigned  _lmbd    (unsigned src1, unsigned src2);
/*返回src的绝对值*/
int    _abs    (int src);
__int40_t _labs    (__int40_t src);

/*返回src的冗余的符号比特位的个数，bit31是符号位，例如bit31往低位走，01b返回0,001b返回1,0001b返回2,00001b返回3*/
unsigned  _norm    (int);
unsigned  _lnorm (__int40_t);

//16 LSBs * 16 LSBs
int       _mpy    (int src1,    int src2);/*src1和src2相乘，操作数默认为有符号*/
int       _mpyus (unsigned src1, int src2);/*无符号src1和有符号src2相乘，S是用来确定哪个是有符号数（S）哪个是无符号数（U）*/
int       _mpysu (int,    unsigned);
unsigned  _mpyu    (unsigned, unsigned);
//16 MSBs * 16 MSBs
int       _mpyh    (int,    int);
int       _mpyhus  (unsigned, int);
int       _mpyhsu  (int,    unsigned);
unsigned  _mpyhu (unsigned, unsigned);
//16 MSBs * 16 LSBs
int       _mpyhl (int,    int);
int       _mpyhuls (unsigned, int);
int       _mpyhslu (int,    unsigned);
//16 LSBs * 16 MSBs
int       _mpylh (int,    int);
int       _mpyluhs (unsigned, int);
int       _mpylshu (int,    unsigned);
unsigned  _mpylhu  (unsigned, unsigned);
//与上面的乘法指令区别在何处
/*把src1的低16位和src2的低16位相乘,之后左移一位*/
int       _smpy    (int src1,    int src2);
int       _smpyhl  (int,    int);//高16位 * 低16位
int       _smpylh  (int,    int);//低16位 * 高16位
int       _smpyh (int,    int);//把src1的高16位和src2的高16位相乘
/*将src1和src2中的2对16位有符号数相乘，然后左移1位，再进行饱和*/
long long _smpy2ll (int,    int);
/*32位有符号数乘以32位有符号数，64位的结果左移1位然后饱和，然后将之后的结果的高32位写入dst*/
int    _smpy32 (int,    int);

/*返回double寄存器的高32位（奇数位寄存器）作为int型*/
unsigned  _hi(double);
/*返回double寄存器的高32位（奇数位寄存器）作为float型*/
float    _hif(double);
/*返回long long寄存器的高32位（奇数位寄存器）作为int型*/
unsigned  _hill(long long);
/*返回double寄存器的低32位（偶数位寄存器）作为int型*/
unsigned  _lo(double);
/*返回double寄存器的低32位（偶数位寄存器）作为float型*/
float    _lof(double);
/*返回long long寄存器的低32位（偶数位寄存器）作为int型*/
unsigned  _loll(long long);

/*创建一个新的double寄存器来保存2个unsigned int的值，其中src2是高（奇数）寄存器，src1是低（偶数）寄存器*/
double    _itod(unsigned, unsigned);
/*创建一个新的double寄存器来保存2个float的值，其中src2是高（奇数）寄存器，src1是低（偶数）寄存器*/
double    _ftod(float, float);
/*创建一个新的long long寄存器来保存2个unsigned int的值，其中src2是高（奇数）寄存器，src1是低（偶数）寄存器*/
long long _itoll(unsigned src2, unsigned src1);

/*注意不是变换，是直接将寄存器中的值解释成整型或者浮点型*/
float       _itof(unsigned);    /* 将一个int寄存器重新解释成一个float型    */
unsigned  _ftoi(float);       /* 将float的比特位解释成unsigned int       */
__int40_t _dtol(double);       /* 将一个double寄存器重新解释成一个_int40_t型*/
double _ltod(__int40_t);    /* 将一个__int40_t寄存器重新解释成一个double型*/
long long _dtoll(double);    /* 将一个double寄存器重新解释成一个long long型*/
double _lltod(long long); /* 将一个long long寄存器重新解释成double型 */

  /* Define pseudo intrinsics for some pseudo instructions */
  #ifndef _cmplt2
  #define _cmplt2(src1, src2) _cmpgt2((src2), (src1))
  #endif
  #ifndef _cmpltu4
  #define _cmpltu4(src1, src2) _cmpgtu4((src2), (src1))
  #endif
  #ifndef _dotpnrus2
  #define _dotpnrus2(src1, src2) _dotpnrsu2((src2), (src1))
  #endif
  #ifndef _dotpus4
  #define _dotpus4(src1, src2) _dotpsu4((src2), (src1))
  #endif
  #ifndef _mpyihll
  #define _mpyihll(src1, src2) _mpyhill((src2), (src1))
  #endif
  #ifndef _mpyihr
  #define _mpyihr(src1, src2) _mpyhir((src2), (src1))
  #endif
  #ifndef _mpyilll
  #define _mpyilll(src1, src2) _mpylill((src2), (src1))
  #endif
  #ifndef _mpyilr
  #define _mpyilr(src1, src2) _mpylir((src2), (src1))
  #endif
  #ifndef _mpyus4ll
  #define _mpyus4ll(src1, src2) _mpysu4ll((src2), (src1))
  #endif
  #ifndef _saddsu2
  #define _saddsu2(src1, src2) _saddus2((src2), (src1))
  #endif
  #ifndef _swap2
  #define _swap2(src) _packlh2((src), (src))
  #endif
/*把src1和src2的4对8bits相加，不会进行饱和，进位不会影响其他的8位数*/
int    _add4    (int,    int);
/*计算2对有符号16位数的平均值*/
int    _avg2    (int,    int);
/*计算4对有符号8位数的平均值*/
unsigned  _avgu4    (unsigned, unsigned);
/*比较2对16位数的值是否相等，结果放入dst的最低2位，相等返回1*/
int    _cmpeq2 (int,    int);
/*比较4对8位数的值是否相等，结果放入dst的最低4位，相等置1，否则为0*/
int    _cmpeq4 (int,    int);
/*比较2对有符号16位数，src1 > src2，置为1；否则为0.结果放入dst的最低2位*/
int    _cmpgt2 (int src1,    int src2);
/*比较4对无符号8位数，src1 > src2，置为1；否则为0.结果放入dst的最低4位*/
unsigned  _cmpgtu4 (unsigned src1, unsigned src2);

/*将src1和src2中的2对16位有符号数进行点积（相加），结果被写成有符号32位int或者符号扩展为64位*/
int    _dotp2    (int ,    int);
__int40_t _ldotp2 (int,    int);
/*将src1和src2中的16位有符号数进行点积相减*/
int    _dotpn2 (int,    int);
/*src1和src2中的高16位的点积“减去”低16位的点积。src1中的数被当做有符号数，src2中的数被当做无符号数，再加上2^15，结果再带符号右移16位*/
int    _dotpnrsu2 (int src1,    unsigned src2);
/*src1和src2中的高16位的点积“加上”低16位的点积。src1中的数被当做有符号数，src2中的数被当做无符号数，再加上2^15，结果再带符号右移16位*/
int    _dotprsu2  (int,    unsigned);
/*将src1和src2的4对8位数进行相乘再求和，src1的每8位数被当做有符号数，src2的每8位数被当做无符号数*/
int    _dotpsu4 (int,    unsigned);
unsigned  _dotpu4 (unsigned, unsigned);//同上，都被当做无符号数

/*将src1和src2的4对8位无符号数进行迦罗瓦域的乘法*/
int    _gmpy4    (int,    int);

/*将src1和src2中的2对16位有符号数比较，取较大值*/
int    _max2    (int,    int);
/*将src1和src2中的4对8位无符号数比较，取较大值*/
unsigned  _maxu4    (unsigned, unsigned);
/*将src1和src2中的2对16位有符号数比较，取较小值*/
int    _min2    (int,    int);
/*将src1和src2中的4对8位无符号数比较，取较小值*/
unsigned  _minu4    (unsigned, unsigned);

/*将src1和src2中的2对16位有符号数分别相乘，将2个32位的结果写入long long中*/
long long _mpy2ll (int,    int);
/*将src1中高16位作为1个16位有符号数乘以src2的32位有符号数，结果写入long long的低48位*/
long long _mpyhill (int src1,    int src2);
/*将src1中低16位作为1个16位有符号数乘以src2的32位有符号数，结果写入long long的低48位*/
long long _mpylill (int,    int);
/*将src1的高16位作为1个16位有符号数乘以src2的32位有符号数。乘积利用round模式通过加2^14转成32位，最后再右移15位*/
int    _mpyhir (int,    int);
/*将src1的低16位作为1个16位有符号数乘以src2的32位有符号数。乘积利用round模式通过加2^14转成32位，最后再右移15位*/
int    _mpylir (int,    int);
/*将src1的4个8位有符号乘src2的4个8位无符号数，得到4个16位有符号数，组成一个64位*/
long long _mpysu4ll  (int src1,    unsigned src2);
long long _mpyu4ll (unsigned, unsigned);//同时，都是无符号数

/*将src1的低16位放入返回值的高16位，src2的低16位放入返回值的低16位*/
unsigned  _pack2    (unsigned src1, unsigned src2);
/*将src1的高16位放入返回值的高16位，src2的高16位放入返回值的低16位*/
unsigned  _packh2 (unsigned, unsigned);
/*将src1（a_3|a_2|a_1|a_0）和src2（b_3|b_2|b_1|b_0）分成4对8位无符号数，返回a_3|a_1|b_3|b_1*/
unsigned  _packh4 (unsigned, unsigned);
/*将src1（a_3|a_2|a_1|a_0）和src2（b_3|b_2|b_1|b_0）分成4对8位无符号数，返回a_2|a_0|b_2|b_0*/
unsigned  _packl4 (unsigned, unsigned);
/*将src1(a_hi|a_lo)和src2(b_hi|b_lo)分成2对16位无符号数，返回a_hi|b_lo*/
unsigned  _packhl2 (unsigned, unsigned);
/*将src1(a_hi|a_lo)和src2(b_hi|b_lo)分成2对16位无符号数，返回a_lo|b_hi*/
unsigned  _packlh2 (unsigned, unsigned);
/*按照src1的最低5位的数去左移src2的32位，src1中剩下的高5-31位被忽略*/
unsigned  _rotl    (unsigned src1, unsigned src2);
/*将src1和src2中的2个16位有符号数相加，生成2个16位有符号数并饱和*/
int    _sadd2    (int,    int);
/*将src1和src2中的4对8位无符号数相加并饱和*/
unsigned  _saddu4 (unsigned, unsigned);
/*将src1中的2个16位无符号数和src2中的2个16位有符号数相加，得到2个16位无符号数并饱和*/
int    _saddus2 (unsigned src1, int src2);

/*将src2左移1byte，然后将src1的最高1byte填充入src2左移后多出的位置*/
unsigned  _shlmb    (unsigned src1, unsigned src2);
/*将src2右移1byte，然后将src1的最高1byte填充入src2右移后多出的位置*/
unsigned  _shrmb    (unsigned src1, unsigned src2);
/*将src2的2个16位有符号数分别右移，右移位数由src1的低5位决定，多出的位置由符号位扩展*/
int    _shr2    (int src1,    unsigned src2);
/*将src2的2个16位有符号数分别右移，右移位数由src1的低5位决定，多出的位置由0扩展*/
unsigned  _shru2    (unsigned src1, unsigned src2);
/*将src1和src2中的1个32位有符号进行饱和到有符号16位，然后把src1的高16位，src2的饱和结果放入dst的低16位，不懂就看指令手册*/
int    _spack2 (int src1,    int src2);
/*将src1和src2中的2对16位有符号数饱和成8位无符号数*/
unsigned  _spacku4 (int,    int);
/* *
* 将src2中的32位有符号数左移或右移，移位的数量由src1指定的比特数确定。
* src1在[-31,31]之间，如果src1为正，src2则左移；如果src1为负，src2右移|src1|且符号位扩展
* */
int    _sshvl    (int src2,    int src1);
/* *
* 将src2中的32位有符号数左移或右移，移位的数量由src1指定的比特数确定。
* src1在[-31,31]之间，如果src1为正，src2则右移且是符号位扩展；如果src1为负，src2左移|src1|
* */
int    _sshvr    (int src2,    int src1);
/*将src1和src2中的4对8位数相减，不进行饱和*/
int    _sub4    (int src1,    int src2);
/*将src1和src2中的4对8位无符号数相减求绝对值*/
int    _subabs4 (int src1,    int src2);

/*分别计算高、低16位的绝对值*/
int    _abs2    (int);
/*统计4对8位比特数是1的个数，写入结果对应位置*/
unsigned  _bitc4    (unsigned);
/*颠倒比特位的顺序*/
unsigned  _bitr    (unsigned);
/*将src中的比特位的奇数位和偶数位抽出来进行重组，偶数位放在低的16位，奇数位放在高的16位*/
unsigned  _deal    (unsigned);
/*将src的数据移入返回值中，利用了乘法流水线（延迟4cycle）*/
int    _mvd    (int src2);
/*将src2的高16和低16位进行交织abcdefghijklmnop|ABCDEFGHIJKLMNOP，返回aAbBcCdDeEfFgGhH|iIjJkKlLmMnNoOpP*/
unsigned  _shfl    (unsigned src2);
/*将src4个8位无符号数(ub_3|ub_2|ub_1|ub_0|)交换位置,返回(ub_2|ub_3|ub_0|ub_1|)*/
unsigned  _swap4    (unsigned);
/*扩展0(高16位2个8位数)，(ub_3|ub_2|ub_1|ub_0|)-->(0|ub_3|0|ub_2|),每个分隔号代表1byte*/
unsigned  _unpkhu4 (unsigned);
/*扩展0(低16位2个8位数)，(ub_3|ub_2|ub_1|ub_0|)-->(0|ub_1|0|ub_0|),每个分隔号代表1byte*/
unsigned  _unpklu4 (unsigned);
/*按src的最低2位进行扩展，bit1扩展高16位，bit0扩展低16位*/
unsigned  _xpnd2    (unsigned);
unsigned  _xpnd4    (unsigned);//同上，按src的最低4位进行扩展，例bit0扩展低8位。

/*平行做2步，1.src1+src2->dst_o 2.src1-src2->dst_e，dst_o代表奇数寄存器，dst_e代表偶数寄存器*/
long long _addsub (int src1,    int src2);
/*同上，分成2对16位有符号数进行ADD2和SUB2*/
long long _addsub2 (unsigned,  unsigned);
/* *
* 饱和(src1低16位和src2高16位的点积加上src1高16位和src2低16位点积)赋给dst_e
* sat((lsb16(src1) × msb16(src2)) + (msb16(src1) × lsb16(src2))) → dst_e
* 有符号16位src1和src2的高16位的点积减去src1和src2低16位的点积赋给dst_o
* (msb16(src1) × msb16(src2)) - (lsb16(src1) × lsb16(src2)) → dst_o
* */
long long _cmpy    (unsigned src1,  unsigned src2);
/* *
* sat((lsb16(src1) × msb16(src2)) + (msb16(src1) × lsb16(src2))) → tmp_e
* msb16(sat(tmp_e + 00008000h)) → lsb16(dst)
* sat((msb16(src1) × msb16(src2)) - (lsb16(src1) × lsb16(src2))) → tmp_o
* msb16(sat(tmp_o + 00008000h)) → msb16(dst)
* */
unsigned  _cmpyr    (unsigned,  unsigned);
/* *
* sat((lsb16(src1) × msb16(src2)) + (msb16(src1) × lsb16(src2))) → tmp_e
* msb16(sat((tmp_e + 00004000h) << 1)) → lsb16(dst)
* sat((msb16(src1) × msb16(src2)) - (lsb16(src1) × lsb16(src2))) → tmp_o
* msb16(sat((tmp_e + 00004000h) << 1)) → msb16(dst)
* */
unsigned  _cmpyr1 (unsigned,  unsigned);
/*看TMS320C6000内联指令汇编的35页图示，完成点积和功能*/
long long _ddotph2 (long long, unsigned);
unsigned  _ddotph2r  (long long, unsigned);
long long _ddotpl2 (long long, unsigned);
unsigned  _ddotpl2r  (long long, unsigned);
long long _ddotp4 (unsigned src1,  unsigned src2);
/*数据打包看37页图示*/
long long _dpack2 (unsigned src1,  unsigned src2);
long long _dpackx2 (unsigned,  unsigned);
/*将两个寄存器移入一个寄存器一次性的*/
long long _dmv    (unsigned,  unsigned);
double _fdmv    (float,    float);
/*迦罗瓦域上的乘法*/
unsigned  _gmpy    (unsigned,  unsigned);
/*进行32位乘32位。都是有符号数，64位结果都被写入dst*/
long long _mpy32ll (int,    int);
/*进行32位乘32位。都是有符号数，64位结果中的低32位写入dst*/
int    _mpy32    (int,    int);
/*src1有符号32位乘以src2无符号32位=有符号64位*/
long long _mpy32su (int,    unsigned);
long long _mpy32us (unsigned,  int); //同上，无符号乘以有符号
long long _mpy32u (unsigned,  unsigned);//同上上，都为无符号
/* *
* 进行16位乘32位。将src1的高16位和低16位当做有符号16位；将src2的值当做有符号32位。
* 乘积通过加上2^14 round到32位，然后结果右移15位。2个结果的低32位写入dst_o:dst_e
* */
long long _mpy2ir (unsigned src1,  int src2);
/*src1和src2的高16位，分别右移1位后饱和，放入32位结果中*/
unsigned  _rpack2 (unsigned src1,  unsigned src2);
/*并行进行1.饱和(src1+src2)->dst_o  2.饱和(src1-src2)->dst_e*/
long long _saddsub (int,    int);
long long _saddsub2  (unsigned,  unsigned);//并行进行SADD2和SSUB2指令
/*不知道干嘛用的，看39页*/
long long _shfl3    (unsigned,  unsigned);
/*src1中的2个16位有符号数减去src2中的2个16位有符号数*/
int    _ssub2    (int src1,    int src2);
/*迦罗瓦乘法*/
unsigned  _xormpy (unsigned,  unsigned);

long long  _dcmpyr1 (long long, long long);
long long  _dccmpyr1 (long long, long long);
long long  _cmpy32r1 (long long, long long);
long long  _ccmpy32r1  (long long, long long);
long long  _mpyu2    (unsigned,  unsigned);
/*4对8位有符号数点积相加*/
int       _dotp4h    (long long, long long);
long long  _dotp4hll (long long, long long);
/*src1中的4对16位有符号数，src2中的4对16位无符号数，得到一个32位的点积和*/
int       _dotpsu4h (long long, long long);
/*src1中的4对16位有符号数，src2中的4对16位无符号数，得到一个64位的点积和*/
long long  _dotpsu4hll (long long, long long);
/*src1的2个32位有符号数加上src2的2个32位有符号数*/
long long  _dadd    (long long src1, long long src2);
long long  _dadd_c    (int,    long long);

long long  _dsadd    (long long, long long);
/*4对16位有符号数相加*/
long long  _dadd2    (long long, long long);
long long  _dsadd2    (long long, long long);
long long  _dsub    (long long, long long);
long long  _dssub    (long long, long long);
long long  _dssub2    (long long, long long);

long long  _dapys2    (long long, long long);
long long  _dshr    (long long, unsigned);
long long  _dshru    (long long, unsigned);
long long  _dshl    (long long, unsigned);
long long  _dshr2    (long long, unsigned);
long long  _dshru2    (long long, unsigned);
unsigned _shl2    (unsigned , unsigned);
long long  _dshl2    (long long, unsigned);
long long  _dxpnd4    (unsigned);
long long  _dxpnd2    (unsigned);
int       _crot90    (int);
long long  _dcrot90 (long long);
int       _crot270 (int);
long long  _dcrot270 (long long);
/*src1和src2中的4对16位有符号数比较，取大者放入dst*/
long long  _dmax2    (long long, long long);
long long  _dmin2    (long long, long long);
/*src1和src2中的8对8位有符号数比较，取大者放入dst*/
long long  _dmaxu4    (long long, long long);
long long  _dminu4    (long long, long long);

/*4对16位比较，相等返回1，不等返回0*/
unsigned _dcmpeq2 (long long, long long);
/*8对8位比较，相等返回1，不等返回0*/
unsigned _dcmpeq4 (long long, long long);
/*4对16位比较，大于返回1，不大于返回0*/
unsigned _dcmpgt2 (long long, long long);
/*8对8位比较，大于返回1，不大于返回0*/
unsigned _dcmpgtu4 (long long, long long);

/*4对16位有符号数求4个平均"(a+b+1)/2"*/
long long  _davg2    (long long, long long);
/*8对8位无符号数求8个平均*/
long long  _davgu4    (long long, long long);
/*有符号16位，无round模式，4个平均"(a+b)/2"*/
long long  _davgnr2 (long long, long long);
/*无符号8位，无round模式，8个平均*/
long long  _davgnru4 (long long, long long);
long long  _unpkbu4 (unsigned);
long long  _unpkh2    (unsigned);
long long  _unpkhu2 (unsigned);

/*并行执行2个PACKL2*/
long long  _dpackl2 (long long, long long);
/*并行执行2个PACKH2*/
long long  _dpackh2 (long long, long long);
long long  _dpackhl2 (long long, long long);
/*并行执行PACKH4和PACKL4*/
long long  _dpacklh4 (unsigned,  unsigned);
long long  _dpackl4 (long long, long long);
long long  _dpackh4 (long long, long long);
long long  _dspacku4 (long long, long long);

void    _mfence    ();
__float2_t _dmpysp    (__float2_t, __float2_t);
/*2路float型相加*/
__float2_t _daddsp    (__float2_t, __float2_t);
__float2_t _dsubsp    (__float2_t, __float2_t);
/*src中的16位有符号数转换成单精度浮点放入dst_e和dst_o中*/
__float2_t _dinthsp (unsigned src);
/*src中的16位无符号数转换成单精度浮点放入dst_e和dst_o中*/
__float2_t _dinthspu (unsigned);
/*src中的32位有符号转换成单精度浮点，放入dst_e和dst_o中*/
__float2_t _dintsp    (long long);
/*src中的32位无符号转换成单精度浮点，放入dst_e和dst_o中*/
__float2_t _dintspu (long long);
unsigned _dspinth (__float2_t);
long long  _dspint    (__float2_t);

int       _land    (int, int);
int       _landn    (int, int);
int       _lor       (int, int);
/*将2个寄存器移入1个寄存器中。一次进行2次移动，当处理很多double word时很有用。减去寄存器压力*/
long long  _dmvd    (int,    int);
double    _fdmvd    (float,    float);

double    _complex_mpysp          (double, double); /* CMPYSP then DADDSP */
double    _complex_conjugate_mpysp (double, double); /* CMPYSP then DSUBSP */

long long  _xorll_c (int, long long);

__x128_t __BUILTIN _dcmpy    (long long, long long);
__x128_t __BUILTIN _dccmpy    (long long, long long);
long long  __BUILTIN _cmatmpyr1  (long long, __x128_t);
long long  __BUILTIN _ccmatmpyr1 (long long, __x128_t);
__x128_t __BUILTIN _cmatmpy (long long, __x128_t);
__x128_t __BUILTIN _ccmatmpy (long long, __x128_t);
__x128_t __BUILTIN _qsmpy32r1  (__x128_t,  __x128_t);
__x128_t __BUILTIN _qmpy32    (__x128_t,  __x128_t);
__x128_t __BUILTIN _dsmpy2    (long long, long long);
/*4对16位有符号数相乘，得到32位有符号数放入128位寄存器中*/
__x128_t __BUILTIN _dmpy2    (long long, long long);
/*4对16位有符号数相乘，得到32位有符号数放入128位寄存器中*/
__x128_t __BUILTIN _dmpyu2    (long long, long long);
/*将src1中8个8位有符号数乘以src2中8个8位无符号数，得到8个16位有符号数*/
__x128_t __BUILTIN _dmpysu4 (long long src1, long long src2);
__x128_t __BUILTIN _dmpyu4    (long long, long long);//同上，都是无符号
__x128_t __BUILTIN _cmpysp    (__float2_t, __float2_t);
__x128_t __BUILTIN _qmpysp    (__x128_t,  __x128_t);
/*执行2个dotp4h，都是有符号的*/
long long  __BUILTIN _ddotp4h (__x128_t,  __x128_t);
/*执行2个dotpsu4h，一个有符号，一个无符号*/
long long  __BUILTIN _ddotpsu4h  (__x128_t,  __x128_t);

__x128_t __BUILTIN _ito128  (unsigned,  unsigned, unsigned, unsigned);
__x128_t __BUILTIN _fto128  (float,    float, float, float);
__x128_t __BUILTIN _llto128 (long long, long long);
__x128_t __BUILTIN _dto128  (double, double);

long long  __BUILTIN _hi128 (__x128_t);
double    __BUILTIN _hid128  (__x128_t);
long long  __BUILTIN _lo128 (__x128_t);
double    __BUILTIN _lod128  (__x128_t);

unsigned  __BUILTIN _get32_128  (__x128_t, __CONST(0,3) unsigned);
float    __BUILTIN _get32f_128 (__x128_t, __CONST(0,3) unsigned);

__x128_t  __BUILTIN _dup32_128 (unsigned);

extern __cregister volatile unsigned int AMR;
extern __cregister volatile unsigned int CSR;
extern __cregister volatile unsigned int IFR;
extern __cregister volatile unsigned int ISR;
extern __cregister volatile unsigned int ICR;
extern __cregister volatile unsigned int IER;
extern __cregister volatile unsigned int ISTP;
extern __cregister volatile unsigned int IRP;
extern __cregister volatile unsigned int NRP;

extern __cregister volatile unsigned int GFPGFR;
extern __cregister volatile unsigned int DIER;

extern __cregister volatile unsigned int REP;
extern __cregister volatile unsigned int TSCL;
extern __cregister volatile unsigned int TSCH;
extern __cregister volatile unsigned int ARP;
extern __cregister volatile unsigned int ILC;
extern __cregister volatile unsigned int RILC;
extern __cregister volatile unsigned int PCE1;
extern __cregister volatile unsigned int DNUM;
extern __cregister volatile unsigned int SSR;
extern __cregister volatile unsigned int GPLYA;
extern __cregister volatile unsigned int GPLYB;
extern __cregister volatile unsigned int TSR;
extern __cregister volatile unsigned int ITSR;
extern __cregister volatile unsigned int NTSR;
extern __cregister volatile unsigned int ECR;
extern __cregister volatile unsigned int EFR;
extern __cregister volatile unsigned int IERR;

extern __cregister volatile unsigned int DMSG;
extern __cregister volatile unsigned int CMSG;
extern __cregister volatile unsigned int DT_DMA_ADDR;
extern __cregister volatile unsigned int DT_DMA_DATA;
extern __cregister volatile unsigned int DT_DMA_CNTL;
extern __cregister volatile unsigned int TCU_CNTL;
extern __cregister volatile unsigned int RTDX_REC_CNTL;
extern __cregister volatile unsigned int RTDX_XMT_CNTL;
extern __cregister volatile unsigned int RTDX_CFG;
extern __cregister volatile unsigned int RTDX_RDATA;
extern __cregister volatile unsigned int RTDX_WDATA;
extern __cregister volatile unsigned int RTDX_RADDR;
extern __cregister volatile unsigned int RTDX_WADDR;
extern __cregister volatile unsigned int MFREG0;
extern __cregister volatile unsigned int DBG_STAT;
extern __cregister volatile unsigned int BRK_EN;
extern __cregister volatile unsigned int HWBP0_CNT;
extern __cregister volatile unsigned int HWBP0;
extern __cregister volatile unsigned int HWBP1;
extern __cregister volatile unsigned int HWBP2;
extern __cregister volatile unsigned int HWBP3;
extern __cregister volatile unsigned int OVERLAY;
extern __cregister volatile unsigned int PC_PROF;
extern __cregister volatile unsigned int ATSR;
extern __cregister volatile unsigned int TRR;
extern __cregister volatile unsigned int TCRR;

此帖出自DSP 与 ARM 处理器论坛

点赞关注(1)

TI DSP论坛德州仪器DSP论坛 dsp代码

回复

举报

返回列表发新帖回复

开源项目更多>>

随便看看

如下电路该如何分析？
[i=s]本帖最后由乱世煮酒论天下于2024-12-322:31编辑[/i]直流电压源幅值100V，正弦电流源幅值电压105V，以直流源负极为绝对零点针对这种交直流混有，而且含有非线性器件的电路该怎么分析？叠加定理只适用于线性电路[attach]867053[/attach][attach]867062[/at ...
建议谨慎采购美国芯片~~~
ADS7828，IIC信号线初始存在一定电平0.45，再正常升高至3.3V，会导致芯片初始状异常么
PB5.0升级2008全年升级包后定制内核生成的NK.nb0无法运行
M4与DAC芯片进行I2C输出正弦波，波形畸变原因
＃8月改装＃迅捷FW300R无线路由器改装，改64MB内存+8MBFLASH+USB，跑DD-WRT
世界著名汽车品牌标识演化历史------宝马
对电工的几点忠告，千万别搞单片机

查找数据手册?

EEWorld Datasheet 技术支持

相关文章更多>>

首款NPU和首款64位，德州仪器C2000推出诚意满满的升级路线图
在刚刚过去的德国慕尼黑电子展上，德州仪器（TI）展示了最新的C2000 MCU新品，包括支持NPU的F28P55X以及业界首款64位MCU F29H85X ，同时在慕展嵌入式论坛上，TI还发表了两
AMD Zen4处理器循环缓冲区功能被悄然禁用
12月3日消息，据媒体报道，近日在BIOS更新后，AMD在Zen 4架构的处理器中悄然禁用了循环缓冲区（Loop Buffer）功能，具体原因尚未公开。循环缓冲区是CPU前端的一部分，用于存储少量
美国发布新半导体出口管制措施光刻机巨头ASML：正在评估潜在影响
12月3日消息，日前，光刻机巨头ASML（阿斯麦）发布声明，称美国发布最新版先进计算和半导体制造设备规则，对出口芯片制造技术的供应商施加了更多限制。这些规定将立即生效，其中一些变更的合规日期将延迟
消息称苹果有望2026下半年推出折叠iPhone，并重振折叠屏手机市场
美国升级对华半导体管制，140家中国半导体公司被列入“实体清单”
安森美二十五周年：唯有创新，才可持续
华为麒麟9020/9030/9040处理器曝光：小步快跑四大方面升级
特斯拉FSD V13.2用户实测：表现惊艳，可实现“点对点”自动驾驶
AI助力探索癌症最佳诊疗方法
新型催化剂将水解制氢效率提高200倍

新帖速递

站长推荐

上一条

1/10

下一条

EEWorld订阅号

EEWorld服务号

汽车开发圈

About Us 关于我们客户服务联系方式器件索引网站地图最新更新手机版

站点相关：国产芯安防电子汽车电子手机便携工业控制家用电子医疗电子测试测量网络通信物联网

用户热搜：

北京市海淀区中关村大街18号B座15层1530室电话:(010)82350740 邮编：100190

电子工程世界版权所有京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函

京公网安备 11010802033920号 Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved

微信扫描

快速回复返回顶部返回列表