1、for循环采用 - - 方式
C语言会生成汇编语言,而在汇编语言中,有一个不等于0的指令,for中使用 - - 的方式,在判断条件是否满足时,只使用一条汇编指令,而++的方式,要判断与某个值的大小,这在汇编中要使用多条指令。
当然,不排除有一些编译器会自动将++的for编译成 - - 的for。
2、使用联合体进行位拆分
对于32位的数据,要分出其中的四个字节,常用的方式,就是与运算。
而使用联合体与结构体的方式:
3、关键代码指定运行空间
代码的运行空间是决定程序运行效率的一个关键因素。
这里主要是指TI的MCU,其他的DSP也是类似的。
以其程序的运行在片内的RAM可以运行到其标称的150M或是200M,但是在Flash运行,则程序的执行速率只有60、70M的样子,当然与代码的优化等级设置与具体的代码有关,但是从总体上来说,片上的RAM运行速率最高,Flash次之,外设的SRAM最低。
那么可想而知,某些芯片标示的主频多高多高,而在实际使用时,往往受外设总线速度的限制,实际的运行速率是达不到的。
其他的芯片,如果支持设置,原理应该也是相通的,要将关键代码,或是实时性要求比较高的算法,放在RAM中运行。
如果你的芯片支持cache,那么要好好 利用了,效率可能会再高很多。
4、如果Flash允许,尽量使用静态函数,避免了调用函数时压栈出栈,速度快很多。 或者使用inline函数,使用容量换时间。
5、使用字节对齐。
单片机内部的总线往往并不是8位的,而是32位或是更高位的,一些DSP内部总线也有256位或更高的。
而每次只传输8位数据,其他的数据位空闲浪费,这时,使用字节对齐,可以提高内部总线的利用率,提高效率。
6、使用全局变量代替函数传递的参数。
这种方式并不提倡,要仔细对变量的值进行维护,否则会有一些逻辑上的bug很难发现。
7、用乘法代替除法
这种方式并没有统一性,只是有的地方可以使用,比如计算某变量的率时,分母往往都是同一个数值,这时,先计算分母的倒数,再用分子去乘,就避免了多次的除尘计算。
比如计算谐波时,要计算2~50次的谐波。
这样,就把近50次的除法运算转成一次除法与多次乘法。
8、小数表达
小数的表达,大多都是如下这样:
这时,有的编译器会将其默认为double的,这样再运算时,计算时间自然就会变长。
而使用如下表达时,而是单精度的,计算也会快一些,但是你的算法要求精度高时,那么还是使用双精度的吧。
9、函数调用越少越好
这也是要看具体的代码了,如果重用代码量很高时,该嵌套还是要嵌套的。
10、习惯使用指针
指针的方式,自然不用详说了,正确的使用,会使效率有很大的提高。
以上只是个人在实际项目中的一些愚见、体会,其依据是在个人项目中的实践结果,并没有进行完善的理论认证。所以不对之处,烦请指教。
|