此帖出自DSP 与 ARM 处理器论坛
最新回复
建议在硬件条件具备的情况下,尽量用硬件进行实测,一则运行速度更快,在跑大程序时可以节省很多时间,二则得到的cycle数更准确。无论是在硬件上测还是在simulator上测,profile工具、内嵌在代码中的TSCL调用都是可用的。前者比较方便,也不用改代码;后者比较灵活,可以测量任意代码片段的cycle数,也比较容易做到测试自动化。
另外注意,simulator对cycle数的仿真精度不是一成不变的。有些器件的simulator分为Functional Sim和Cycle Approximate Sim,前者只考虑CPU cycle,不考虑任何内存访问overhead,后者对内存访问进行建模,更接近实际硬件,但运行起来特别慢。有些器件只有一种simulator,从simulator的名字可以看出其对内存overhead的考虑程度。也可以通过把关键数据段放在片内、片外memory,对比两者的cycle数,来大致了解所用simulator是否考虑了内存访问overhead。
详情
回复
发表于 2011-9-5 11:58
| ||
|
||
| |
|
|
| |
|
|
| |
|
|
| |
|
|
| |
|
|
此帖出自DSP 与 ARM 处理器论坛
| ||
|
||
回复 7楼 countryhotel 的帖子
此帖出自DSP 与 ARM 处理器论坛
| ||
|
||
浏览过的版块 |
EEWorld Datasheet 技术支持