Cortex-M3与ARM7TDMI-S内核MCU运算性能比较

born

Cortex-M3与ARM7TDMI-S内核MCU运算性能比较 [复制链接]

还是21IC人气旺，转一篇我在EDN的博文：http://blog.ednchina.com/htjgdw/140162/message.aspx
自从STM32推出后，我对它很感兴趣，由于它采用了ARM的Cortex-M3内核，所以很想了解一下其性能和ARM7相比究竟如何？很巧的机会知道了EDNCHINA，参加了EDN这次的团购活动，我得到了一块STM32开发板，使得我有机会测试一下这2种内核CPU的性能。
在测试之前先简单测试的2个平台，编译环境和测试方法。
Cortex-M3：ARM公司为要求高性能(1.25 Dhrystone MIPS/MHz)、低成本、低功耗的嵌入式应用专门设计的内核。Cortex-M3内核主打存储器和处理器的尺寸对产品成本影响极大的各种应用市场，是针对这些市场的低成本需求，专门开发设计的微处理器内核。Cortex-M3内核增强了芯片上集成的各种功能，包括把中断之间延迟降到6个CPU周期的嵌套向量中断控制器、允许在每一个写操作中修改单个数据位的独立位操作、分支指令预测、单周期乘法、硬件除法和高效的Thumb 2指令集，这些改良技术使Cortex-M3内核具有优异的性能、代码密度、实时性和低功耗。
ARM7TDMI-S：也是ARM公司的高性能（0.95 Dhrystone MIPS/MHz），低功耗的嵌入式应用CPU内核。该CPU内核带有实时调试接口，包含JTAG和嵌入式跟踪。能够执行32位ARM和16位Thumb指令。可以针对性能或代码大小，优化应用。当内核在Thumb状态下执行指令时，它可将代码规模降低超过30%，性能的损失却很小；而在ARM状态下执行指令时，内核的性能达到最大化。
测试平台对比：

tangcongfai

ARM有这方面的资料吧：记得有1篇white paper关于M3跟ARM7的比较。
当然，实测一下对实际应用会跟有用些

qianlongwuyong

hd2046

stm32用的指令预缓冲技术来加快flash等待问题，这样不能保证100%指令无等待。
用stm32和单周期的2132比有点不公平，或者不能正确反应M3核心的优势。
应该用LM的单周期flash的mcu和2132评测，比较实际反应M3核心的速度优势。

asdfjkl12345

STM32和LPC2132的Flash都不足以保证CPU在最高频率时，程序100%全速运行。它们都使用了一些技术来降低CPU高主频时，读取Flash的等待时间。
所以，单纯对这两种CPU的测试，我都是在RAM里运行的：）

刚开始的时候我确实在Flash里跑过，这两种CPU运行测试的速度都比表2中降了10%~20%

yellowbo

arm7在ram中跑可以完全表现速度问题，M3核则不一定，M3和是哈佛结构，如果有个单周期的flash和ram分别存放程序和变量，才能完全发挥它的速度。

CXC288

提示: 作者被禁止或删除内容自动屏蔽

widb

从指令的角度来看，没有任何区别的！

但是CM3 的优点是：

1.有硬件的乘法和除法器。如果再加浮点单元，那真要命！

2.是哈佛结构，总线比较多。在流水线被打破或比较多的调用跳转指令下明提高
速度了！

3. 中断和中断嵌套的延迟等功能强大了。

4.代码密度比ARM的小点。与THUMB相当。速度与ARM相当，比THUMB的快点。

反正我认为这个CM3 是想 PK TI的 DSP28XX的。

秋水长天

希望看看结果。

bill.xia

LPC2132选的是Run In RAM，STM32则是BOOT_RAM，两者可能有区别的。
不过，现在跑出来的结果是能得到的最快速度了。
看来我的题目应该改一下：Cortex-M3与ARM7TDMI-S内核MCU运算性能比较，比较合适：）

lgyno

cindy99

我对比过iar5.11和mdk3.22编译一段代码，速度差别能达到30%～50%。

shunv424

楼主的测试没有太大意义！
我的经验是:72MHz的ＳＴＭ３２，５０ＭＨｚ的LM3S，６０ＭＨｚ的LPC2132在flash跑的速度基本上相差不大．

peiha

起到抛砖引玉的效果就好了。希望研究技术的人多一些，讨论更热烈些。

hzfzh1234

乘除竟然比加减还快？

Cortex-M3与ARM7TDMI-S内核MCU运算性能比较 [复制链接]

最新回复

ARM的说法

我的JPG解码里的差异是25%, 都使用优化

stm32非单周期flash

LPC2132的flash也不是单周期的

都在ram中跑也完全不能反应速度

哈哈，真有意思！

哈哈，等netjob来pk了。

了解6楼的

TI的28STM32是PK不了的! 用过!

lz测试环境也不一样，差别也可能很大。

居然用不同的编译器

只是粗略的评估一下而已

有没搞错？