12443|14

75

帖子

0

TA的资源

一粒金砂(初级)

楼主
 

Cortex-M3与ARM7TDMI-S内核MCU运算性能比较 [复制链接]

还是21IC人气旺,转一篇我在EDN的博文:http://blog.ednchina.com/htjgdw/140162/message.aspx
自从STM32推出后,我对它很感兴趣,由于它采用了ARM的Cortex-M3内核,所以很想了解一下其性能和ARM7相比究竟如何?很巧的机会知道了EDNCHINA,参加了EDN这次的团购活动,我得到了一块STM32开发板,使得我有机会测试一下这2种内核CPU的性能。
在测试之前先简单测试的2个平台,编译环境和测试方法。
Cortex-M3:ARM公司为要求高性能(1.25 Dhrystone MIPS/MHz)、低成本、低功耗的嵌入式应用专门设计的内核。Cortex-M3内核主打存储器和处理器的尺寸对产品成本影响极大的各种应用市场,是针对这些市场的低成本需求,专门开发设计的微处理器内核。Cortex-M3内核增强了芯片上集成的各种功能,包括把中断之间延迟降到6个CPU周期的嵌套向量中断控制器、允许在每一个写操作中修改单个数据位的独立位操作、分支指令预测、单周期乘法、硬件除法和高效的Thumb 2指令集,这些改良技术使Cortex-M3内核具有优异的性能、代码密度、实时性和低功耗。
ARM7TDMI-S:也是ARM公司的高性能(0.95 Dhrystone MIPS/MHz),低功耗的嵌入式应用CPU内核。该CPU内核带有实时调试接口,包含JTAG和嵌入式跟踪。能够执行32位ARM和16位Thumb指令。可以针对性能或代码大小,优化应用。当内核在Thumb状态下执行指令时,它可将代码规模降低超过30%,性能的损失却很小;而在ARM状态下执行指令时,内核的性能达到最大化。
测试平台对比:
此帖出自stm32/stm8论坛

最新回复

                                 乘除竟然比加减还快?   详情 回复 发表于 2008-8-5 17:30
点赞 关注
 

回复
举报

72

帖子

0

TA的资源

一粒金砂(初级)

沙发
 

ARM的说法

  ARM有这方面的资料吧:记得有1篇white paper关于M3跟ARM7的比较。
  当然,实测一下对实际应用会跟有用些
此帖出自stm32/stm8论坛
 
 

回复

77

帖子

0

TA的资源

一粒金砂(初级)

板凳
 

我的JPG解码里的差异是25%, 都使用优化

                                  
此帖出自stm32/stm8论坛
 
 

回复

86

帖子

0

TA的资源

一粒金砂(初级)

4
 

stm32非单周期flash

stm32用的指令预缓冲技术来加快flash等待问题,这样不能保证100%指令无等待。
用stm32和单周期的2132比有点不公平,或者不能正确反应M3核心的优势。
应该用LM的单周期flash的mcu和2132评测,比较实际反应M3核心的速度优势。
此帖出自stm32/stm8论坛
 
 
 

回复

49

帖子

0

TA的资源

一粒金砂(初级)

5
 

LPC2132的flash也不是单周期的

STM32和LPC2132的Flash都不足以保证CPU在最高频率时,程序100%全速运行。它们都使用了一些技术来降低CPU高主频时,读取Flash的等待时间。
所以,单纯对这两种CPU的测试,我都是在RAM里运行的:)

刚开始的时候我确实在Flash里跑过,这两种CPU运行测试的速度都比表2中降了10%~20%
此帖出自stm32/stm8论坛
 
 
 

回复

71

帖子

0

TA的资源

一粒金砂(初级)

6
 

都在ram中跑也完全不能反应速度

                                 arm7在ram中跑可以完全表现速度问题,M3核则不一定,M3和是哈佛结构,如果有个单周期的flash和ram分别存放程序和变量,才能完全发挥它的速度。
此帖出自stm32/stm8论坛
 
 
 

回复

80

帖子

0

TA的资源

禁止访问

7
 
提示: 作者被禁止或删除 内容自动屏蔽
 
 
 

回复

82

帖子

0

TA的资源

一粒金砂(初级)

8
 

哈哈,真有意思!

从指令的角度来看,没有任何区别的!

但是CM3 的优点是:

1.有 硬件的乘法和除法器。如果再加浮点单元,那真要命!

2.是哈佛结构,总线比较多。在流水线被打破或比较多的调用跳转指令下明提高
速度了!

3. 中断和中断嵌套 的延迟等功能强大了。

4.代码密度比ARM的小点。与THUMB相当。速度与ARM相当,比THUMB的快点。


反正我认为这个CM3 是想 PK TI的 DSP28XX的。

此帖出自stm32/stm8论坛
 
 
 

回复

117

帖子

0

TA的资源

一粒金砂(中级)

9
 

哈哈,等netjob来pk了。

                                 希望看看结果。
此帖出自stm32/stm8论坛
 
 
 

回复

62

帖子

0

TA的资源

一粒金砂(初级)

10
 

了解6楼的

LPC2132选的是Run In RAM,STM32则是BOOT_RAM,两者可能有区别的。
不过,现在跑出来的结果是能得到的最快速度了。
看来我的题目应该改一下:Cortex-M3与ARM7TDMI-S内核MCU运算性能比较,比较合适:)
此帖出自stm32/stm8论坛
 
 
 

回复

81

帖子

0

TA的资源

一粒金砂(初级)

11
 

TI的28STM32是PK不了的! 用过!

                                  
此帖出自stm32/stm8论坛
 
 
 

回复

77

帖子

0

TA的资源

一粒金砂(初级)

12
 

lz测试环境也不一样,差别也可能很大。

                                 我对比过iar5.11和mdk3.22编译一段代码,速度差别能达到30%~50%。
此帖出自stm32/stm8论坛
 
 
 

回复

75

帖子

0

TA的资源

一粒金砂(初级)

13
 

居然用不同的编译器

楼主的测试没有太大意义!
我的经验是:72MHz的STM32,50MHz的LM3S,60MHz的LPC2132在flash跑的速度基本上相差不大.
此帖出自stm32/stm8论坛
 
 
 

回复

84

帖子

0

TA的资源

一粒金砂(初级)

14
 

只是粗略的评估一下而已

                                 起到抛砖引玉的效果就好了。希望研究技术的人多一些,讨论更热烈些。
此帖出自stm32/stm8论坛
 
 
 

回复

71

帖子

0

TA的资源

一粒金砂(初级)

15
 

有没搞错?

                                 乘除竟然比加减还快?
此帖出自stm32/stm8论坛
 
 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/9 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表