STM32F765@216MHz跑NES模拟器【代码】【视频】
[复制链接]
本帖最后由 Kεnny 于 2019-2-22 15:10 编辑
本文public自《STM32F765@216MHz输出I2S试验ES9023P音频听感》链接(https://bbs.eeworld.com.cn/thread-1069926-1-1.html)
性能:作者的开发板使用STM32F765VIT6@216MHz,开发板使用3225封装的有源晶振提供25MHz(-+20PPM)的HSE,通过PLL倍频到216MHz,实际测试修改倍频参数,可以将内核时钟超频到270MHz不跑飞(测试时间约40分钟,更高频率或更长测试时间未测试过),就MCU界来说性能已经可以傲视群雄了。
想法:那么作者有想法了,开发板有Button、LCD和Audio,是不是可以跑一些多媒体,或者做成交互式娱乐设备。看到网上有跑NES游戏的,细看,实质是通过软件模拟上世纪八九十年代的CPU 6502和外围RAM这些,然后在模拟器上跑NES游戏。
关于6502:仔细了解之后,作者对6502的评价是:伟大。在那个时代,它被用在很多场景下,除了Nintendo的FC,还有乔布斯的早期Apple PC、Commodore的主机、拉斯维加斯赌场的老虎机、早期的国产文曲星,甚至天网的T800系列终结者也都搭载这款CPU(开个玩笑)。一款造就了无数优秀的程序员、带给无数人欢乐的CPU,称之为时代巨著当之无愧。
回到正题:在开源软件发达的今天,本着站在巨人的肩膀上的心态,作者直接网上找来3款模拟器,包括InfoNES、Neil的6502 emulator和网友ye781205的NES。
a. 首先是InfoNES,主要是新建InfoNES_System.c,并在InfoNES_System.c中实现InfoNES_System.h中的接口;然后适当修改硬件相关的文件InfoNES.c、InfoNES.h、K6502_rw.h,其中包括模拟SRAM的内存实现,在堆中分配内存(注意修改Heap Size),还是以指定首地址的野路子。
作者在开发板上跑InfoNES,FPS大致在9左右@216MHz,这就让人不想继续实现音频了,虽然跳2帧勉强能玩,但看着PPT的效果,还是放弃了。
b. 接着是Neil的6502 emulator,这款模拟器不带音频,源码已经是在stm32f1上移植好了的,作者只需要修改到自己的开发板上,在定时中断里面获取按键填充全局数组JoyPad[0](玩家1)和JoyPad[1](玩家2),在PPU.c中实现NES_LCD_DisplayLine()适配LCD填充和拉伸即可。
从U盘读取NES文件到数组rom_file[ROM_FILE_SIZE]里,然后运行nes_main()启动游戏(ROM_FILE_SIZE宏作者修改为200Kbytes,数组rom_file在Rom_files.c中定义,在rom.h中申明为外部变量)。
作者实测FPS上30@216MHz,但是没有声音,支持的游戏不多,还是不够完美。
c. 最后是openedv网友ye781205的NES,这款NES核心采用汇编实现,正点原子进行了完善,效率很高。作者在网上搜来的源码来自正点原子的工程包,工程运行在stm32f1上面。作者不清楚M7是否向下兼容汇编,带着试一试的心态就开干。具体过程包括:
(1) 在nes_main.c中nes_load(char *pname),实现文件打开、f_stat判断文件大小信息并malloc内存空间给romfile、读取文件到romfile里、nes_load_rom()并初始化之后就通过nes_emulate_frame()启动;
(2) 在nes_main.c中nes_set_window()适配LCD显示区域;
(3) 在nes_main.c中nes_get_gamepadval()实现按键获取填充全局变量PAData0和PAData1,在6502.s中会使用到;
(4) 在nes_ppu.c中scanline_draw()做LCD的像素填充和拉伸
(5) 在nes_main.c中实现nes_apu_fill_buffer()、nes_sound_open()、nes_sound_close()输出音频
(6) 在nes_apu.h中调整宏,设置音频采样频率,设置最大帧率限制
(7) 修改正点原子自定义的内存管理,改为使用编译器提供的malloc,使用SOC内部SRAM,并将启动代码里面Heap_Size调大些。
音频方面:作者用wavebuf填充发送buffer中的左右声道(左右相同),16-bit,最后通过DMA由I2S1直出ES9023P,DMA设置为循环模式,字节对齐设置为半字(16-bit),实现HAL_I2S_TxCpltCallback()发送完成回调中设置发送完成标志,在nes_apu_fill_buffer()中判断音频buffer是否发送完成,以此来限制模拟器运行最大帧率。
帧率:作者实测不加帧率限制,优化LCD刷屏,FPS可以上95@216MHz。如果深入底层针对M7的6级双发射超标量流水线进行优化,并使用L1 Cache应该可以获取更高帧率。
作者将FPS限制在60帧,通过U盘读取nes并运行,实际效果如视频:
如果视频无法播放,请复制链接单独查看(http://v.youku.com/v_show/id_XND ... 3ff6c5cfbdcb930c939)
作者未使用OS,通过CubeMX建立的标准HAL工程,按照惯例,双手奉上,供大家取用: 【附件,工程压缩包,复制链接打开即可download】
https://bbs.eeworld.com.cn/forum.php?mod=attachment&aid=NDAyOTUyfGM5NWYzMDNjYTQzNTZjMjkyNWFjNzk3ZWUyMDkwYTA2fDE3MzMyNTAzMDc%3D&request=yes&_f=.7z
至于rom文件,请自行准备,本文不提供。
【友情提醒】就作者了解的法律常识,在美国破解ROM或保存收藏ROM,如果追究会被判刑,国内也有相应法律法规,请自觉遵守
本文由EEWORLD论坛网友Kεnny原创,如需转载或用于商业用途需征得作者同意并注明出处
|