donatello1996 发表于 2020-7-19 15:45

【STM32F769Discovery开发板试用】关于DMA2D刷屏的效率探讨和应用

本帖最后由 donatello1996 于 2020-7-19 18:51 编辑

<p>&nbsp; &nbsp; &nbsp; &nbsp; &nbsp;STM32F4和STM32F7系列的高端型号都能使用DMA2D图形加速器在LTDC显示外设上进行图形图像缓存的快速搬运,DMA2D外设在其中就相当于一个快速通道,可以将内存地址中的数据快速搬运到LTDC外设总线的地址,这种方式与用户直接操作GPU显存地址是两种不同原理,不同用途的方式,那问题来了,如果对于范围甚至是全屏刷新的话,这两种方式到底差多远的效率呢?官方的给出的数据是理想值,实际测试肯定需要借助仪器,这里我就简单使用GPIO引脚电平翻转+示波器读波形的方式进行探讨。示波器的1号输入探头接上板子并打开通道1:</p>

<p></p>

<p>使用示波器查看各种代码的延时时间,最简单的方式就是使用GPIO引脚电平翻转的方式,这里我使用了板上Arduino排针的PJ1引脚,初始化代码和寄存器翻转电平代码如下:</p>

<pre>
<code class="language-cpp">void PJ1_Init()
{
__HAL_RCC_GPIOJ_CLK_ENABLE();
        GPIO_InitTypeDef GPIO_InitStruct;
GPIO_InitStruct.Pin = GPIO_PIN_1;
GPIO_InitStruct.Mode = GPIO_MODE_OUTPUT_PP;
GPIO_InitStruct.Pull = GPIO_NOPULL;
GPIO_InitStruct.Speed = GPIO_SPEED_FREQ_LOW;
GPIO_InitStruct.Alternate = GPIO_NOPULL;
HAL_GPIO_Init(GPIOJ, &amp;GPIO_InitStruct);       
       
}
</code></pre>

<pre>
<code class="language-cpp">GPIOJ-&gt;BSRR=0x00000002;
GPIOJ-&gt;BSRR=0x00020000;</code></pre>

<p>首先看看使用直接操作显存地址画点的方式的效率,代码就是直接使用画点函数:</p>

<pre>
<code class="language-cpp">void fun(int color)
{
        int i,j;
        for(i=0;i&lt;800;i++)
                for(j=0;j&lt;480;j++)
                        BSP_LCD_DrawPixel(i,j,color);
}

while (1)
{   

                fun(0xffffff00);
                GPIOJ-&gt;BSRR=0x00000002;
                fun(0xffff00ff);
                GPIOJ-&gt;BSRR=0x00020000;
}</code></pre>

<p>&nbsp;</p>

<p>然后查看示波器波形:</p>

<p></p>

<p>可以看出,这种逐个画点方式刷全屏的延迟大概是50~60ms一帧。</p>

<p>之后就是直接使用BSP_LCD_Clear进行刷屏,这种方式是使用DMA2D通道进行的:<br />
&nbsp;</p>

<pre>
<code class="language-cpp">while (1)
{   
                BSP_LCD_Clear(0xffffff00);
                GPIOJ-&gt;BSRR=0x00000002;
                BSP_LCD_Clear(0xffff00ff);
                GPIOJ-&gt;BSRR=0x00020000;
}</code></pre>

<p>查看示波器波形,有明显提升,大概是7~8ms一帧,效率差不多是画点方式的7倍:</p>

<p></p>

<p>最后就是今天的重头戏,使用DMA2D刷自定义图像数据,这边官方的代码存在一些问题,官方的代码支持ARGB888 RGB888 RGB565三种图像颜色格式,但是我都试了一遍,只有RGB888和RGB565是可以正常刷出的,原因不知,但是没有关系,因为BMP格式的数组最常用的也就是RGB888 24位色,ARGB8888即使不支持也没有关系,这边我改造了一下官方给的BMP文件数据刷屏函数,改成直接用BMP数组做参数,不引入文件头数据:</p>

<pre>
<code class="language-cpp">void BSP_LCD_DrawBuffer(int Xpos, int Ypos,int width,int height,int bit_pixel,uint8_t *buf)
{
uint32_t index = 0;
uint32_t Address;
uint32_t InputColorMode = 0;

Address = 0xC0000000 + (((800*Ypos) + Xpos)*(4));

        switch(bit_pixel)
        {
                case 16: InputColorMode = DMA2D_INPUT_RGB565; break;
                case 24:InputColorMode = DMA2D_INPUT_RGB888; break;
                case 32: InputColorMode = DMA2D_INPUT_ARGB8888; break;
        }

buf += (index + (width * (height - 1) * (bit_pixel/8)));

for(index=0; index &lt; height; index++)
{
    LL_ConvertLineToARGB8888((uint32_t *)buf, (uint32_t *)Address, width, InputColorMode);

    Address+=(BSP_LCD_GetXSize()*4);
    buf -= width*(bit_pixel/8);
}
}</code></pre>

<p>-Xpos和Ypos是图像起始XY坐标<br />
-width和height是图像宽度和高度<br />
-bit_pixel是位长,可选参数16,24和32<br />
-uint8_t *buf是图像数据,取自Image2Lcd软件</p>

<p></p>

<p>DMA2D默认方式是从下至上扫描,因此选项要选中</p>

<p>在Image2Lcd软件中设置图像的宽和高分别为600和360,这是因为假如全屏显示的话没办法同时存下两张图片的数据在Flash中,因此只能选宽高各3/4大小的图片,设置完成之后同样在主循环中刷新两张图片的图像数据:</p>

<pre>
<code class="language-cpp">while (1)
{   
                BSP_LCD_DrawBuffer(100,60,600,360,24,(uint8_t *)image1);
                GPIOJ-&gt;BSRR=0x00000002;
                BSP_LCD_DrawBuffer(100,60,600,360,24,(uint8_t *)image2);
                GPIOJ-&gt;BSRR=0x00020000;
}
</code></pre>

<p>示波器波形显示,可以看出不管是全屏800*480*24的缓存数据,还是600*360*24的小图片,DMA2D传输效率都不会有比较明显的差异,都是7~8ms一帧。</p>

<p></p>

<p>最后放上全屏显示图片的效果:</p>

<p></p>

<p></p>

<p>最后要重点说明一点,<span style="color:#3498db;">上述的所有测试均在主频200MHz下进行,且LTDC总线主频也直接按照官方DMA2D的默认参数,一般不推荐使用比官方更快的倍频,因为很有可能会导致画面撕裂。</span></p>

dcexpert 发表于 2020-7-19 16:16

<p>很好的测试,就是代码好像没有正常显示出来。</p>

donatello1996 发表于 2020-7-19 18:51

dcexpert 发表于 2020-7-19 16:16
很好的测试,就是代码好像没有正常显示出来。

<p>已经修改过来了</p>

eew_bsIqeC 发表于 2020-7-22 23:37

<p>这个评测的内容丰富啊!</p>

freebsder 发表于 2020-7-23 21:35

<p>可以可以,这个评测有点货。</p>

xinyuanliu 发表于 2024-9-19 20:38

<p>写的很好,可以上传工程代码吗?</p>
页: [1]
查看完整版本: 【STM32F769Discovery开发板试用】关于DMA2D刷屏的效率探讨和应用