3862|1

6419

帖子

16

TA的资源

版主

楼主
 

IO-Polling实现分析与性能评测 [复制链接]

原文地址

本文后续部分链接:《IO-Polling的代码分析
Linux内核4.4版本中引入IO-Polling的处理模式,这一动态引发了业界对于IO处理模式的一番讨论。事实上,在最早期的计算机系统中,Polling(轮询)曾是主流的IO处理模式,但是为了提高CPU的利用率,中断后来居上成了主流。这篇文章将从IO-Polling和中断的工作原理入手,着重对比两者对NVMe SSD(高速固态存储介质的代表)设备性能的影响,在下一篇文章中,笔者还将对IO-Polling的代码做简单分析。
注:上文提到了Linux内核4.4版本中引入了IO-Polling,该模式和早期的轮询工作方式是有很大区别的。首先并非所有IO设备都是Polling模式,其次对于同一类IO设备,通过接口指定某个设备是否支持Polling。这种Polling更灵活,对于上层的各种混合业务配置也更方便。为了对新旧IO-Polling进行区分,早期的IO-Polling统一称作轮询;而最新的IO-Polling仍将称作IO-Polling。

IO-Polling与中断的原理对比

轮询是指CPU不断地等待并轮询IO设备,看看该IO设备是否有可用的数据到来或者是否准备好发送下一字节数据。假设打印机需要十秒来接收另一个直接的数据,IO-Polling的处理模式下,在打印机处理前一波数据的10秒内,CPU除了重复循环的询问打印机是否准备好接收处理下一字节数据外,将不做任何事情。而同样的时间,CPU可以执行超过二百亿次指令。可想而知,慢速设备轮询模式将是对CPU的极大浪费。
相比轮询,中断能够有效的提高CPU利用率。当IO设备准备好数据时,通知CPU;CPU将中断当前进行的工作任务,并调用特殊的中断服务程序,保存当前状态。及时处理IO设备准备好的数据,处理完IO数据后,在返回继续以前的工作任务。在中断的工作模式下,CPU可以在任务中连续工作而并不检查IO设备,允许IO设备在必要时通知中断它的工作。中断的工作模式下,IO设备和CPU是并行工作的,这极大提高了CPU的利用率。
从上文对轮询和中断原理的介绍可以发现,对于打印机、磁盘这样的IO设备,中断有着巨大的优势,但是在高速存储设备快速发展的今天,PCIe SSD已经非常普及,存储介质从磁带和磁盘向闪存和更新的非易失性介质演进,可以说存储IO设备的处理速度已经有了一个质的提升。
在这样一个背景IO中断处理引入的上下文切换所带来的延迟已经不容忽视。例如一个NVMe SSD的写延迟20μs,而上下文切换大约占用5μs,在延迟占比达25%,这已经是一个较高的开销比例。对于延迟敏感的业务而言,底层的5μs也是一大开销影响。IO-Polling迎来了新的发展机遇。
NVMe设备IO-Polling与中断性能对比
本文中仅做了NVMe SSD在IO-Polling和中断情况下的同步IO模式的性能对比测试。对于libaio的测试结果无效,因为在4.4的内核中还没有实现libaio的IO-Polling模式。
测试方法以及环境配置
A. 编译安装4.4版本的内核

1. 下载linux-4.4.tar.xz并解压缩
2. make menuconfig
3. make
4. make modules
5. make modules_install
6. make install
B. 修改grub,并reboot启动新内核:
C. 测试方法与步骤:

1. 设备预处理
2. 测试中断模式下的性能
3. 开启polling模式
4. 测试polling模式下的性能
D. 测试工具:
Fio-2.2.9
4K随机读延迟性能


从4K随机读延迟性能对比图上我们可以看出,中断模式的4K随机读延迟比IO-Polling模式的延迟要大6μs,延迟降低7%左右,并且IO-Polling模式下,延迟非常平稳,几乎没有抖动。
4K随机写延迟性能

从4K随机写延迟性能对比图上我们可以看出,中断模式的4K随机写的延迟比IO-Polling模式的延迟要大5μs,延迟降低20%左右。并且同4K随机读类似,IO-Polling模式下,延迟也比非IO-Polling的延迟要平稳一些。
测试结果总结
从上述测试结果来看,IO-Polling对于sync模式的direct-io的延迟有较好的提升,sync模式下,无论4K随机读或者随机写IO压力下,延迟平均大约减少5μs,而这5μs几乎就是中断模式下,处理中断时,上下文切换的时间差。相比随机读,对随机写的延迟降低约20%,这对延迟敏感的IO请求来说是极大的性能提升。

本文作者Luna是Memblaze产品工程师,主要的研究方向包括KVM、Virtio等虚拟化技术,最擅长的是PCIe SSD在KVM的虚拟化场景中的优化。Luna之前的一篇文章《QEMU-KVM I/O性能优化之Virtio-blk-data-plane》详细分析了Virtio-blk-data-plane技术原理,并通过测试展示了其性能优势。



此帖出自FPGA/CPLD论坛

最新回复

讲的非常好,看了收获很多,十分感谢   详情 回复 发表于 2020-9-20 14:29
点赞 关注
个人签名training
 

回复
举报

78

帖子

0

TA的资源

一粒金砂(初级)

沙发
 

讲的非常好,看了收获很多,十分感谢

此帖出自FPGA/CPLD论坛
 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/10 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表