磁盘性能测试介绍

我们在进行测试时,都会分清楚:

  • 测试对象:要区分硬盘、SSD、RAID、SAN、云硬盘等,因为它们有不同的特点;
  • 测试指标:IOPS和MBPS(吞吐率),下面会具体阐述;
  • 测试工具:Linux下常用Fio、dd工具, Windows下常用IOMeter;
  • 测试参数: IO大小,寻址空间,队列深度,读写模式,随机/顺序模式;

测试是为了对比,所以需要定性和定量。在宣布自己的测试结果时,需要说明这次测试的工具、参数、方法,以便于比较。


为了更好的测试,我们需要先了解存储系统,块存储系统本质是一个排队模型,我们可以拿银行作为比喻。还记得你去银行办事时的流程吗?

  1. 去前台取单号
  2. 等待排在你之前的人办完业务
  3. 轮到你去某个柜台
  4. 柜台职员帮你办完手续1
  5. 柜台职员帮你办完手续2
  6. 柜台职员帮你办完手续3
  7. 办完业务,从柜台离开

如何评估银行的效率呢:

  • 服务时间 = 手续1 + 手续2 + 手续3
  • 响应时间 = 服务时间 + 等待时间
  • 性能 = 单位时间内处理业务数量

那银行如何提高效率呢:

  • 增加柜台数
  • 降低服务时间

因此,排队系统或存储系统的优化方法是

  • 增加并行度
  • 降低服务时间

每个硬盘都有一个磁头(相当于银行的柜台),硬盘的工作方式是:

  1. 收到IO请求,得到地址和数据大小
  2. 移动磁头(寻址)
  3. 找到相应的磁道(寻址)
  4. 读取数据
  5. 传输数据

则磁盘的随机IO服务时间:

  • 服务时间 = 寻道时间 + 旋转时间 + 传输时间

对于10000转速的SATA硬盘来说,一般寻道时间是7ms,旋转时间是3ms, 64KB的传输时间是 0.8ms, 则SATA硬盘每秒可以进行随机IO操作是 1000/(7 + 3 + 0.8) = 93,所以我们估算SATA硬盘64KB随机写的IOPS是93。

一般的硬盘厂商都会标明顺序读写的MBPS。

我们在列出IOPS时,需要说明IO大小1),寻址空间,读写模式,顺序/随机,队列深度。


dd if=/dev/zero of=dd.img bs=1G count=10 oflag=dsync
iostat -x sdd 5 10

为什么这块硬盘的MBPS只有68MB/s? 这是因为磁盘利用率是78%,没有到达95%以上,还有部分时间是空闲的。

当dd在前一个IO响应之后,在准备发起下一个IO时,SATA硬盘是空闲的。那么如何才能提高利用率,让磁盘不空闲呢?只有一个办法,那就是增加硬盘的队列深度。

相对于CPU来说,硬盘属于慢速设备,所以操作系统会有给每个硬盘分配一个专门的队列用于缓冲IO请求。


什么是磁盘的队列深度?

在某个时刻,有N个inflight的IO请求,包括在队列中的IO请求、磁盘正在处理的IO请求。N就是队列深度。

加大硬盘队列深度就是让硬盘不断工作,减少硬盘的空闲时间。

加大队列深度 → 提高利用率 → 获得IOPS和MBPS峰值 → 注意响应时间在可接受的范围内

增加队列深度的办法:

  • 使用异步IO,同时发起多个IO请求,相当于队列中有多个IO请求
  • 多线程发起同步IO请求,相当于队列中有多个IO请求
  • 增大应用IO大小,到达底层之后,会变成多个IO请求,相当于队列中有多个IO请求 队列深度增加了。
  • 队列深度增加了,IO在队列的等待时间也会增加,导致IO响应时间变大,这需要权衡。

让我们通过增加IO大小来增加dd的队列深度,看有没有效果:

dd if=/dev/zero of=/dev/sdd bs=2M count=1000 oflag=direct
记录了1000+0 的读入 记录了1000+0 的写出 2097152000字节(2.1 GB)已复制,10.6663 秒,197 MB/秒
 
Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm %util
sdd 0.00 0.00 0.00 380.60 0.00 389734.40 1024.00 2.39 6.28 2.56 97.42

可以看到2MB的IO到达底层之后,会变成多个512KB的IO,2)平均队列长度为2.39,这个硬盘的利用率是97%,MBPS达到了197MB/s。

也就是说增加队列深度,是可以测试出硬盘的峰值的。


fio -ioengine=libaio -bs=4k -direct=1 -thread -rw=randwrite -size=1000G -filename=/dev/vdb -name="EBS 4K randwrite test" -iodepth=64 -runtime=60
  • ioengine: 负载引擎,我们一般使用libaio,发起异步IO请求。
  • bs: IO大小
  • direct: 直写,绕过操作系统Cache。因为我们测试的是硬盘,而不是操作系统的Cache,所以设置为1。
  • rw: 读写模式,有顺序写write、顺序读read、随机写randwrite、随机读randread等。
  • size: 寻址空间,IO会落在 [0, size)这个区间的硬盘空间上。这是一个可以影响IOPS的参数。一般设置为硬盘的大小。
  • filename: 测试对象
  • iodepth: 队列深度,只有使用libaio时才有意义。这是一个可以影响IOPS的参数。
  • runtime: 测试时长

6.1 iodepth = 1

上图中蓝色方框里面的是测出的IOPS 230, 绿色方框里面是每个IO请求的平均响应时间,大约是4.3ms。黄色方框表示95%的IO请求的响应时间是小于等于 9.920 ms。橙色方框表示该硬盘的利用率已经达到了98.58%。

6.2 iodepth = 4

我们发现这次测试的IOPS没有提高,反而IO平均响应时间变大了,是17ms。

为什么这里提高队列深度没有作用呢,原因当队列深度为1时,硬盘的利用率已经达到了98%,说明硬盘已经没有多少空闲时间可以压榨了。而且响应时间为 4ms。

对于SATA硬盘,当增加队列深度时,并不会增加IOPS,只会增加响应时间。这是因为硬盘只有一个磁头,并行度是1, 所以当IO请求队列变长时,每个IO请求的等待时间都会变长,导致响应时间也变长。


我们继续测试SATA硬盘,前面我们提到寻址空间参数也会对IOPS产生影响,下面我们就测试当size=1GB时的情况。

我们发现,当设置size=1GB时,IOPS会显著提高到568,IO平均响应时间会降到7ms(队列深度为4)。

这是因为当寻址空间为1GB时,磁头需要移动的距离变小了,每次IO请求的服务时间就降低了,这就是空间局部性原理。

假如我们测试的RAID卡或者是磁盘阵列(SAN),它们可能会用Cache把这1GB的数据全部缓存,极大降低了IO请求的服务时间(内存的写操作比硬盘的写操作快很1000倍)。所以设置寻址空间为1GB的意义不大,因为我们是要测试硬盘的全盘性能,而不是Cache的性能。


硬盘厂商提高硬盘性能的方法主要是降低服务时间(延迟):

  • 提高转速(降低旋转时间和传输时间)
  • 增加Cache(降低写延迟,但不会提高IOPS)
  • 提高单磁道密度(变相提高传输时间)

RAID0/RAID5/RAID6的多块磁盘可以同时服务,其实就是提高并行度,这样极大提高了性能(相当于银行有多个柜台)。

以前测试过12块RAID0,100GB的寻址空间,4KB随机写,逐步提高队列深度,IOPS会提高,因为它有12块磁盘(12个磁头同时工作),并行度是12。

RAID卡厂商优化的方法也是降低服务时间:

  • 使用大内存Cache;
  • 使用IO处理器,降低XOR操作的延迟;
  • 使用更大带宽的硬盘接口;

SSD的延时很低,并行度很高(多个nand块同时工作),缺点是寿命和GC造成的响应时间不稳定。

推荐用IOMeter进行测试,使用大队列深度,并进行长时间测试,这样可以测试出SSD的真实性能。

下图是storagereview对一些SSD硬盘做的4KB随机写的长时间测试,可以看出有些SSD硬盘的最大响应时间很不稳定,会飙高到几百ms,这是不可接受的.



1)
我们一般常用的IO大小是4KB,这是因为文件系统常用的块大小是4KB。
2)
max_sectors_kb 表示设备允许的最大请求大小。
  • linux/performance/磁盘性能测试_介绍.txt
  • 最后更改: 2019/04/16 18:31
  • (外部编辑)