RAID 0+1: 镜像带区集(性能+数据安全)
RAID 0+1首先用两块以上硬盘并行创建一个带区集(stripe set),然后连同整个结构镜像至另外一个一模一样的带区集上,我们称之为带区集镜像(mirrored stripe set)。RAID 1+0正好相反,先创建几个RAID 1镜像阵列,然后并行布置为带区集,称为驱动器镜像的带区集(stripe set made of mirrored drives)。就性能而言两种RAID没有什么区别,一般来说大部分控制器都支持RAID 0+1。
带区集镜像提供了RAID 0的性能,同时还具备RAID 1的数据安全性,不过很显然你至少需要4块硬盘才能搭建起一个RAID 0+1阵列。我们依次尝试了4块、6块、8块硬盘的配置。
性能考量
理论上在RAID 0阵列中放置多个驱动器,能够成倍地提高传输率,在现实中这个速度的提高不可能是线性的。不过每增加一个硬盘都会带来明显的性能提升,这个可以从本文的测试部分明显的看出来。
很显然更多数目的硬盘能够提供更好的传输率和I/O性能,因为你可以将所有硬盘的I/O和吞吐量合并起来。不过,还有一些因素会影响这些性能的发挥:首先是RAID控制器,不是所有产品都能够提供稳定的高速数据传输;其次是控制器接口。目前的三种型号,PCI-X最高支持到533MB/s,PCI-E X4支持1GB/s的上行和下行数据,PCI-E X1支持上下行各250MB/s。你要确保接口带宽至少要比你期待的RAID阵列数据带宽高出50%才行,因为网络传输率可能会相当地低。
最后,过多的硬盘数量也会影响访问时间,尤其是从文件系统中获取一些很少量的信息的时候,可能会需要从各个硬盘分别读取。如果各个硬盘都要访问,则平均访问时间将是所有单个硬盘的最大访问时间。RAID系统本身也有一套协议,大约能把12-14ms的访问时间提高到20ms左右。
当你增加更多的I/O请求,阵列的表现就比单个硬盘要好,像NCQ(Native Command Queuing)和控制器缓存功能都可以发挥作用了。对于数据库应用,最好是选用带有大缓存的控制器来增加吞吐量,同时减少对频繁访问区段的访问时间。