这里说的RAID-6故障,是指RAID-6逻辑盘丢失或不可访问。导致RAID-6故障的原 因主要有以下几种:
1. RAID控制器出现物理故障
RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-6中各 个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出來的逻辑盘自然就不存在了。
2. RAID信息出错
RAID控制器将物理盘配置为RAID-6后,会生成一些参数,包括该RAID-6的盘序、 条带大小、RAID在每块物理盘中的起始地址、校验的排列方式等,还会记录该RAID-6的 相关信息,包括组成该RAID-6的物理盘数目、物理盘的容量大小等,所有这些信息和参 数就被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候 也会保存到RAID-6的成员盘中。
RAID信息出错就是指该RAID-6的配置信息和参数出现错误,导致RAID程序不能正 确地组织管理RAID-6中的成员盘,从而导致RAID-6逻辑盘丢失或不能访问。
3. RAID-6成员盘出现物理故障
RAID-6 可以允许其中两块成员盘离线而不影响数据的完整性,如果RAID-6中的某两 块成员盘相继出现物理故障,剩下的成员盘可以利用校验值计算出离线成员盘中的数据, 所以RAID-6还不会崩溃。
如果系统管理员没有及时替换出现故障的成员盘,当第三块成员盘再出现故障离线后, RAID-6将彻底崩溃。
4. 人为误操作
如果误将RAID-6中三块以上成员盘同时拔出,或者给RAID-6除尘时将成员盘拔出后 忘了原来的顺序,以及不小心删除RAID-6的配置信息等,都会造成RAID-6崩溃。
5. RAID控制器的稳定性
RAID-6的数据分布结构中有两个校验值存在,当RAID-6中有成员盘离线时,尤其是 当两块成员盘离线后,算法将变得非常复杂,RAID控制器将会工作在很吃力的状态。而 RAID控制器的负载太重便会极大地增加数据读写时出现I/O滞留的可能性,从而导致更多 成员盘离线,或者导致RAID信息出错。
本文系转载,如有侵犯版权问题,请通知。我们立即删除。
转载请注明:成都千喜数据恢复中心 » 服务器RAID-6故障原因及分析