网站建设服务器
服务器故障描述:
山西某公司服务器的EMC FC AX-4存储RAID5磁盘阵列。阵列中有12个硬盘,包括两个作为热备盘的硬盘。阵列中硬盘的单个磁盘容量为1TB,服务器中的两个硬盘脱机,一个热备盘未启用。客户将服务器中的所有磁盘带到数据恢复公司。
通常导致服务器硬盘离线的原因是硬盘物理故障或者硬盘磁道不好。但由于EMC控制器有非常严格的磁盘检查策略,很容易将性能不稳定的硬盘判断为硬件故障而提出raid组,所以服务器崩溃的原因也可能是磁盘读写不稳定。
服务器数据恢复解决方案流程:
第一步:检测硬盘和服务器的数据备份;服务器中的所有磁盘都经过物理故障测试,硬盘没有物理故障。那么使用坏轨检测工具检查硬盘的坏轨是正常的。使用专业镜像工具镜像raid中的所有磁盘。如下图所示:
第二步:分析RAID组结构;raid数据恢复的常规步骤是首先分析服务器raid信息,然后重建Raid组。在这种情况下,发现作为热备盘的磁盘6和磁盘9没有数据。磁盘6已成功激活并替换磁盘阵列中的硬盘5,但数据不同步。继续分析服务器raid中其他硬盘的条带大小、数据分布规律、磁盘顺序等必要信息。发现同一盘磁带上的7号硬盘的数据与raid中的其他硬盘不同。初步确认这个磁盘是早前掉落的硬盘。利用数据恢复公司使用的raid验证程序找到最好的数据,所以先掉7号盘。独创的raid磁盘阵列是由北亚自主研发的raid虚拟程序建立的。
第三步:分析服务器磁盘阵列中的LUN信息;服务器底层只分配一个lun,所以工作量相对较小。只需要分析一个LUN的信息。在分析之后,raid恢复程序用于存储地图数据并将其导出。然后用自用软件解释zfs文件系统,部分文件系统文件解析时报错。工程师只好手动调试程序,发现错误原因是服务器突然崩溃,导致部分元文件损坏,现有程序无法正常解释。因此,有必要修复这些损坏的文件系统元文件,以便正常解析ZFS文件系统。通过分析损坏的元文件,发现一些文件系统元文件没有被更新和损坏,因为ZFS文件同时被存储在IO操作中。手动修复这些损坏的元文件,以确保ZFS文件系统可以正常解析。
步骤4:导出所有成功恢复的数据;使用该程序分析修复后的ZFS文件系统,并分析所有文件节点和目录结构。验证所有成功恢复的数据,数据完整。部分文件目录和验证截图如下:
更多关于云服务器,域名注册,虚拟主机的问题,请访问西部数码代理官网:www.chenqinet.cn。