网吧用的是顺网2250+云更新1476,登入服务器后看,服务器已经启动49天,顺网服务和云更新服务都已经启动49天,状态里没有任何错误。打开系统日志,发现有报错, NTFS:系统未能将数据转储到事务日志。可能出现损坏现象。 ID57. 该日志竟然多达8w条,且每隔两三秒就增加一条。

初步怀疑是磁盘问题。但是日志中却没有更多信息。 为了定位是哪个硬盘有问题,采用排除法:

服务器系统和无盘服务正常,客户机重启后正常启动,服务器系统盘和镜像肯定没有问题(而且因为客户机有缓存,服务器镜像盘出问题,客户机也不会立即重启,据网管反映,所有机器是同时蓝屏重启的。),客户机大面积蓝屏重启(大约一半机器)应该跟游戏盘无关,游戏盘如果有问题应该只会造成游戏崩溃或报错。 那么如果硬盘有问题,应该是回写盘问题。 但是该网吧有5个回写盘,坏任意一个也不应该造成超过一半机器蓝屏重启。

打开硬盘哨兵后发现,硬盘健康度都很高,挨个点了一下,却发现一个奇怪的现象:5个回写盘都有大量的写入错误日志,最高的28940次写入错误,最低的也8340次!

1.jpg
(注 Intel S3510健康度满着就是70%)

不可能5个回写盘都出问题了吧?于是怀疑系统或者别的硬件问题。
打开磁盘管理器,突然发现服务器上有2个系统盘!内容竟然是一样的,但是少了个回写盘。第二个系统盘里文件打开却都报错。
奇怪的问题来了:怎么会有2个系统盘? 当初回写盘我用的是动态磁盘格式,怎么会无缘无故变成基本磁盘里面还有2008的文件?

重启服务器到PE下,却发现只有一个回写盘。然后服务器启动,竟然又变成了只有一个回写盘。但是系统日志仍然增加了一条NTFS报错。

于是怀疑是SAS卡缓存造成的问题,因为Dell c2100用的H700的SAS卡,而且说明上该卡拔掉缓存不能使用,只能尝试禁用缓存。

开机Ctrl+R进入SAS配置,H700卡不能桥接,只能把物理盘虚拟成raid才能用。F2打开菜单只能在建立虚拟盘的时候选择是否启用缓存。只能选择Delete VD删除磁盘,将所有磁盘删除后,按F2选择Creat new VD重新创建磁盘. 创建磁盘的时候选中Advanced Settings高级设置,read policy选择 No Read Ah, write policy选Write-Through 表示关闭缓存,切记尽量不要修改别的参数,否则容易导致硬盘上的数据丢失! 全部创建完毕后重启,进入Windows2008,客户机开机,观察一小时没有再报错,问题解决。