6.8号和我2个同事一起去了桐庐一个朋友的网吧,因为网吧在重新装修,所以去看看的。
网吧是2台32G的服务器,系统是2003的,我们去了后就准备做2008系统,第一台服务器顺利安装2008后正常,然后就做第二台服务器系统,安装好2008系统后,做好一切前期处理和忧化,准备设置缓存时发现内存为16G的了,该服务器内存是32G.
在BOIS里查看也是16G。但是发现了4根8G的现代内存条如下图:
此时以为是BIOS中设置的问题,把BIOS中要设置的都设置好了,依旧,把CMOS放电依旧,再排查是否是内存问题,反复拨插,并且使用橡皮插内存金手指,依旧,以为是内存插槽问题,更换插槽依旧,后来只插两根8G的正常显示16G,说明这两根内存正常,再加一根8G的,正常显示24G,再加一根8G的内存,就显示16G了,把4根都拨掉,单独插这一根8G的启动,发现无法启动,说明该内存有问题,更换后正常。
到此,2台服务器都正常了,游戏和无盘都装在一起的,开始试营业了,大概几小时之后,悲剧又出现了,有一批客人在叫卡了,看了下服务器,发现其中一台服务器不知道为什么重启了,这个时候也暂时不知道什么原因导致的了,于是我就把游戏虚拟盘的内存设置小一点,然后重启游戏虚拟盘服务,结果,服务器卡死了,重启服务器后,系统日志我看了下,发现有内存方面的错误信息,当时也没有太在意,如下图:(这张图当时我没有保存,刚刚群里成都-腾龙网络发出来的,我就借用下拉)出现已更正的硬件错误的另外一个原因:QQ用户(f4orexplo1t)提供他遇到的是服务器4张网卡,做成两组汇聚 ,每一组汇聚都有一根线有问题 ,一根是被老鼠咬了,没完全咬断,铜线漏出来了,然后网线附近又有很多电源线,可能是干扰问题,另外一根 是水晶头没打好 ,网线插上去,网卡灯要过四五秒才亮,重打水晶头之后接上去,半秒内就亮,然后换了网线后这个错误也没有了。(2013.12.3)
因为服务器重启了又正常使用了,于是继续使用,几小时过后,服务器又重启了。。这个时候没有办法了,感觉还是内存有问题,直接把客户机全部带在另外一台服务器上,让客人可以使用,然后就继续查内存了,用2008系统里自带的检测内存的工具查了.检测方法如下图:
检测到40%的时候,机器就自动重启了,然后一根根的检测,发现其中一根有问题,纠结啊!
为什么之前用的好好的,我们来重做了2008系统后,就出现了内存有问题的了?
问了下,原来装修中的时候,服务器没有关机的,有时候被人直接拔电源,后来这台服务器上4根8G的现代内存全部换了,还是换的现代的8G的,到目前正常中。
关于现代内存的其他案例:
1:当时我们在网吧的时候,遇到了当地的一个维护人员,也和我说了这样的事情,有个网吧,也是现代内存,服务器死机,重启,搞了一个礼拜,最后是换内存解决的。
2:过了几天,我QQ上也遇到了,也是现代内存。
3:然后前几天,又接到电话,也是现代内存,今天接到反馈,换了内存就正常了。近期发现用现代内存导致服务器异常,重启,蓝屏等问题的较多,不知道是不是近期的内存批次有问题还是什么的,因此建议,如果使用现代内存的用户遇到此类问题,优先更换服务器内存测试。