基本情况:

有一黑吧,近期被举报频繁,准备转正。原内部使用网维大师+万象
网络:百为3900+顺网主交换+分支交换(忘记看牌子了)
外网接入:ADSL*2(每个四拨,下载速度轻松过30+M)+40m电信光纤(刚开通2天)

反映情况:

前天拉的光纤专线入场接通后,客户机频繁卡死,游戏掉线,而且是全场掉,所有游戏都掉或者卡死。

前期处理:

由于离网吧比较远,刚开始听网管说,有些不信。以为是夸大其辞,让他先把路由重启下。
10分钟后反映,好像情况好点。以为问题解决让继续观察,半小时后又来电话,说还是玩不成,1分钟一卡
之后又远程指导他把主交换,分支交换都重启了一遍。(中间发生他把主交换和分支交换机的连接光纤给弄掉了,造成开机都开不了的插曲,远程指导了半天才挨个检查弄通内网)
结果还是反映一分钟一掉
赶紧跑回办公室,上网,远程观察
结果发现一分钟,内网ping网关稳定不掉,外网ping外网网关,DNS,几乎同时都掉(如下图)
1.png

初步判断,内网ping网关正常,说明内网没问题,外网同时掉,估计是外网故障。
由于是3条外网,所以找了3个电脑同时开机,每个机器分流单独走一条线路,以此来判断是哪条故障。
结果,故障和上图一样。三条外线同时故障?同时一个时间点都丢包?(可能性太低,没继续考虑下去)
考虑是不是无盘的问题,又在两个收银机,一个无盘服务器上继续以上测试
结果还是和上图一样,我就郁闷了个天的。
果断联系百为客服,让看下是不是路由有问题,或者是设置问题。经过L工程师监测说,我ping的掉线的时候路由ping相同地址并没有丢包……肯定是内网问题!
让我在内网找问题,此时一头的雾水迷茫中,手头没有任何可以替换的交换机设备,而且网吧目前还在营业。中间考虑到L工程师说的外网没故障是内网故障的推断,怀疑是不是路由问题在路由把内网数据给外网数据转发过程中造成的丢包。网吧老板此时来电话说今天周末一定今天处理好这个故障,此时在办公室的我坐不住了,经过2小时的颠沛流离终于爬到网吧。(途中联系陕西百为总代魏总给提供了个备用百为路由)人到网吧等了10分钟路由也到网吧了。
果断换新备用路由什么分流也不加,只设置一条线路带整个网吧,三条线路分开试,看有问题没。
结果是残酷的。还是和上图一样。到这里我就懵了……

经过半小时的懵逼,为了彻底排除路由问题,想找笔记本接路由另外的一个口测试看还丢包不。结果是接另外一个口笔记本老提示没接好网线,又没有多余的网线测试(事实证明出现场最好带自己的全套装备,除笔记本外还要有网线,水晶头,测线仪,网线钳等等)这个方法作罢。

又懵逼了一会,决定联系百为L姓工程师。喊了半天也没有人理我发现其头像已黑,只好到大群喊了几句。
百为的工程师们还是比较热情的,简诉了问题的情况,然后把上图截图过去。一F姓工程师直接说一定是外网故障了。不用想了。如果我把聊天截图给老板看估计就没有以下的学习经验了。这时另一位L姓工程师(个人感觉此人水平在路由方面已是宗师级别)主动要求地址和密码,他要进路由看看,果断给之。

看了下后说,路由没问题外网也好着,然后我同时又抓了以上相似的图给他看这里就不贴了
这时他发现了问题了所在(这个就是他神奇的地方,现在写出来,让大家也多个参考)
2.png

此人直接给我指出标出来的地方说我们的TTL就不是255,你这个255肯定是和某个交换机冲突了。
这时旁边有个网管给我说,他们的网就在接了光纤外网调通后就坏了,调通后停电,来电后就坏了。
此时,L姓工程师刚好给我解释说,如果有停电情况,某些交换机的IP在改了之后,施工人员失误没有保存。再来电的话,会恢复原来的IP
此时我就不懵圈了,果断把路由的IP改成1.252,然后继续ping 1.254居然还是通的。
抱着试试看的心情登录了1.254,还好端口是80,不然我还要扫描端口。默认密码进去,发现是我大顺网的交换机(这里吐槽下顺网的工们,你们也是网吧的领导品牌了,怎么能把交换机的默认地址设成1段的呢,还是192.168开头的,真是……无语了。以前只是发现家用小的无线路由会在这个网段上,你们的连我都知道不用1段,这交换机咋就这么想不开,还有吐槽上次施工人员干嘛不保存下。)

之后的恢复过程无非是改各种ip,因为改完路由地址后,改了无盘的网关地址,让底下客户机重启,先让他们不卡了再说。

总结:以后可以简单的通过ping的模式,看出是不是有不同种设备IP冲突,免的我们多走弯路,在此感谢百为路由的各位工。