
无需加好友免费技术支持
序言
网络慢、ping延迟时间大或网络丢包是网络维护中常用的故障之一。怎样精准定位故障主要原因是困惑和切实可行的。相似的故障无法通过远程教育系统或Agent获取数据分析的定位方式。
本实例是高等院校门户网网站间断性故障分析全过程,涉及到数据包重传送分析,现梳理共享,希望能对维护人员有一定的帮助和启迪。
故障叙述
近日,某大学网站主页发生间断性无法访问故障。
依据监管系统报警,故障时长时常产生,每一次故障期为4-11min。
根据Zabbix网御星云监控管理平台均接到故障信息。
具体如下。
网御星云安全性云监控警示
Zabbix服务器监控系统
分析结果
基本分析,确定故障。产生故障时,①很多数据包重传来现在网上中;②该服务器服务项目正常的;③别的服务器在故障时服务项目正常的。
结果猜疑网络里带有相似的结果WAF运用自动控制系统危害网站。
除此之外,分析发觉服务器积极往外进行联接要求,安全隐患问题与风险,提议进一步确定。
详尽分析全过程
布署NetInside系统分析
汇聚交换机布署在大学里服务器周边NetInside网络总流量分析系统软件根据探头机器设备收集储存特定链接的所有流量数据,完成无人化,能够即时免费下载、分析和编解码所需要的初始包,快速查找问题缘故。
详尽布署部位如下所示:
应用NetInside系统分析故障
故障网站服务器222.111.66.110(虚拟注册地址,真实地址早已掩藏。假如你不知道该如何在抓包软件文档中掩藏它IP地址,前去NetInside网站,频道与网络分析中查询网站。或在网站上检索如何隐藏开展分析。如图是2019年11月3日17:00至18:1小时之内的浏览分析。
依据系统软件分析,这时服务器出现3次故障,每一次故障不断2min。
每一次产生故障时,服务器有20-50个接受不成功。
与此同时,服务器上传的线程数明显降低。
不成功数指TCP三步握手时,手机客户端发送至服务器SYN数据包,但服务器初始化失败,即服务器初始化失败SYN/ACK数据包,造成三步挥手整理不成功。
线程数指取得成功TCP挥手数据信息三次。
通过平台分析,创建手机客户端和服务器TCP联接环节存在的问题,无法访问网站是正常。
深层次分析故障
这种情况的可能性比较大,如:互联网故障造成顾客户端数据包没法抵达服务器;服务器硬件配置故障接受不了手机客户端数据包;网络里存有特殊程序管理与控制的机器难题;Web应用故障导致不能接受和回应手机客户端数据包等。
NetInside该平台类似网络摄像机,展示了正常的和故障期内全部服务器平台流量信息内容。
下边,深层次分析从系统内读取故障时的小视频。
经分析,网络里发生故障时显著存有很多无响应SYN,及其很多数据包重传送,如图所示。
与此同时,服务器222还在故障期内发生.111.66.110有回应数据信息,但回应内容丢失后重新传送。下面的图为红色框,证实服务器服务项目正常的。
结论的详尽分析
根据NetInside系统分析,得到下列结果:
①故障时,互联网顺畅,即浏览可以达到;
②服务器运作正常的(特性是不是降低,需进一步核对);
③故障只危害222.111.66.110(虚拟注册地址,真实地址早已掩藏)所提供的网站浏览(假如你不知道该如何掩藏爬取文档中的包IP地址,前去NetInside在研发频道与网络分析中查询网站。或在网站上检索如何隐藏。)网络里别的网站的浏览影响不大(别的服务器外界服务项目正常的)。
可能是因为网络里的许多控制系统,必须进一步分析。
提议
为进一步精准定位故障的主要原因,提议如下所示:
① 整理与网站服务器有关网络的与应用构造,产生详尽的系统架构图,密切关注相似的WAF或流控机器设备部位;
② 除开查询Web除服务器日外,融合另一台日志进一步检查故障时间记录,给予其他信息;
③ 这类故障近期时常发生。在汇总了逻辑与物理性质后,多一点搜集数据包,密切关注服务器和接近服务器的网络交换机(目前)NetInside别的可能会影响机器设备)Web浏览主要设备的另一侧。
根据较为故障后的数据包信息内容,能够精准定位故障的主要原因。
其他发觉
对其222.111.66.在110总流量分析中,发觉服务器做为手机客户端积极浏览了好几个外界详细地址:47.100.203.69,47.97.242.20,120.55.35.2.经查看,这种服务器各是上海市、杭州市和浙江省阿里服务器服务器。
提议确定是否属于已经知道业务流程和行为,制定有关控制方法。