阿尔法路由器的一些典型故障分析
一、路由器发包失败
1、在路由器的配置过程中,经常会碰到这样的问题,网络通信正常,路由器可以成功路由数据包到目标网络,但是从路由器发的数据包却传送失败,故障表现为路由器ping目标网络失败。
2、假设网络配置完成后,在测试网络连通性时发现从电脑IP为222.184.24.125,向目标网络218.2.22.123发送Ping时,路由器可以成功转发数据包,然而从路由器向目标网络218.2.22.123 发送ping时,出现ping失败。
(1)出现这样的情况,首先跟踪ping所经过的路径,检查路由表,目标地址218.2.22.123可以与路由表中0.0.0.0/0相匹配。检查其他的路由表,均可以发现与目标地址匹配的路由表项。
(2)跟踪ICMP回应应答数据包所经过的路径,要明确回应数据包的源地址,电脑发送ping时,回应应答数据包的目标地址就是 222.184.24.125,而路由器发送ping时,回应应答数据包的目标地址就是71.170.0.146,发现ICMP的回应应答数据包在处理时被丢弃了,所以从路由器向目标网络218.2.22.123 发送ping时,出现pmg失败。
(3)在路由器上增加一条指向71.170.0.144/30的静态路由,下一跳的地址为71.170.0.214。完成后,发现一切正常了。
二、路由器外网口关闭
1、随着网络用户数量增加,原来带宽已不能满足需要,于是增加带宽来解决问题,采用光纤接入到路由器后,使用百兆光电转换器经转换后通过双绞线接到路由器外网口上面,该路由器使用是千兆电口作为外网口,由于光电转换器只有1O0MB,该端口连接后速度显示100MB。
2、经过几天的运行,现每天当路由器外网口流量超过50Mbps/s后,该端口就会出现Receive Errors,流量超大,错误信息很多,突然外网不能上了,Telnet到路由器上面,发现对应的外网口没有流量,显示状态为UP,路由器上其他端口工作正常。
(1)发现在故障发生时,CPU显示23%,Memory为33%,不算太高,关键是其他接口都正常工作,这说明问题还是出现在这个端口上面,通过网管软件对端口关闭前的流量检测,发现该端口关闭前有很大的流量通过,显示端口的错误信息也比较多。
(2)通过分析得知应该是网络流量太大,利用率过高所致,流量超过80%后,造成端口不能正常,设置该端口工作在千兆模式下,100MB带宽仅利用该端口10%,这样端口可以轻松处理。
通过上面我们可以得知,网络故障在排除时需要考虑完整的通信过程,这样才能从整体上找出其故障的原因,而不是盲人摸象。