Linux网络的管理员的经验:网卡要匹配
笔者是一个 linux 网络的管理员。在局域网内,有两台关键的服务器,一个是主服务器、一个是备份服务器,中间通过心跳线连接。服务器a使用红旗 linux 4.0,作为文件服务器。
心跳线是用于连接a、b两台服务器间的网线。在这两台服务器a、b中,a为工作机,b为备份机。在服务器上都配有两块网卡,其中一块专门用于两台服务器(节点)间的通讯。安装在服务器上的软件通过心跳线来实时监测对方的运行状态。系统在运行中一旦发现服务器出现故障,可以把该服务器上的所有进程转移到备份服务器上,从而为客户提供不间断的服务。同时,还具有系统崩溃的智能检测与处理系统,可以利用各种手段来检测硬件、存储设备、网络及系统软件的故障。这样可以在最大限度上保证网络的正常运行,这也称为“心跳检测”。心跳线主要利用一条rs-233检测链路来完成。采用ping命令方式检测验证系统宕机检测的准确性。
一天,发现linux服务器a连接心跳线的网卡由于硬件的磨损老化(rtl8139as、100m),出现物理故障。随即到计算机市场购买一块最常见的10mb/100mb自适应网卡—realtek多功能模块(multifunction mode)单芯片rtl 8139d(l)的网卡。它的兼容性很好,几乎可以工作在所有linux主要发行版本。安装过程很顺利,系统自动识别。两台机器都可正常运行,设置网卡 ip地址后,发现通过心跳线服务器a和服务器b却不能连通。由于心跳线是通过网卡相连来检测服务器状态的,所以要重点查看每台机器心跳线连接的网卡状态及配置,可经 检查网卡状态并没有问题,网卡灯也是亮的。难道是网线没插好或是有问题?重新用一根确认正常的网线替换下原网线,可是两个服务器之间的心跳线还是不通,至此已基本排除了硬件方面的问题,估计还是网卡的设置有问题。进入两台机器的网卡状态选项,将两台机器的网卡状态一项一项地进行比较。
1.首先查看linux服务器a网卡现在的工作模式,输入命令:
#mii-tool -v
eth0: negotiated 100basetx-fd, link ok
product info: vendor 00:00:00, model 0 rev 0
basic mode: autonegotiation enabled
basic status: autonegotiation complete, link ok
capabilities: 100basetx-fd 100basetx-hd 10baset-fd 10baset-hd
advertising: 100basetx-fd 100basetx-hd 10baset-fd 10baset-hd
link partner: 100basetx-fd 100basetx-hd 10baset-fd 10baset-hd
从以上信息中可以看出,这块网卡工作在10m全双工自适应模式下,“10basetx-fd”意为10m full duplex。而服务器b连接心跳线网卡工作在100mbit/s全双工状态下。
原来服务器a,b使用的是都是10/100mbit/s自适应以太网卡,设计速度为100mbit/s。服务器a更换新网卡后,网卡自动选择状态为10m全双工自适应模式。由于两边网卡所选择的工作状态不一致,导致网络不通。
2.下面我们查看如何修改网卡工作模式输入命令:
#mii-tool --help
usage: mii-tool [-vvrrwl] [-a media,... -f media] [interface ...]
media: 100baset4, 100basetx-fd, 100basetx-hd, 10baset-fd, 10baset-hd,
(to advertise both hd and fd) 100basetx, 10baset
media可选的模式有100basetx-fd、100basetx-hd、10baset-fd、10baset-hd等。interface代表所选择的网卡,如eth0、eth1等,默认为eth0。
3.修改网卡工作在10m双工模式下,输入命令:#mii-tool -f 100basetx-fd eth0
再使用ping命令检测连接状态,结果显示连接正常,问题解决。
目前有许多自适应的网卡,按照 原理,应能正确适应速率和双工方式,但实际上,由于品牌的不一致,往往不能正确实现全双工方式。只有手工强制设定才能解决。因此,我们在设置网络设备参数时,一定要参考服务器或者其他工作站上的网络设备参数,尽量能使各个设备匹配工作。另外大家在使用自适应网卡时最好设置一个初始的速率,且最好两边速率相同,而不要使用自适应。速率设置的问题常常会导致网络时断时续。