一次失败的服务器安装经历

一次失败的服务器安装经历

  dell 750服务器瘫痪原因
  时间:20071029 下午16时
  周一上午到公司检查服务器,发现硬盘使用率一下子从上周5的80%左右猛增到93%,感觉LVM卷组有异常现象,当时没有太在意,只是想记录下来继续观察,到下午继续观察时发现硬盘使用率还是93%左右,于是删除了一些老的系统日志和一些比较老的不用的文件与备份,完成删除操作后检查硬盘空间还是92%以上。这时发现使用SecureCRT 5.1工具远程SSH到服务器已经失效,退出WinSCP3工具重新远程SSH到服务器也无反应。

  dell 750服务器解决办法
  时间 20071029 晚上20时
  得知服务器无法启动后,与IDC中心工程师电话联系,把备份文件发邮件给他们希望能够登录系统重新覆盖,在工程师操作中,提示文件已经覆盖,但是仍然无法启动服务器,报错原因为:ide0:I/O resource 0xlF0-0xlF7 not free 得知是硬盘错误,他们工程师建议我亲自去IDC中心看一下,于是晚上动身到IDC中心,到了以后检测机器,发现确实是 ide0:I/O resource 0xlF0-0xlF7 not free 的硬盘问题,于是使用RHEL AS 4,修复安装,安装后发现出现问题 kernel /Vmlinuz-2.6.9-34.Elsam ro root=/dev/VdGroup00/LogVol00 rhgb quiet 错误,当时不知道是什么原因,于是给头打电话,由于晚上时间已经很晚,头让我先回家,第二天直接去IDC中心再解决问题。当天晚上到家后,在网上查询 kernel /Vmlinuz-2.6.9-34.Elsam ro root=/dev/VdGroup00/LogVol00 rhgb quiet 这个问题,发现网上很多帖子写的可以在RHEL启动前按a键把这行启动命令编译为 kernel /Vmlinuz-2.6.9-34.Elsam ro root=/dev/VdGroup00/LogVol00 single 单用户启动模式,第二天到IDC中心尝试改变这行命令重新启动RHEL,发现仍然报错 Error 15:The filesystem not found,修复无果后只能重新安装RHEL,但是发现一直无法安装,总是检测不到硬盘,于是只好重新格式化硬盘重做RAID,但是一直无法安装,急!一直到下午头来了以后,才发现,服务器本身有一张引导光盘,必须先用那个引导光盘在硬盘上建立一个内核,才能够正常引导RHEL安装。最后重新做系统配置一些服务就一切正常了,不再一一叙述。

  根据这件事情总结的经验
  第一,感觉自己经验太少,毕竟没有在正经的大型机柜接触过服务器配置,一出现问题没有处理经验。

  第二,昨日晚上回家重新上网查找资料,发现ide0:I/O resource 0xlF0-0xlF7 not free这个问题确实是Dell 750服务器常见的一种错误,原因就是没有使用他本身的引导光盘而导致。

  第三,感觉以后对服务器操作一定要谨慎,尤其是删除某些文件时一定要看清楚,还有日常备份一定要及时做,好在这次的服务器上没有重要数据库数据,不然造成的损失一定不可估计,我将引以为戒!

  总之,通过这件事情,感觉自己又学到了很多知识和经验,对于自己今后的职业生涯和学习来说都是一次很好的经验和教训,我会继续努力提高自己经验和业务水平,努力使自己成为一名合格的系统管理员。
嗯  很受用 望继续努力
很好的经验,以后可以当参考了!!
我也想朝那个方向发展!
努力!