Linux操作系统集群安装配置排错的基本方法
1. 如果你仅仅是为了学习,没有一个任务和一个工作等你解决,请直接跳到下面的3阅读.
2. 如果你面对的是选择要解决一个工作,一个任务,建议你强迫自己尽可能的做好以下的工作:
a. 仔细调查/记录用作节点的服务器和用作集群存储的共享阵列的硬件型号,系统BIOS, HBA卡类型,HBA卡firmware版本, Linux的发行类型,版本,kernel的版本,kernel 的patch版本(errata或者service pack的版本). 磁盘阵列柜的类型,连接方式,上面的控制器的firmware版本,数量,冗余方式。 服务器和存储之间连接的类型,数量,通路上的额外冗余要求.
b. 按照从a得到的信息,到硬件厂商的站点上,核对和下载最新的BIOS, firmware, OS driver和Release Notes, 并且核对 厂商公布的支持的Linux的具体版本,kernel 版本等操作系统认证支持细则
c. 仔细阅读你要安装的集群软件的 Installation/Admin guide 和当前版本的Release Notes中关于 硬件/软件需求的章节, 建议仔细的阅读几遍,这里包含有事关你以后安装是否顺利和成功的关键信息.
d. 核对从c获得的信息和你的实际情况之间的差异,确认无误后往下走.
e. 仔细阅读installation/admin guide中的安装步骤,建议动手前至少阅读2边,了解清楚安装的几个大步骤.
f. 开始安装并注意保留屏幕上和系统日志中的出现的异常信息.
g.在提问的时候,把a和b步骤中了解的信息,清楚地贴在你的问题最前面. 然后把你在步骤f中保留得异常信息贴在其次, 最后清楚地简洁的描述你的问题.
3. 学习linux集群的安装和去完成一个实际的安装工作任务是很不一样的,如果你确定要学习的linux集群系统并且希望掌握的话,你需要做到的就是在动手操作前的阅读。阅读这个软件的Release Notes, Installation guide/admin guide, 如果这些都没有看过或者草草的看过一遍就动手的话,你会走得很艰难,而且你提出的问题,就我本人而言,也非常不愿意花费时间来回答,因为你遇到的大部分问题,都是因为你不理解,不熟悉这个集群系统的基本知识和概念导致。
我相信提供这个集群系统的厂商的站点以及正确的有效率的使用google 将是比你在这个论坛草率的重复提问更加重要的学习步骤。
如果你看到我回你的帖子,仅仅是说 please check xxxx.xxxx.xxx 或者 google.com ,请不要生气,这表明我仔细看了你问题,然后凭我不短的linux学习工作经验,我认为你可以很轻松的在相关厂商和google上找到大把大把的有效帮助信息,而不用我们大家在这里做搬运工,帮你把那些信息重复copy到这里来给你看。