服务器硬件作为应用软件部署的基础平台,是基础架构中最为核心的设备。一旦服务器出现故障就会影响业务的正常开展。因此,服务器的运维管理对于企业整个IT运维管理来说尤为关键。
如何做好服务器的硬件维护、掌握哪些服务器硬件运维知识或技能,是每个服务器硬件运维人员所要深思的事情。服务器运维人员的工作“包含但不限于”以下列表中内容,不过这些也是服务器硬件运维工程师的典型职责。
1、参与制定服务器应用规划和实施方案;
2、评估各类服务器产品和技术,为IT管理、规划者提供有效的数据;
3、检查硬件运行情况,保障硬件的正常运行,及时对发现的硬件报警给予处理。对灰尘较多的服务器设备,定期对设备进行除尘工作;
4、升级硬件微码,必要时升级或者迁移系统、数据(硬件物理层面迁移);
5、对硬件的运行情况进行评估,逐步提高整体硬件的可用性;
6、诊断、定位故障、解决任何硬件相关问题。
针对以上服务器硬件运维工程师的职责,作为一个合格的服务器硬件运维工程师应该具备和掌握以下维护技能或知识:
1、对各厂商服务器家族产品有一定的了解。尤其是当前运维的服务器设备厂商的家族产品需格外关注,这对将来服务器的升级或更新换代提供信息有很好的帮助。
2、具备服务器整体应用规划、部署、上架的能力。这是作为一个服务器硬件运维人员所必须掌握的技能。从机器后端各种连线(网线、电源线、光纤线等)梳理的整洁情况,初步可以判断这名运维人员的整体能力。
3、对需要维护的服务器,从硬件整体把握服务器的构造,深入了解服务器中各个配件的物理位置,这对定位硬件故障非常重要。如:IBM会提供各类小型机的Servcie Guide手册,里面就会对服务器各部件的位置有详细的说明。
4、掌握服务器指示灯的含义及如何处理。
5、具有硬件故障诊断,更换配件的技能。首先是要有效地定位故障问题,这样才能谈得上如何去更换。定位故障的方法有很多种。