服务器日常维护常识
用于机房工作人员新手学习了解服务器日常维护的基础内容。
开关机顺序及线缆连接
- 01
开机顺序 打开总电源。打开计算机机柜电源打开外部设备电源(如磁盘阵列、磁带库等)待外部设备自检完成后,最后打开主机电源。
- 02
关机顺序 进行操作系统的关闭关闭主机电源关闭外设电源.(如磁盘阵列,磁带库等)关闭其他设备电源和机柜电源。
- 03
电缆连接注意事项 在进行电缆连接(插拔)时,最重要的一点是,通过该电缆连接(或将要连接)的设备应当是没有加电的,即应当先将设备的电源关掉,然后再进行电缆连接(插拔)操作。否则,如果带电进行电缆连接,会造成对设备无法预料的损坏(尤其是硬盘)。
基本维护常识
- 01
• 每天查看服务器状态,查看内容包括服务器CPU占用,服务器内存占用、服务器硬盘占用,数据库状态,数据表状态 • 注意服务器各个指示灯的状态(第5节中有对指示灯的详细说明)• 每日检测服务器系统软件版本更新信息 • 每30天对服务器安全等级评测一次 • 对以上的检测内容生成报告 • 系统定期自动备份数据 • 若服务器硬盘空间少于10%,则清理硬盘的日志文件 • 若数据库或数据表状态出现异常,则修复数据表,并整理数据库碎片 • 每月服务器登录密码更换一次 • 若发现安全漏洞,则需对系统进行修补,打上补丁
系统日志的查看收集
- 01
系统日志很重要,因为它可以记录系统中硬件、软件和系统问题的信息,同时还可以监视系统中发生的事件。用户可以通过它来检查错误发生的原因,或者寻找受到攻击时攻击者留下的痕迹。下面介绍一下windows系统和linux系统下查看收集日志方法:
- 02
windows系统日志 开始→设置→控制面板→管理工具 中找到的“事件查看器”,或【开始】→【运行】→输入 eventvwr.msc 也可以直接进入“事件查看器”。如查看其中“系统”请单击、右键可另存日志文件,以便提供技术人员分析。
- 03
linux系统日志 平常主要分析messages和dmesg这两个文件,查看日志可以拷贝下来后在windows下用写字板打开查看,也可以在linux下用more或less命令查看。/var/log/dmesg : 核心启动日志./var/log/messages : 系统大部份的讯息皆记录在此, 包括 login, check password , failed login, ftp, su 等。
常见故障处理
- 01
服务器无法供电 1,市电、UPS、电源线故障(断电或接触不良)2,电源或电源模组故障,检查电源,将所有的电源接口拔下,将电源的主板供 电口的绿线和黑线短接,看看电源是否启动3,注意开关按钮是否弹起良 4,主板或其它插卡造成中断冲突
- 02
服务器可供电但无法显示 1,检查各种板卡是否接触良好、I/O接线是否连接正常(可拔插部件测试)。2,将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘) 直接短接主板开关跳线,看看是否能够启动。3,如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下 先由最容易替换的配件开始替换(内存、cpu、主板)
- 03
系统频繁重启 电源故障(替换法判断解决)温度过高,尤其是CPU温度,并注意查看各个风扇内存故障(可从BIOS错误报告中查出)网络端口数据流量过大(工作压力过大)服务器死机故障判断处理:软件故障(更新或重装操作系统解决)
- 04
服务器死机故障判断处理 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: A软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 B硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)