摘要:信息技术的日新月异使得信息化进程大为加快。应用系统也面临着集中度高、重要性强的特点。如何能保证应用系统平稳高效运行成为一个重要的课题。文章仅从应用系统平台的方面来讨论如何加强管理。
关键词:应用平台;运维;管理
随着信息化的日益增进,应用系统的集中,如何维护应用平台就成了一个重点,难点。本文将对这个问题做个初步的探讨。
我们首先需要对应用平台进行健康检查,以确定应用平台的运行情况。对应用平台的健康检查主要分3部分,现场检查、日志分析、性能分析。除健康检查外,我们还要加强备份管理,保证系统安全。
1 现场检查的内容
(1)查看机房的温湿度情况、看是否在正常范围之内。根据我国国家标准电子计算机机房设计规范。机房夏季温度要求23±2℃、冬季温度要求20±2℃;相对湿度45%-65%。b级机房温度要求15℃~30℃;相对湿度40%-70%。相对湿度过低,容易产生静电,损坏元器件。相对湿度过高,会使电脑内部焊点和插座焊点的接触电阻增大,甚至被锈蚀。
(2)检查ups和空调,看其指示灯有无故障指示。
(3)检查小型机、存储、p服务器、交换机、带库有无警告灯亮起。①主机检查内容和步骤说明如下:a、电源检查。电源指示灯是否正常。b、磁盘组检查。主机自配系统硬盘指示灯是否正常。、网络适配器检查。电口网卡、光口网卡和hba卡的指示灯是否正常;②存储检查内容和步骤说明如下:a、电源检查。电源指示灯是否正常。b、磁盘组检查。存储设备自配系统硬盘指示灯是否正常;③交换机检查内容和步骤说明如下:a、电源检查。电源指示灯是否正常。b、控制器检查。交换机控制器的指示灯是否正常。、光纤模块检查。交换机光纤模块的指示灯是否正常;④带库检查内容和步骤说明如下:a、电源检查。电源指示灯是否正常。b、警告灯。是否有报警。
2 日志分析内容
(1)主机需要注意的有:①日志中有无报错信息,尤其是硬件报错,必须要仔细分析、及时修理;②注意磁盘空间变化情况,不但要注意磁盘空间使用率过大的文件系统。而且要对使用率迅速增大的文件系统仔细分析,是业务增大还是发生故障所致。如数据库的归档日志所在的文件系统需要及时清理,避免因为文件使用率达100%造成应用系统故障;③观察网络联通情况。看有无大量收发错误包。如果收发错误包数量和总发包比值超过5%。须检查网络情况;④检查存储存储磁盘链路使用状况,看有无磁盘减少;⑤对于卷组进行过镜像的系统,需要定期检查物理卷是否是处于同步状态。如果镜像功能已经失效。须按以下步骤操作:a、检查是否有硬盘损坏,如果有硬盘损坏,请保修进行更换。b、如果硬盘均正常,请运行同步命令,如果还无法同步,请及时联系厂家进行维护;⑥系统安全分析。分析登陆历史,看是否有非法登录或入侵企图。
(2)存储、交换机、带库最好用自带的管理软件分析有无报警、如有报警,需要及时处理。
3 性能分析
(1)主机主要是分析当前的系统负载情况。可以通过系统自带的命令来分析。也可通过一些监控软件来分析,如hppenvie等。主要注意一下检查点:①检查pu使用情况,分析pu使用是否正常。如果异常需要进一步分析、是因为磁盘i/问题还是软件故障。如正常需要分析何时为高峰期,何时为低谷。以便合理调配定时任务;②检查磁盘10状况,看哪些磁盘非常繁忙,分析原因,如果有可能尽量调整;③检查交换分区。查看交换分区状况来了解系统内存及虚拟内存使用情况。
(2)存储性能检查的检查点有:①整个阵列的吞吐量检查;②ahe命中率检查;③某个磁盘的ritei/se检查。
在做完设备的健康检查后、除了要立即着手解决发现的问题外还需要详细记录当天的日志,以备日后分析用。
未完...点击下方链接下载完整文档