咨询热线

020-38289070

管理+IT

管理+ITPEG咨询融合管理+IT,通过一系列整合服务,帮助企业建立最本源的正向创新机制。

系统管理不等于SNMP——湖北电力的选择

IT投资明察秋毫,方为明智之举。您的网络,需要系统管理,还是设备管理?这里需要耐心、细致地辨析。今天,来听听湖北电力信息系统专家周主任的见解——系统管理不等于SNMP。

系统管理对象为服务器、网络设备、数据库、中间件、OA、ERP、拨测等应用系统,保障网络、业务、应用系统正常运行;而设备管理监测对象为网络设备和打开SNMP的服务器,只能监测服务器简单指标。系统管理可按任务计划定期模拟检测各种系统应用可用性,对其各种性能指标进行监测;设备管理并无此功能。周主任强调说:“设备管理不等同于网络管理,更不等同于系统管理,很多运维工作是SNMP无法胜任的。”

SNMP最初的标准确定之后,很快被众多的厂商设备所支持,并且发展到并不“简单”的地位。经过三次的版本演化,它在网管人员和系统工程师的心中可以说根深蒂固。很多管理员甚至将SNMP管理视为发现和解决一切故障的法宝,但随着网络和系统管理任务的增多,自己编写脚本就显得越发的复杂和吃力,例如操作系统、数据库和邮件系统的更新换代,以及跨平台数据库的统一管理,都使得很多人已经陷入了系统管理的泥潭,无法自拔。也正是在这种情况下,湖北电力开始认真寻求满足自身需求的解决方案。

“企业信息系统管理是一项庞大而复杂的工程。功能的实现往往需要借助于多种措施和设置,而导致故障发生往往由于多种原因,既可能是“一因多果”,也可能是“一果多因”。”周主任说:“所以系统管理绝对不是依据SNMP来随时观察系统的工作状态,而是用全面、动态和联系的眼光分析问题,进行逻辑推理,从纷繁复杂的现象中发现事物的本质。”

比如我们对CPU的理解,SNMP只会告诉我们它工作的状态,但不会告诉我们资源的使用应该如何优化。以Oracle数据库管理为例,为了对CPU故障进行定位,用户首先必须能够准确的评估出系统所用CPU资源的总量,随后,用户还必须确定系统是否具有充足的CPU资源,并识别出何时系统所消耗CPU资源的总量最多。如果性能故障的主要原因归结于当前系统的配置(服务器不具备足够的CPU和内存资源来运行程序),单一的系统管理方案只能提供升级配置或减少应用占用两种方案。如果单纯的依靠SNMP管理模型,那么后续的工作将依然受到一定程度的限制。

游龙为湖北电力开发的综合运维管理系统,提供了400多种监测器,可以对服务器、网络设备和应用系统进行深入细致的监测和管理,非常方便运维人员的管理。网络管理员看到系统界面颜色提示和报表数据统计,就知道哪里出现故障或存在故障隐患。同时,这是个智能化的运维平台,一旦出现异常,控制中心就可以给相应网管工程师发派工单,该工程师完成技术问题后即可反馈完成任务,并把解决的问题放到知识库当中共享。

虽然系统管理和SNMP的重心都同样在于装置的监看和控制,但系统管理将装置视为是整体,或是一群相关服务的集合。而SNMP很多时候将提供服务的设备视为是系统的一小部份。你也可以这样来看待两者的差别:一者是只关心特定装置的顺利运转(SNMP),另一者是关心整体网络的健全运作与长远发展。