众所周知,Zabbix监控的表面逻辑非常简单,分为三个动作,采集数据(监控项),判断采集的数据是否超过定义的阈值(触发器),产生告警(邮件、短信等等)。当然这仅仅是表面,内部的一些函数判断实际上很复杂,这些不是我们探讨的重点。如果当你的监控设备种类繁多,监控指标复杂,那么只能通过自作模板实现你的监控工作。
正文
Zabbix监控项分为很多种,由于今天讨论的焦点为网络设备,自然而然选择的为SNMP这种类型,相信大家对SNMP多多少少也有些了解,如果不理解的也没关系,可以查找互联网其他优质的文章也有介绍,或者等我下期文章也行。
监控项组成
- 名称
- 键值
- 类型
- 信息类型
- 更新时间
制作过程思路
1.寻找监控项的OID
2.利用snmpwalk工具取值检验OID是否存在
3.制作监控项
制作前准备工作
1.如果出现下图中的报错,需要安装net-snmp-utils,以CentOS 8为例
dnf-yinstallnet-snmp-utils
2.开启设备snmp配置(以华为为例,其他自查)
snmp-agent snmp-agentsys-infoversionv2c snmp-agentcommunityreadcipherHuawei@123
3.snmpwalk用法
snmpwalk用在Zabbix Server端,主要语法为(斜体为可变,根据自身环境修改):
snmpwalk -v 2c -c Huawei@123 10.0.0.10 OID
制作案例
案例主题为监控华为CE58系列交换机CPU利用率。
1.通过官网查询其CPU相关OID或者下载相关mib用mib浏览器查看,推荐采用mib browser,mib文件可以在官网下载到或者找相关厂商要即可,下面是查询到的相关OID,其实用到hwEntityCpuUsage就可以了,但是如果有框式设备就不一样了,有些板卡上自带CPU,文末我会放出框式设备的CPU利用率。
entPhysicalName1.3.6.1.2.1.47.1.1.1.1.7 entPhysicalClass1.3.6.1.2.1.47.1.1.1.1.5 hwEntityCpuUsage1.3.6.1.4.1.2011.5.25.31.1.1.1.1.5
2.查询各个OID所代表的的意思。
snmpwalk-v2c-chuawei@12310.240.255.101.3.6.1.2.1.47.1.1.1.1.7 可以看出为实体名称。
snmpwalk-v2c-chuawei@12310.240.255.101.3.6.1.2.1.47.1.1.1.1.5 查询的是物理实体的通用类型,不知道取值代表什么意思?看看下图二
该OID详解
snmpwalk-v2c-chuawei@12310.240.255.101.3.6.1.4.1.2011.5.25.31.1.1.1.1.5 查询CPU利用率,字面理解
3.通过查询对比分析。
首先查询CPU利用率,只有一个值有数据,如下,但是由于通过获取的结果无法看出是什么,只知道索引值为16842753的实体的CPU利用率为23%,所以需要进一步分析。
SNMPv2-SMI::enterprises.2011.5.25.31.1.1.1.1.5.16842753=INTEGER:23
该OID介绍
查询该实体名称
通过下面命令得出结果为"CE5855-48T4S2Q-EI 1",这个就是实体名称,盒式设备的CPU利用率一般是设备本身,所以可以理解为CE5885的CPU利用率的OID就是SNMPv2-SMI::enterprises.2011.5.25.31.1.1.1.1.5.16842753,如果是堆叠环境就存在两个,另外一个就是"CE5855-48T4S2Q-EI 2"。
snmpwalk-v2c-chuawei@12310.240.255.101.3.6.1.2.1.47.1.1.1.1.7.16842753
得出结果
创建主机并测试
创建主机
修改团体字(读或者写)
创建监控项
写完后,确定即可
查看最新数据正常,点击图形下一步
出图正常
附录
mib browser截图
用mib browers查看mib文件
为什么需要查询多个值关联分析
以12804为例子,如下图,可以发现框式设备多了很多CPU实体,由于每板卡一个CPU,所以如果不判断哪个实体的CPU是你想要的,很容易出错,这也是为什么需要去关联分析,其次通过关联分析引出的另外一个内容就是自动发现规则,如果每次都是如此去添加,就太过麻烦了,而且每个设备的索引值都有可能不一样,所以这些变化比较大的,CPU、内存、接口等等都适合自动发现,在下一篇文章我会写到。
得出的结果
常用的OID值
总结
如果对于SNMP的相关知识不理解的朋友更加需要自己测试,加深自己的理解,活学活用,如果要找一个端口的流量,应该先找到该端口的名称主体索引,再查找流量值,mib的运用在后续的snmptrap我们还会碰到,其实这个内容的难点在于找MIB,找到mib需要花大量的时间去验证OID是否合适,另外mib文件需要专用的软件查看,最后还是得说一句,监控领域长路漫漫,绝非一朝一夕,大量的测试和验证才是真理。
转载请注明:IT运维空间 » 运维技术 » Zabbix5.2由浅入深系列之制作网络设备监控项
发表评论