最新消息:

标签:monitor

Prometheus监控系统专题一、简介安装使用
Linux

Prometheus监控系统专题一、简介安装使用

ipcpu 2年前 (2018-11-11) 884浏览

Prometheus监控系统专题一、简介安装使用.md 一、Prometheus简介 Prometheus是一个开源的系统监控和报警工具,特点是 多维数据模型(时序列数据由metric名和一组key/value组成) 在多维度上灵活的查询语言...

监控dmesg的报错(Zabbix+Python)
Linux

监控dmesg的报错(Zabbix+Python)

ipcpu 2年前 (2018-07-25) 2279浏览

概述 dmesg是Linux中的输出系统错误的命令,比如OOM或者Kernel Panic都会显示在这里,因此监控dmesg的报错也极为重要。 使用Python编写检测脚本 #!/usr/bin/env python # -*- codin...

Kafka消费积压Lag监控工具Burrow的使用
Linux

Kafka消费积压Lag监控工具Burrow的使用

ipcpu 2年前 (2018-05-22) 13248浏览

Kafka消费积压Lag监控工具Burrow的使用.md 一、概述 Kafka是业内流行的日志队列处理软件,使用极为广泛,但是关于对Kafka的监控问题,网上的文章和相关的软件就比较少了。 KafkaManager算是几个开源软件里做的比较好的。可...

Redis监控汇总(2/2)
IT技术

Redis监控汇总(2/2)

ipcpu 2年前 (2018-04-09) 2248浏览

Redis监控汇总二.md 好了,说完系统自带的,我们来看看开源redis监控都有哪些吧 首先推荐的是Facebook家的小工具,redis-faina 三、redis-faina redis-faina是一个通过解析redis的MONITOR命令...

Redis监控汇总(1/2)
Linux

Redis监控汇总(1/2)

ipcpu 2年前 (2018-04-08) 3097浏览

Redis监控汇总一.md 一、概述 对于任何运行在生产环境的软件,监控都是必不可少的一个环节。 我们在分析各种工具之前,先来看下redis都有哪些指标需要关注和监控。 Redis监控的用途有两种,一种是类似于zabbix,监控指标并用来报警,另外一...

Flume进阶之-拦截器Interceptor和监控
IT技术

Flume进阶之-拦截器Interceptor和监控

ipcpu 2年前 (2018-03-02) 2899浏览

Flume进阶Interceptor和监控.md 一、Flume的Interceptor Flume中的拦截器(interceptor),用户Source读取events发送到Sink的时候,在events header中加入一些有用的信息,或者对e...

Zabbix使用Python检查Haproxy状态页面
Linux

Zabbix使用Python检查Haproxy状态页面

ipcpu 3年前 (2017-06-27) 3428浏览

Zabbix使用Python检查Haproxy状态页面.md 概述 网上有很多使用zabbix监控haproxy的脚本,但大多数都使用的socket方式,而haproxy的stats页面页面我们经常需要访问的,所以我们这次使用python来抓取hap...

zabbix的cpu取值加起来不是100%
Linux

zabbix的cpu取值加起来不是100%

ipcpu 3年前 (2017-05-12) 3021浏览

引入 在openstack私有云平台部署了Zabbix后,发现承载云主机的物理机(CentOS7),zabbix监控图有些异常,如下,CPU利用率这张图默认情况应该是图像占满100%的,而这里却只有不到80%。 解决 一开始怀疑是Zabbix客户端...

zabbix磁盘报警的二次判断
Linux

zabbix磁盘报警的二次判断

ipcpu 5年前 (2015-07-03) 1588浏览

zabbix磁盘报警的二次判断.md 一般对于较大的磁盘来说,剩余10%仍然有好几百G的空间可以使用,所以可以使用剩余磁盘大小二次判断。 如下: #@Free disk space is less than 10% on volume {#FSN...

针对zabbix单台主机的报警项,如何修改而不影响全局
Linux

针对zabbix单台主机的报警项,如何修改而不影响全局

ipcpu 5年前 (2015-05-12) 1474浏览

针对zabbix单台主机的报警项,如何修改而不影响全局 假设有10台服务器,使用的监控模板是统一的,但是其中一台内存长时间占用很高,一直触发报警。而其他服务器则没有问题,改如何修改监控项,而不影响全局呢?  首先我们进到主机-》触发器,...