Prometheus监控系统专题一、简介安装使用
ipcpu 4年前 (2018-11-11) 2299浏览
Prometheus监控系统专题一、简介安装使用.md 一、Prometheus简介 Prometheus是一个开源的系统监控和报警工具,特点是 多维数据模型(时序列数据由metric名和一组key/value组成) 在多维度上灵活的查询语言...
ipcpu 4年前 (2018-11-11) 2299浏览
Prometheus监控系统专题一、简介安装使用.md 一、Prometheus简介 Prometheus是一个开源的系统监控和报警工具,特点是 多维数据模型(时序列数据由metric名和一组key/value组成) 在多维度上灵活的查询语言...
ipcpu 5年前 (2018-07-25) 3883浏览
概述 dmesg是Linux中的输出系统错误的命令,比如OOM或者Kernel Panic都会显示在这里,因此监控dmesg的报错也极为重要。 使用Python编写检测脚本 #!/usr/bin/env python # -*- codin...
ipcpu 5年前 (2018-05-22) 20298浏览
Kafka消费积压Lag监控工具Burrow的使用.md 一、概述 Kafka是业内流行的日志队列处理软件,使用极为广泛,但是关于对Kafka的监控问题,网上的文章和相关的软件就比较少了。 KafkaManager算是几个开源软件里做的比较好的。可...
ipcpu 5年前 (2018-04-09) 3063浏览
Redis监控汇总二.md 好了,说完系统自带的,我们来看看开源redis监控都有哪些吧 首先推荐的是Facebook家的小工具,redis-faina 三、redis-faina redis-faina是一个通过解析redis的MONITOR命令...
ipcpu 5年前 (2018-04-08) 4766浏览
Redis监控汇总一.md 一、概述 对于任何运行在生产环境的软件,监控都是必不可少的一个环节。 我们在分析各种工具之前,先来看下redis都有哪些指标需要关注和监控。 Redis监控的用途有两种,一种是类似于zabbix,监控指标并用来报警,另外一...
ipcpu 5年前 (2018-03-02) 4547浏览
Flume进阶Interceptor和监控.md 一、Flume的Interceptor Flume中的拦截器(interceptor),用户Source读取events发送到Sink的时候,在events header中加入一些有用的信息,或者对e...
ipcpu 6年前 (2017-06-27) 5065浏览
Zabbix使用Python检查Haproxy状态页面.md 概述 网上有很多使用zabbix监控haproxy的脚本,但大多数都使用的socket方式,而haproxy的stats页面页面我们经常需要访问的,所以我们这次使用python来抓取hap...
ipcpu 6年前 (2017-05-12) 4725浏览
引入 在openstack私有云平台部署了Zabbix后,发现承载云主机的物理机(CentOS7),zabbix监控图有些异常,如下,CPU利用率这张图默认情况应该是图像占满100%的,而这里却只有不到80%。 解决 一开始怀疑是Zabbix客户端...
ipcpu 8年前 (2015-07-03) 2703浏览
zabbix磁盘报警的二次判断.md 一般对于较大的磁盘来说,剩余10%仍然有好几百G的空间可以使用,所以可以使用剩余磁盘大小二次判断。 如下: #@Free disk space is less than 10% on volume {#FSN...
ipcpu 8年前 (2015-05-12) 2850浏览
针对zabbix单台主机的报警项,如何修改而不影响全局 假设有10台服务器,使用的监控模板是统一的,但是其中一台内存长时间占用很高,一直触发报警。而其他服务器则没有问题,改如何修改监控项,而不影响全局呢? 首先我们进到主机-》触发器,...