选择munin的原因并非是觉得这个工具好读,而是简单,server-node形式,容易上手。
下面详细的介绍munin的安装,配置,自定义脚本插件,这里写的时候我选择的是shell,因为其他的语言都不熟。
一、安装
我这里的环境是centos6.6 64位#rpm -Uvh http://download.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm#rpm --import /etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-6#vi /etc/yum.repos.d/epel.repo #这个就是上面安装包安装后生成的文件替换[epel]中的路径为mirrorlist=贴出最终的文件来给大家看如下[epel]name=Extra Packages for Enterprise Linux 6 - $basearch#baseurl=http://download.fedoraproject.org/pub/epel/6/$basearch#mirrorlist=http://mirrors.fedoraproject.org/metalink?repo=epel-6&arch=$basearchmirrorlist=http://mirrors.fedoraproject.org/mirrorlist?repo=epel-6&arch=$basearchfailovermethod=priorityenabled=1gpgcheck=1gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-6[epel-debuginfo]name=Extra Packages for Enterprise Linux 6 - $basearch - Debug#baseurl=http://download.fedoraproject.org/pub/epel/6/$basearch/debugmirrorlist=http://mirrors.fedoraproject.org/metalink?repo=epel-debug-6&arch=$basearchfailovermethod=priorityenabled=0gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-6gpgcheck=1[epel-source]name=Extra Packages for Enterprise Linux 6 - $basearch - Source#baseurl=http://download.fedoraproject.org/pub/epel/6/SRPMSmirrorlist=http://mirrors.fedoraproject.org/metalink?repo=epel-source-6&arch=$basearchfailovermethod=priorityenabled=0gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-EPEL-6gpgcheck=1 修改完毕后安装munin#yum clean#yum install munin munin-node #这地方如果你只是node端就没必要装munin了,可以省了安装完成!
二、配置
munin上面安装后会在以下目录产生文件(夹)/usr/share/doc/munin-common-2.0.25/usr/share/perl5/vendor_perl/Munin/var/run/munin/etc/logrotate.d/munin-node/etc/munin/etc/rc.d/init.d/munin-node/usr/sbin/munin-node/usr/sbin/munin-node-configure/usr/sbin/munin-run/usr/share/munin/var/lib/munin/var/lib/munin-node/plugin-state/etc/cron.d/munin/etc/httpd/conf.d/munin.conf/etc/logrotate.d/munin/etc/munin/usr/bin/munin-check/usr/bin/munin-cron/usr/bin/munindoc/usr/sbin/munin-sched/var/log/munin/var/www/cgi-bin/munin-cgi-graph/var/www/cgi-bin/munin-cgi-html/var/www/html/munin
其中,/etc/munin是munin的配置文件集中地,其中munin.conf是munin的server的配置文件,而node的配置文件都在/etc/munin/plugin-conf.d成都文件夹中。
我的munin server的配置文件如下
dbdir /var/lib/muninhtmldir /var/www/html/muninlogdir /var/log/muninrundir /var/run/munintmpldir /etc/munin/templatesincludedir /etc/munin/conf.dgraph_strategy croncgiurl_graph /munin-cgi/munin-cgi-graphmax_size_x 50max_size_y 50html_strategy cronmax_processes 90[localhost.localhost] #node的名称 address 127.0.0.1 use_node_name yes df._dev_sda1.warning 1 users.warning 1contacts othercontact.other.command mail -s "Munin notification ${var:host}" 476556**3@qq.com #发送告警邮件contact.other.always_send warning critical
另外,我的node端没有做太大的配置,除了刚开始实验memecache的监控做了如下配置外,自定义监控脚本根本没有配置。
[diskstats] #默认user munin[iostat_ios]user munin[memcached_*] #我自己照着网上给的添加的env.host 127.0.0.1env.port 11211env.timescale 3
好了,上述的配置已经完成,但是,这里需要提示是munin是需要web容器的支撑的,所以一定记得安装nginx或者apache或者其他,在这里我选择nginx,因为小而强大,下面贴出nginx的配置,其实只需要改nginx的目录路径即可,如下
location / { root /var/www/html/munin/; #你没看错,就是这句 index index.html index.htm index.php; }
好了,用下面的命令把nginx,munin启动起来
/usr/local/nginx/sbin/nginx/etc/init.d/munin-node start
启动起来之后访问页面,如下
好啦,已经可以访问啦,如果不能访问,请检查网络,防火墙,密码等设置。
三、自定义脚本
munin的简单之处在于自定义脚本能写能用,它的脚本在/usr/share/munin/plugins/下
[root@localhost munin]# ll /usr/share/munin/plugins/total 1516-rwxr-xr-x. 1 root root 1624 Nov 26 14:37 acpi-rwxr-xr-x 1 root root 2749 Jan 14 18:58 alive_test-rwxr-xr-x. 1 root root 3258 Nov 26 14:37 amavis……
我写的是网站的监控码的监控,如下所示
#!/bin/sh#www_chengdu_cn.sh is written by juanfaif [ "$1" = "config" ]; then echo "graph_title website status" echo 'graph_args --base 1000 -l 0' echo 'graph_vlabel status code' echo 'www_chengdu_cn.label www.chengdu.cn' echo 'graph_category system' #这是图像的归属地,分类啦 exit 0fiwww_chengdu_cn=`curl -o /dev/null -s -w "%{http_code}" echo "www_chengdu_cn.value ${www_chengdu_cn}"
这样,简单的数据采集就形成啦,写完后要做软链接如下
ln -sf /usr/share/munin/plugins/www_chengdu_cn.sh www_chengdu_cnchmod 755 /usr/share/munin/plugins/www_chengdu_cn.sh
不过在写脚本的过程中你可以进行排查错误,比如上面的我们写的得到网站的状态码可以通过telnet进行测试
telnet 127.0.0.1 4949 #munin默认的端口是4949[root@localhost plugins]# telnet 127.0.0.1 4949Trying 127.0.0.1...Connected to 127.0.0.1.Escape character is '^]'.# munin node at localhost.localdomainfetch www_chengdu_cnwww_chengdu_cn.value 200.
就是这样,说明已经可以采集到数据,尽情等待网页上面的显示吧,不过等待时间略长,5分钟。
网上说的是可以在定时任务中修改时间限制就可以让时间缩短,但是我这边没有生效,还是5分钟,知道在哪修改的同学可以联系我,万分感谢。
[root@localhost plugins]# more /etc/cron.d/munin ## cron-jobs for munin#MAILTO=root*/1 * * * * munin test -x /usr/bin/munin-cron && /usr/bin/munin-cron
好了,等待显示出来
中途修改了host定向到其他的网站以或得不同的状态码。说明成功。ps因为是从load脚本修改过来的,所以会有个load啦。
好了,抛砖引玉到此为止。
我的邮件报警时好时坏,等我把告警弄彻底了再来发文。
这就是简单的报警,我要的不是这么简陋的啦,所以要认真研究。
还有,如果不明白的网上有官网啦,当然,可以问我^^,我会的帮你解答啦。