最終搭建完成成品監控效果如圖所示
夜鶯是一套分布式高可用的運維監控系統,最大的特點是混合云支持,既可以支持傳統物理機虛擬機的場景,也可以支持K8S容器的場景。同時,夜鶯也不只是監控,還有一部分CMDB的能力、自動化運維的能力,很多公司都基于夜鶯開發自己公司的運維平臺。重點是部署方便快捷,相比目前主流的監控系統zabbix和Prometheus有自己的優勢。更適合國人的操作習慣和體驗,有著許多大公司線上環境的最佳實踐,如美團,滴滴等等
官方地址
https://github.com/didi/nightingale
夜鶯運維平臺是滴滴開源的一個運維平臺有著滴滴公司最佳實踐
夜鶯拆成了四個子系統,分別是:
用戶資源中心(RDB)、
資產管理系統(AMS)、
任務執行中心(JOB)、
監控告警系統(MON)
具體介紹請看官網,這里重點說明下部署步驟
我這里采用的docker部署
第一步github拉取代碼鏡像到服務器指定位置
也可以去http://116.85.64.82/ 拉取最新版本的tar包
拉取完成如圖所示
第二步配置啟動項
下載docker-compose
curl -L https://github.com/docker/compose/releases/download/1.25.0-rc4/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose
利用docker-compose下載生成并啟動鏡像
cd /home/yeying-master/nightingale-master/dockerfiles
docker-compose up #啟動
啟動完成docker ps 會生成如圖所示四個容器
注意端口不要被占用,否則無法正常啟動
若無報錯則可正常訪問
初始賬號密碼為 root root.2020
至此 master節點搭建完成
第三步配置node節點
wget http://116.85.64.82/n9e.tar.gz
tar -xf n9e.tar.gz
解壓后如圖所示
[root@yeyin-master ~]# ll
-rwxr-xr-x. 1 root root 3065 10月 9 23:02 control
drwxr-xr-x. 4 root root 4096 10月 9 23:03 etc
-rwxr-xr-x. 1 root root 22834094 10月 8 19:50 n9e-agent
-rwxr-xr-x. 1 root root 20181862 10月 8 19:50 n9e-ams
-rwxr-xr-x. 1 root root 22098532 10月 8 19:50 n9e-index
-rwxr-xr-x. 1 root root 20610070 10月 8 19:50 n9e-job
-rwxr-xr-x. 1 root root 22062651 10月 8 19:50 n9e-judge
-rwxr-xr-x. 1 root root 22890758 10月 8 19:49 n9e-monapi
-rwxr-xr-x. 1 root root 23874802 10月 9 22:49 n9e-rdb
-rw-r--r--. 1 root root 97333889 10月 9 23:03 n9e.tar.gz
-rwxr-xr-x. 1 root root 23887629 10月 8 19:50 n9e-transfer
-rwxr-xr-x. 1 root root 20424816 10月 8 19:50 n9e-tsdb
drwxr-xr-x. 2 root root 101 9月 28 10:07 sql
將 control n9e-agent/etc/address.yml /etc/agent.yml /etc/identity.yml 打包拷貝到/home/n9e/
如圖所示
修改配置文件
vim address.yml
將全局192.168.106.132改成master節點的主機的ip
:%s/192.168.106.132/ip/g
配置開機自啟服務
vim /usr/lib/systemd/system/agent.service
Description=n9e agent
After=network-online.target
Wants=network-online.target
[Service]
# modify when deploy in prod env
User=root
Group=root
Type=simple
Environment="GIN_MODE=release"
ExecStart=/home/n9e/n9e-agent
WorkingDirectory=/home/n9e
Restart=always
RestartSec=1
StartLimitInterval=0
[Install]
WantedBy=multi-user.target
systemctl restart agent
systemctl enable agent
檢查無報錯說明啟動正常
systemctl status agent
進入web平臺
即可看到剛才添加的node節點的主機信息
選擇游離資源-掛載資源,將相應的服務器掛載到相應的項目目錄下
選擇組織資源樹-選擇相應的項目
能夠看到剛才掛載的相應系統
任務執行中心可以批量執行任務,將相應的任務提前創建好,便于相應節點來批量執行任務
用戶中心可以批量加入服務器
監控大盤可以產看相應的服務器監控內容,這點還是比較直觀的
告警策略可以根據自己的需求配置
報警支持 郵件,釘釘,和企業微信
編寫腳本啟動程序
cat start.sh
#!/bin/bash
#
sh /home/n9e/control start all
systemctl restart redis
systemctl restart mariadb
ps -ef | grep nginx | grep master |awk '{print$2}' |xargs kill
nginx
echo "服務啟動成功"
yeyin配合grafana做展示平臺
wget https://dl.grafana.com/oss/release/grafana-7.3.2-1.x86_64.rpm
sudo rpm -i --nodeps grafana-7.3.2-1.x86_64.rpm
systemctl start grafana-server.service
systemctl status grafana-server.service
將n9e插件加入到grafana中
grafana-cli --pluginUrl https://github.com/n9e/grafana-n9e-datasource/archive/v1.5.3.zip plugins install grafana-n9e-datasource
systemctl restart grafana-server.service #重啟服務
訪問該地址 http://192.168.106.132:3000/
初始賬號密碼 admin/admin
具體配置如下
然后配置你想要添加的圖標顯示想要監控的內容
最終能夠呈現的效果如圖所示的看板監控
本文鏈接:http://www.avtobanya.com/39508.html
網友評論comments