Metrics menggunakan Prometheus dan Grafana (2020)
Monitoring perangkat server menggunakan Prometheus dan Grafana pada Pelabuhan Indonesia III Banjarmasin.
“Server down itu pasti ada tanda-tanda awal yang kita lewatkan”
Latar belakang
- Kebutuhan untuk memonitoring perangkat server cctv yang sering hang karena kapasitas disk penuh.
- Kebutuhan memantau kondisi semua server dan service-service yang dijalankan di cabang Banjarmasin baik perangkat ber sistem operasi Linux maupun Windows.
- Belum adanya sistem alerting terhadap peralatan yang krusial apabila terjadi down.
Benefit
- IT mengetahui lebih dulu terhadap suatu insiden daripada user dengan sistem alerting.
- IT dapat menganalisa kinerja suatu alat/server.
- IT dapat melakukan tindak pencegahan sebelum terjadi masalah yang lebih besar pada server.
Fitur
- Monitoring resource server seperti :
- Uptime
- Penggunaan ram dari waktu kewaktu
- Penggunaan cpu
- Jumlah thread yang aktif
- Penggunaan koneksi/jaringan
- Penggunaan disk, disk ctivity dan disk i/o
- Jumlah exception error yang terjadi pada server
- Jumlah request pada backend service
- Pemberitahuan (alerting) via email jika :
- Perangkat down
- Penggunaan resource melibihi 90%
- Jumlah error yang melebihi batas
Teknologi yang digunakan
- Database time-series Prometheus
- Grafana
- Linux
Credits
- Muchlis instalasi, konfigurasi, query