Metrics menggunakan Prometheus dan Grafana (2020)

Monitoring perangkat server menggunakan Prometheus dan Grafana pada Pelabuhan Indonesia III Banjarmasin.

“Server down itu pasti ada tanda-tanda awal yang kita lewatkan”

windows monitoring windows monitoring

Latar belakang

  1. Kebutuhan untuk memonitoring perangkat server cctv yang sering hang karena kapasitas disk penuh.
  2. Kebutuhan memantau kondisi semua server dan service-service yang dijalankan di cabang Banjarmasin baik perangkat ber sistem operasi Linux maupun Windows.
  3. Belum adanya sistem alerting terhadap peralatan yang krusial apabila terjadi down.

Benefit

  • IT mengetahui lebih dulu terhadap suatu insiden daripada user dengan sistem alerting.
  • IT dapat menganalisa kinerja suatu alat/server.
  • IT dapat melakukan tindak pencegahan sebelum terjadi masalah yang lebih besar pada server.

Fitur

  1. Monitoring resource server seperti :
    • Uptime
    • Penggunaan ram dari waktu kewaktu
    • Penggunaan cpu
    • Jumlah thread yang aktif
    • Penggunaan koneksi/jaringan
    • Penggunaan disk, disk ctivity dan disk i/o
    • Jumlah exception error yang terjadi pada server
    • Jumlah request pada backend service
  2. Pemberitahuan (alerting) via email jika :
    • Perangkat down
    • Penggunaan resource melibihi 90%
    • Jumlah error yang melebihi batas

Teknologi yang digunakan

  1. Database time-series Prometheus
  2. Grafana
  3. Linux

Credits

  • Muchlis instalasi, konfigurasi, query