Hasło słownika

Alerting

Mechanizm powiadamiania, gdy metryki lub warunki wskazują na problem w systemie.

DevOpskategoria
A-Zhasło słownika
Kategoria: DevOps

Opis

Dobry alert mówi, co boli i jak bardzo. Zły alert spamuje i powoduje, że ludzie przestają reagować. Najlepiej opierać alerty o SLO i symptomy użytkownika.

Przykłady

  • Alert, gdy P95 latency rośnie 3x przez 5 minut.
  • Alert, gdy płatności mają error rate > 2%.
  • Alert, gdy brakuje miejsca na dysku.