Hasło słownika

SRE

Podejście do utrzymania niezawodności systemów, które traktuje operacje jak problem inżynierski.

DevOpskategoria
1aliasy
Kategoria: DevOps
Aliasy: Site Reliability Engineering

Opis

SRE łączy automatyzację, observability, SLO i procesy incident management. Celem jest stabilność bez ręcznego gaszenia pożarów non stop.

Przykłady

  • Definiujesz SLO i alerty pod użytkownika.
  • Automatyzujesz on-call playbooki i mitigacje.
  • Robisz postmortemy i eliminujesz przyczyny.