Hasło słownika
SRE
Podejście do utrzymania niezawodności systemów, które traktuje operacje jak problem inżynierski.
DevOpskategoria
1aliasy
Site Reliability Engineering
Opis
SRE łączy automatyzację, observability, SLO i procesy incident management. Celem jest stabilność bez ręcznego gaszenia pożarów non stop.
Przykłady
- Definiujesz SLO i alerty pod użytkownika.
- Automatyzujesz on-call playbooki i mitigacje.
- Robisz postmortemy i eliminujesz przyczyny.