Hasło słownika

Scale-to-zero

Model skalowania, w którym usługa może zejść do zera działających instancji, gdy nie ma ruchu, i wznowić się na żądanie.

DevOpskategoria
2aliasy
Kategoria: DevOps
Aliasy: skalowanie do zera scale to zero

Opis

Scale-to-zero obniża koszty, bo nie płacisz za bezczynne instancje. Ceną jest zwykle cold start i konieczność odtworzenia stanu lub połączeń. Przy agentach AI to kuszące, bo wiele zadań jest nieregularnych, ale trzeba pilnować ciągłości interakcji, trwałej tożsamości i limitów czasu uruchamiania.

Przykłady

  • Agent jest uśpiony przez godzinę i wznawia się dopiero po nowym zadaniu.
  • Środowisko testowe skaluje się do zera poza godzinami pracy.