Hasło słownika

Guardrails

Zestaw zasad i mechanizmów, które ograniczają niepożądane zachowania modelu i wymuszają zgodność z polityką.

AIkategoria
1aliasy
Kategoria: AI
Aliasy: Safety rails

Opis

Guardrails mogą obejmować filtry treści, walidację formatu, blokady tematów, limity narzędzi i instrukcje w system prompcie. Dobre guardrails to mniej 'dzikich akcji' na produkcji.

Przykłady

  • Asystent nie wykonuje płatnych operacji bez potwierdzenia.
  • Bot odmawia podawania danych wrażliwych i kieruje do bezpiecznego kanału.