Hasło słownika
Guardrails
Zestaw zasad i mechanizmów, które ograniczają niepożądane zachowania modelu i wymuszają zgodność z polityką.
AIkategoria
1aliasy
Safety rails
Opis
Guardrails mogą obejmować filtry treści, walidację formatu, blokady tematów, limity narzędzi i instrukcje w system prompcie. Dobre guardrails to mniej 'dzikich akcji' na produkcji.
Przykłady
- Asystent nie wykonuje płatnych operacji bez potwierdzenia.
- Bot odmawia podawania danych wrażliwych i kieruje do bezpiecznego kanału.