Hasło słownika

Guardrails

Zestaw zasad i mechanizmów, które ograniczają niepożądane zachowania modelu i wymuszają zgodność z polityką.

AIkategoria

1aliasy

Kategoria: AI

Aliasy: Safety rails

Opis

Guardrails mogą obejmować filtry treści, walidację formatu, blokady tematów, limity narzędzi i instrukcje w system prompcie. Dobre guardrails to mniej 'dzikich akcji' na produkcji.

Przykłady

Asystent nie wykonuje płatnych operacji bez potwierdzenia.
Bot odmawia podawania danych wrażliwych i kieruje do bezpiecznego kanału.

Guardrails

Opis

Przykłady

Zobacz też