Hasło słownika
Anthropic
Firma tworząca modele AI z naciskiem na bezpieczeństwo i przewidywalność zachowań modelu.
Firmy i markikategoria
A-Zhasło słownika
Opis
Anthropic jest kojarzony z podejściami do alignmentu i bezpieczeństwa modeli, w tym z praktykami ograniczania niepożądanych zachowań i testowania modeli. Dla praktyków to kolejny dostawca LLM, z którym porównuje się jakość odpowiedzi, kontekst i podatność na ataki promptowe.
Przykłady
- Porównujesz odpowiedzi dwóch modeli na te same prompty i mierzysz jakość.
- Sprawdzasz, czy model ulega prompt injection w treściach z internetu.
- Ustawiasz polityki moderacji i ograniczenia narzędzi w aplikacji.