Hasło słownika

Anthropic

Firma tworząca modele AI z naciskiem na bezpieczeństwo i przewidywalność zachowań modelu.

Firmy i markikategoria
A-Zhasło słownika
Kategoria: Firmy i marki

Opis

Anthropic jest kojarzony z podejściami do alignmentu i bezpieczeństwa modeli, w tym z praktykami ograniczania niepożądanych zachowań i testowania modeli. Dla praktyków to kolejny dostawca LLM, z którym porównuje się jakość odpowiedzi, kontekst i podatność na ataki promptowe.

Przykłady

  • Porównujesz odpowiedzi dwóch modeli na te same prompty i mierzysz jakość.
  • Sprawdzasz, czy model ulega prompt injection w treściach z internetu.
  • Ustawiasz polityki moderacji i ograniczenia narzędzi w aplikacji.