Hasło słownika

Inference

Etap używania wytrenowanego modelu do generowania odpowiedzi na konkretny prompt.

AIkategoria

A-Zhasło słownika

Kategoria: AI

Opis

Inference to 'produkcja': model dostaje tokeny wejściowe i generuje tokeny wyjściowe. Koszt i latency zależą m.in. od długości kontekstu, szybkości sprzętu i parametrów losowości.

Przykłady

API do modelu liczy opłatę za tokeny w inference, nie za trening.
Czas odpowiedzi rośnie, gdy doklejasz dużo dokumentów do promptu.

Inference

Opis

Przykłady

Zobacz też