AI / Machine Learningproces

tokenizacja podsłowna

BPE

Podział słów na częstsze podjednostki, łączący zalety reprezentacji znakowej i wyrazowej oraz ograniczający problem słów spoza słownika.

Typ
proces
Pojęcie nadrzędne
tokenizacja
Źródło
Sennrich et al., Neural Machine Translation of Rare Words with Subword Units

Zobacz też

tokenizacjazanurzenie słów

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja