AI / Machine Learningproces

dekodowanie spekulatywne

speculative decoding

Przyspieszanie generacji przez model pomocniczy proponujący kilka tokenów naraz, które główny model weryfikuje jednym przebiegiem.

Typ
proces
Pojęcie nadrzędne
technika przyspieszania inferencji
Źródło
Leviathan i in., Fast Inference from Transformers via Speculative Decoding (ICML 2023)

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja