AI / Machine Learningobiekt

błąd różnicy czasowej

Różnica między przewidywaną a wzmocnioną wartością stanu, używana jako sygnał uczący w metodach TD i aktor-krytyk.

Typ
obiekt
Pojęcie nadrzędne
sygnał błędu
Źródło
Sutton, Barto, Reinforcement Learning: An Introduction, 2nd ed.

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja