AI / Machine Learningobiekt

aktor-krytyk

Architektura łącząca parametryczną politykę (aktora) uczoną gradientowo z estymatorem wartości (krytykiem) redukującym wariancję aktualizacji.

Typ
obiekt
Pojęcie nadrzędne
architektura algorytmu RL
Źródło
Sutton, Barto, Reinforcement Learning: An Introduction, 2nd ed.

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja