Zurück zum Glossar
Bestärkendes Lernen (RL)
Grundlagen
Agenten lernen durch Belohnung in einer Umgebung.
Reinforcement Learning optimiert eine Strategie (Policy) eines Agenten durch Belohnungen in Interaktion mit einer Umgebung.
- Kernelemente: Zustände, Aktionen, Belohnungen, Übergangsdynamik.
- Methoden: Wertfunktion (Q-Learning), Policy-Gradient, Actor-Critic.
- Herausforderungen: Exploration vs. Exploitation, Stabilität, Musterübertragung aus Simulation.
- Praxis: Reward-Design, Sicherheitsgrenzen, Off-Policy-Evaluation.