Zurück zum Glossar

Bestärkendes Lernen (RL)

Grundlagen

Agenten lernen durch Belohnung in einer Umgebung.


Reinforcement Learning optimiert eine Strategie (Policy) eines Agenten durch Belohnungen in Interaktion mit einer Umgebung.

  • Kernelemente: Zustände, Aktionen, Belohnungen, Übergangsdynamik.
  • Methoden: Wertfunktion (Q-Learning), Policy-Gradient, Actor-Critic.
  • Herausforderungen: Exploration vs. Exploitation, Stabilität, Musterübertragung aus Simulation.
  • Praxis: Reward-Design, Sicherheitsgrenzen, Off-Policy-Evaluation.