Zurück zum Glossar

Trainingsdaten

Grundlagen

Daten, mit denen ein Modell lernt.


Trainingsdaten bestimmen Kapazitäten und Grenzen eines Modells.

  • Qualitätsmerkmale: Repräsentativität, Rauscharmut, Labelgüte, Abdeckung.
  • Risiken: Verzerrungen, Duplikate/Leckagen, unzulässige Inhalte.
  • Praxis: Kuratieren, deduplizieren, balancieren, dokumentieren (Datenkarten).