Zurück zum Glossar
Trainingsdaten
Grundlagen
Daten, mit denen ein Modell lernt.
Trainingsdaten bestimmen Kapazitäten und Grenzen eines Modells.
- Qualitätsmerkmale: Repräsentativität, Rauscharmut, Labelgüte, Abdeckung.
- Risiken: Verzerrungen, Duplikate/Leckagen, unzulässige Inhalte.
- Praxis: Kuratieren, deduplizieren, balancieren, dokumentieren (Datenkarten).