Zurück zum Glossar

Text-to-Video

Bild/Audio/Video

Videogenerierung aus Text.


Text-to-Video beschreibt die Fähigkeit von KI-Systemen, aus Textbeschreibungen kurze Videosequenzen zu erzeugen. Dabei werden Bild-zu-Bild-Übergänge modelliert, um Bewegung und zeitliche Dynamik zu simulieren.

  • Beispiel: „Ein Sonnenuntergang über dem Meer mit einer fliegenden Möwe.“
  • Bekannte Modelle: Runway Gen-2, Pika Labs, Sora (OpenAI).