Text-to-Video

Bild/Audio/Video

Videogenerierung aus Text.

Text-to-Video beschreibt die Fähigkeit von KI-Systemen, aus Textbeschreibungen kurze Videosequenzen zu erzeugen. Dabei werden Bild-zu-Bild-Übergänge modelliert, um Bewegung und zeitliche Dynamik zu simulieren.

Beispiel: „Ein Sonnenuntergang über dem Meer mit einer fliegenden Möwe.“
Bekannte Modelle: Runway Gen-2, Pika Labs, Sora (OpenAI).