Vergessen Sie Text-zu-Bild; Diese KI erstellt Videos aus Ihren Eingabeaufforderungen
Sie haben wahrscheinlich schon von den erstaunlichen Ergebnissen gehört, die durch Text-zu-Bild-KI wie Dall-E , Stable Diffusion und Midjourney erzielt wurden . Wie Sie vielleicht erwartet haben, schreitet die Revolution voran, wobei das nächste Ziel Text-zu-Video-KI-Tools sind.
Google und Meta haben ihre Text-zu-Video-Fähigkeiten in Forschungsberichten aus ihren KI-Laboren gehänselt , aber diese fortschrittliche Technologie war der Öffentlichkeit nicht zugänglich. Wenn Sie sehnsüchtig darauf gewartet haben, ganze Videos mit einer einfachen KI-Eingabeaufforderung zu erstellen, haben Sie jetzt dank QuickVid die Gelegenheit dazu.
Bevor Ihre Erwartungen zu hoch steigen, ist es wichtig zu erkennen, dass dies nicht gleichbedeutend ist mit dem Generieren von Tausenden von Stable Diffusion-Standbildern und deren Zusammenstellung zu einem Video oder dem Zugang zu den fortschrittlichsten KI-Systemen der Welt für echte Videogenerierung. Dies ist ein sehr früher Einstieg in das Rennen um eine Text-zu-Video-Lösung.
Der erste Schritt des Prozesses für die KI besteht darin, ein Skript basierend auf Ihrer Eingabeaufforderung zu generieren. Ich habe das System getestet, indem ich aus diesen Worten einen YouTube-Kurzfilm erstellt habe: „Ein Video einer DJI-Drohne, die über einen Astronauten auf dem Mars fliegt, und endet mit einer Reaktionsaufnahme des überraschten Astronauten.“
Die KI schrieb eine vollständige Erzählung mit 79 Wörtern nach meiner Aufforderung und synthetisierte dann die Rede mit einer Auswahl an männlicher oder weiblicher Stimme. TechCrunch wies darauf hin, dass das für das generierte Video ausgewählte Hintergrundvideo aus einer Bestandsbibliothek stammt und es anscheinend reichlich Filmmaterial von „Astronauten auf dem Mars“ gab.
Als fragwürdigen letzten Schliff überlagert QuickVid das Skript als Titel und fügt Miniaturbilder hinzu, die von der Dall-E-API generiert wurden. Der oben gezeigte resultierende YouTube-Kurzfilm ist … interessant. Vielleicht würde es mit irdischeren Videos besser umgehen.
In einem TechCrunch-Interview sagte der Entwickler von QuickVid, dass Verbesserungen kommen werden, wobei im Januar weitere Personalisierungsoptionen verfügbar sein werden. Schließlich wird QuickVid auch Bildunterschriften und Support-Avatare enthalten.
Im nächsten Jahr könnten noch viele weitere Text-zu-Video-Lösungen auf den Markt kommen, zusammen mit anderen visuellen Wundern wie AR-Brillen und fortschrittlicheren VR-Headsets. Es sollte spannend sein.