ChatGPT stellt Sora mit einer KI-Videogenerierung von bis zu 20 Sekunden vor

OpenAI verspricht seit Februar die Veröffentlichung seines Videogeneratormodells der nächsten Generation, Sora. Am Montag veröffentlichte das Unternehmen im Rahmen seiner Veranstaltung „12 Days of OpenAI“ endlich eine funktionierende Version davon.

„Dies ist ein entscheidender Teil unserer AGI-Roadmap“, sagte OpenAI-CEO Sam Altman während des Livestreams des Unternehmens.

Nach Angaben des OpenAI-Teams wird Sora ab Montagnachmittag für Plus- und Pro-Abonnenten in den USA und auf der ganzen Welt verfügbar sein.

Berichten zufolge erhielt YouTuber Marquis Brownlee frühzeitig Zugriff auf den Videogenerator und veröffentlichte am Montagmorgen eine kurze Rezension auf seinem Kanal. Sora scheint nicht auf GPT-4 zu basieren, wie dies bei praktisch allen anderen generativen Tools von OpenAI der Fall ist. Das Modell ist nicht über die Standard-ChatGPT-Website verfügbar, sondern über Sora.com (das zum Zeitpunkt der Veröffentlichung dieses Beitrags noch nicht online war).

Das Modell ist in der Lage, Videos in Auflösungen von 480p bis 1080p und einer Länge von 5 bis 20 Sekunden zu generieren, entweder aus Textansagen oder Referenzbildern. Es ist auch in der Lage, vorhandene Videoclips zu bearbeiten und zu erweitern. ChatGPT Plus-Abonnenten können bis zu 50 Clip-Generationen mit bis zu 720p pro Monat und weniger Videos mit höherer Auflösung, jeweils fünf Sekunden lang, abspielen. Pro-Benutzern stehen unbegrenzte Generationen mit allen Auflösungen und einer Dauer von bis zu 20 Sekunden zur Verfügung. Zusätzlich zu den Bearbeitungstools bietet Sora auch eine „Storyboard“-Funktion, die es den Erstellern ermöglicht, mehrere Eingabeaufforderungen in einer einzigen Filmszene zu kombinieren.

Brownlee gibt an, dass das Modell „ein paar Minuten“ benötigt, um einen 1080p-Clip zu erstellen, merkt aber an, dass „das auch gerade jetzt so ist, wenn fast niemand sonst es verwendet.“ Ich frage mich, wie lange es noch dauern wird, wenn es einfach für jedermann zugänglich ist.“ Brownlee weist außerdem darauf hin, dass das Modell erhebliche Schwierigkeiten hat, die Beine und ihre Bewegungen richtig zu erzeugen, da die Vorder- und Hinterbeine auf unnatürliche und unverständliche Weise ihre Position tauschen.

Im Gegensatz zu Grok 2 wird Sora die Möglichkeiten seiner Benutzer einschränken und die Generierung von urheberrechtlich geschützten Themen, Personen unter 18 Jahren und alles, was Gewalt oder „explizite Themen“ enthält, ausdrücklich ausschließen.

Obwohl OpenAI eine führende Position in der KI-Branche einnimmt, kam es bei Sora bei der Entwicklung zu Verzögerungen, sodass Konkurrenten wie die Gen-3-Alpha-Modelle von Runway , Kling von Kuaishou Technology und die Movie-Gen-Modelle von Meta es auf den Markt bringen konnten. Sora wurde kürzlich (wenn auch nur für kurze Zeit) von einer Gruppe von Betatestern öffentlich durchgesickert, die dem Unternehmen vorwarfen, die Fähigkeiten des Modells „kunstgewaschen“ zu haben .