Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag?

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - fnemian1

Nach einem Jahr des Wartens kam Sora endlich heraus, aber OpenAI brachte die Internetnutzer dazu, zu Hilfe zu kommen.

Es wurde vereinbart, dass es offiziell zur Nutzung freigegeben wird und nur die Glücklichen, die live übertragen und schnell genug sind, es als Erste erleben können. Nachdem ich einen Tag lang gewartet, mich immer wieder erfrischt hatte und immer wieder mit der Erinnerung konfrontiert wurde, „Bitte schauen Sie später noch einmal vorbei“, habe ich mich schließlich erfolgreich registriert.

Allerdings reichten die 20 US-Dollar, die es mir und ChatGPT ermöglichten, über alles von Poesie bis hin zu Lebensphilosophie zu chatten, nur aus, damit Sora in einem Monat 40 5-sekündige 480p-Videos erstellen konnte. Jeder Klick zum Generieren ist wie ein Spaziergang auf dünnem Eis.

Nachdem wir es endlich genutzt haben, wollen wir natürlich jedes Sora-Video bis zum Rand nutzen und es mit Runway und Keling vergleichen. Das Fazit ist, dass es brauchbar ist und Spaß macht, aber es ist schwierig, es zu loben.

Sora, Runway und Ke Ling scheiterten alle auf ihre Art.

Es gibt natürlich einen Grund, Sora mit Runway und Keling konkurrieren zu lassen. Der eine ist das repräsentativste KI-Videoprodukt im Ausland, das früh auf den Markt kam, und der andere ist ein einheimischer Spitzenspieler, der plötzlich aufgetaucht ist und mit seiner Stärke Internetnutzer auf der ganzen Welt erobert hat.

Die Regeln sind sehr einfach und verwenden dieselben englischen Eingabeaufforderungswörter (zur besseren Lesbarkeit werden die folgenden Wörter ins Chinesische übersetzt), und die generierte Zeit beträgt 5 Sekunden. Der einzige Unterschied besteht darin, dass die Auflösung von Sora auf 480p eingestellt ist. Es geht nicht anders, Sie müssen sparsam mit Ihren Punkten umgehen.

Verwenden Sie zunächst Wensheng Video, um den Realismus und die Textur der Bilder zu vergleichen und zu sehen, wie die von den KI-Videos generierten Katzen aussehen.

Obwohl Sora nur 480p hat, sieht das Bild hochauflösend aus und die Farbkorrektur ist wunderschön.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s1

▲Sora generiert ein schnelles Wort: Das 200-mm-Teleobjektiv fängt die Britisch Kurzhaarkatze auf dem Balkon mit deutlichen Haardetails ein. Die große Topfpflanze im Vordergrund ist leicht verschwommen und die Blätter im Hintergrund wiegen sich im Wind. Das Bild hat die Körnigkeit und Farbsättigung eines Films in High-Definition-Qualität

Die Leistung von Runway und Keling ist ähnlich und Kelings Vorder- und Hintergrund werden am genauesten generiert. Drei Katzen, drei Farben.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - r1

▲Landebahngenerierung

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - k1

▲Chen-Geistergeneration

Lassen Sie als Nächstes die KI-Videos „schreiben“ und prüfen Sie, ob sie „APPSO“ schreiben können.

Soras Handbewegungen sind ganz natürlich, aber die Zeilen, die er schreibt, ähneln dem Essen von Pilzen und haben ihre eigenen Ideen.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s2

▲Sora generiert, Aufforderungswort: Draufsicht auf die Handschrift „APPSO“ auf weißem Skizzenpapier, schwarze Striche, sanfte Schreibbewegungen, natürliche Handbewegung, sanfte Beleuchtung, Nahaufnahme

Runway hat es am meisten richtig gemacht, aber nicht ganz, bis auf den letzten Strich arbeiteten die Buchstabenspuren und Handbewegungen nicht stillschweigend zusammen und funktionierten jeweils für sich.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - r2

▲Landebahngenerierung

Was Ke Ling betrifft, so schrieb er eine Reihe verstümmelter Zeichen, aber es kam selten vor, dass die Buchstaben den Bewegungen seiner Hände folgten.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - k2

▲Chen-Geistergeneration

Dann testen wir die Geschmeidigkeit der Bewegung. Im selben Radrennen folgten Soras Schüsse und Bewegungsbahnen vollständig den prompten Worten, und die Schatten sahen sehr real aus.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s3

▲Sora generierte ein promptes Wort: Der Mountainbiker raste schnell über die kontinuierlich wellige Schotterpiste und startete von der letzten Plattform. Die Seitenaufnahme hielt den Moment fest, als er am höchsten Punkt war.

Die Stichworte von Runway waren nur zur Hälfte richtig, der Radfahrer erschien am Anfang nicht und am Ende bekam er eine Highlight-Aufnahme.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - r3

▲Landebahngenerierung

Ke Ling und Runway waren genau das Gegenteil. Sie zeigten in der ersten Halbzeit eine gute Leistung, aber am Ende ging etwas schief. Warum gab es eine zusätzliche Person?

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - k3

▲Chen-Geistergeneration

Es ist an der Zeit, sich der Herausforderung zu stellen und sich ein relativ kompliziertes Aufforderungswort auszudenken, das mit dem Kamerawechsel einhergeht.

Die Farben auf Soras Bild waren gesättigt, als wären sie abgeschwächt, aber die Männer schienen aus dem Nichts zu erscheinen und die KI richtete die Kamera nicht wie erforderlich auf die Männer.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s4

▲Sora generierte ein promptes Wort: An einem sonnigen Nachmittag in einem Café im Starbucks-Stil richtete sich die Kamera zunächst auf eine lächelnde junge Chinesin und wandte sich dann einem jungen Chinesen zu, der beim Sprechen leicht nickte. Sie saßen einander gegenüber, mit zwei Tassen Kaffee auf dem Holztisch. Natürliches Licht erfüllt den Raum und schafft eine warme Atmosphäre

Runway hat es direkt von der Seite aufgenommen und dabei die Gesichtsausdrücke der beiden Personen wiederhergestellt, aber es spiegelte nicht die Bewegung der Kamera wider und außerdem stimmte etwas mit den Händen des Mannes nicht.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - r4

▲Landebahngenerierung

Ke Ling ähnelt Runway, ist aber etwas besser, weil es chinesischer ist. Allerdings saßen diese beiden Leute am selben Tisch, aber keiner sah den anderen an.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - k4

▲Chen-Geistergeneration

Neben Vincent-Videos sind Tusheng-Videos auch das Highlight der Videogenerierung. Im Vergleich zu Vincent-Videos sind Tusheng-Videos im Grunde genommen Tusheng-Videos. Versuchen Sie zunächst, Konsistenz in der Bildphase zu erreichen.

Wenn Sie jedoch ein 20-Dollar-Plus-Benutzer sind, können Sie keine Fotos oder Videos mit Personen auf Sora hochladen. Das nächstbeste wäre, ein Emoticon einer Zauberkatze hochzuladen und die Katze aufzufordern, ihren Zauberstab zu schwingen und Rosen zu zaubern.

Ich weiß nicht warum, aber Soras Tusheng-Video funktioniert überhaupt nicht. Nur am Logo in der unteren rechten Ecke können wir erkennen, dass es sich um kein Standbild handelt.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s5

▲Sora generierte ein promptes Wort: Cat schwenkte den Zauberstab in seiner Hand und verwandelte sich in eine rote Rose.

Runway bat die Katze, mit der rechten Pfote einen Zauberstab zu schwenken, und ihre linke Pfote verwandelte sich in eine Rose, was den Anforderungen des Aufforderungsworts entsprach, aber die Blume befand sich nicht auf derselben Ebene.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - r5

▲Landebahngenerierung

Die Leistung von Ke Ling ist perfekt und der Effekt ist am natürlichsten. Wenn es in ein GIF umgewandelt wird, ist es nur ein weiteres Emoticon.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - k5

▲Chen-Geistergeneration

Ich habe es mit Tieren versucht und dann den leeren Spiegel verwendet, den ich zuvor mit KI als Material für das Tusheng-Video erstellt hatte.

Die von Sora generierten Ergebnisse sind schwer zu bewerten. Der Blickwinkel ist niedrig genug, aber die Kamera führt nicht von der Seite und die Bildübergänge sind abrupt. Das nennt man, ich soll nicht im Auto sein, sondern unter dem Auto.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s6

▲Sora generiert, prompte Worte: vorbeifahrende gepanzerte Fahrzeuge, Reifen, die Staub und Trümmer aufwirbeln, seitliche Kamerafahrt, Tiefwinkelperspektive, Zeitlupe, Textur auf Filmniveau

Runway erzeugt das meiste innere Flair, sogar die Autofenster bewegen sich.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - r6

▲Landebahngenerierung

Ke Ling zoomte direkt aus der Kamera heraus, was im Grunde nichts mit dem Aufforderungswort zu tun hatte.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - k6

▲Chen-Geistergeneration

Es gab nur wenige Fragen und keiner der drei KIs konnte die volle Punktzahl erreichen. Natürlich sind die oben genannten Beispiele nicht allgemeingültig und können bestenfalls nur eine Bewertungsperspektive bieten.

Wenn wir nur von Sora sprechen: Es funktioniert gut im realistischen Stil von Vincents Videos, mit filmischer Qualität, und die Objektbewegung folgt den prompten Worten gut, manchmal sogar besser als bei Keling und Runway.

Tusheng-Videos erregen jedoch leicht die Aufmerksamkeit der Menschen, sie bleiben möglicherweise still und sie hören möglicherweise nicht auf die Bewegung der Kamera, sodass die Gesamtkosteneffizienz nicht hoch ist.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - S7

▲Sora generiert, promptes Wort: 35-mm-Kurzfilm, gedreht in Shanghai in den 1990er Jahren, Filmqualität

Modell „Beggars Edition“, innovative Produkte

Die Leistung von Sora ist durchschnittlich, wahrscheinlich weil es eine „Bettlerversion“ ist – im Gegensatz zu den von OpenAI eingeladenen Künstlern können wir jetzt die Turboversion verwenden, die weniger Rechenleistung erfordert und deren Wirkung beeinträchtigt ist.

Es gibt nicht genügend Modelle, daher muss Sora etwas überzeugend sein – es wurde im Februar offiziell angekündigt und im Dezember veröffentlicht. Viele Konkurrenzprodukte sind in der Mitte aufgetaucht, aber Sora hat immer noch Funktionen, die sie nicht haben.

Im Gegensatz zu ChatGPT, wo ein einziges Dialogfeld die Welt dominiert, ist Sora einzigartig im Design seiner interaktiven Benutzeroberfläche und Produktfunktionen.

Die Storyboard-Funktion von Sora ähnelt der des ersten und letzten Frames, ist jedoch flexibler. Die Karten können einzelne Wörter, Bilder und Videos enthalten.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - girl1

Also habe ich zwei Absätze mit Aufforderungen geschrieben: 1. Aufnahme im Stil eines japanischen Dramas, die High-School-Schülerin lehnt mit einem Seitenprofil am Dachgeländer, das sanfte Nachmittagslicht fällt auf ihr Gesicht. 2. Sie dreht ihren Kopf, um ins Gesicht zu schauen Kamera und lächelt herzlich. Die Beleuchtung unterstreicht den Gesichtsausdruck.

Der daraus resultierende Effekt entspricht meiner Vorstellung und das Flattern der Haare lässt die Herzen der Menschen höher schlagen.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s9

▲ Sora generiert

KI ist noch nicht in der Lage, jeden zum Regisseur zu machen, aber Sora ermöglicht es Ihnen, das Gefühl zu erleben, Storyboards zu entwerfen. Aber auch hier ist das Modell so, der Effekt ist sehr zufällig, aber Soras Punkte können dem Kartenziehen nicht standhalten.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - cg1

Ursprünglich wollte ich, dass die KI den Effekt der CG-Spiele imitiert, bei dem sich der Protagonist schnell umdreht und seine Waffe zieht, aber am Ende bekam ich einen Roboter mit stumpfem Gesichtsausdruck.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s10

▲Sora generiert

Sie können auch einfach ein Bild auf dem Storyboard platzieren, und Sora generiert automatisch Aufforderungswörter, die vorschlagen, wie das Bild verschoben werden soll.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - gu1

So kann die Zauberkatze endlich umziehen. Es stellt sich heraus, dass die Mängel von Tusheng Video hier behoben werden müssen. Allerdings ist der Effekt auch schwer zu dehnen und führt manchmal zu unnötigen Dingen.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s11

▲Sora generiert

Darüber hinaus macht Soras Remix-Funktion (Neuzeichnen) auch sehr viel Spaß. Wir können das Video in natürlicher Sprache bearbeiten, die Elemente im Video ändern und eine „sekundäre Erstellung“ durchführen.

Sie können Ihre eigenen Videos verwenden oder Videos von anderen in Soras Community ausleihen.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - zhi1

▲ Bild von: Sora-Community @bpyser1

Wir können zum Beispiel die tanzenden Papierfiguren durch eine Boyband ersetzen und gleichzeitig die Szene in einen Übungsraum verwandeln.

Die Bewegungen und Kostüme der Papierfiguren sind im Großen und Ganzen erhalten geblieben, die Gliedmaßen der Figuren sind jedoch noch nicht im Detail zu erkennen.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s12

▲Sora generiert

Für mehr Spaß können wir nun die Blend-Funktion verwenden, um die beiden Videos zu einem zusammenzuführen, und Sora kümmert sich automatisch um die Übergangseffekte zwischen den Videos.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - tuan1

Ich dachte ursprünglich, ich könnte einen flüssigen MV-Clip produzieren, schließlich sind die beiden Videos so ähnlich, aber die KI hat mich trotzdem überrascht. Der Anfang und das Ende waren normal, aber die Szene in der Mitte war sehr chaotisch bist du da?

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s13

▲Sora generiert

Kurz gesagt: Wenn man nicht auf die Produktionsgeschwindigkeit abzielt, macht Sora sehr viel Spaß, die Produktform ist auch sehr interessant, es bietet einen brandneuen Workflow, es gibt Innovationen und die Funktionen sind relativ vollständig.

Aus heutiger Sicht gibt es jedoch viel Raum für Verbesserungen beim Generierungseffekt, aber die Anzahl der den Benutzern zur Verfügung gestellten Erkundungen reicht nicht aus und 20 US-Dollar können nur an der Oberfläche kratzen. Manchmal sind die Bilder schön, aber wenn die Bewegung nicht gut gehandhabt wird, ist sie nutzlos. „Die Realität existiert nicht mehr“ ist immer noch ein ferner Traum.

Genießen Sie es, wenn die Katze durch die Wand läuft. Es stellt sich heraus, dass Katzen in den Augen der KI wirklich flüssig sind.

Sora getestet! Treten Sie zwischen Keling und Runway an. Wer hat den geringsten KI-Einschlag? - s14

▲Sora generierte, promptes Wort: Eine Nahaufnahme einer schwarzen Katze mit vollem Kinogefühl. Die Katze springt anmutig vor der roten Wand der Verbotenen Stadt. Das Bild wird in Zeitlupe dargestellt Deutlich zu erkennen ist der Hintergrund mit geringer Schärfentiefe und die Katze springt am höchsten Punkt direkt in die Kamera. Mit sanftem, natürlichem Licht bilden traditionelle chinesische architektonische Wanddetails einen verschwommenen Hintergrund

Das Problem von Sora ist tatsächlich ein häufiges Problem bei vielen KI-Videoprodukten. Es gibt keine wirklich zuverlässige Komplettlösung. Die reale Welt simulieren? Eine seidenweiche Bewegung erreichen? Halten Sie die Charaktere konsistent? Ja, es ist möglich, aber es besteht eine Wahrscheinlichkeit, und das Kartenziehen und spätere Phasen sind unerlässlich.

Jetzt betrachten wir den Generierungseffekt, der mit bloßem Auge sichtbar ist, und was KI-Videos insgesamt verändert haben, ist die Art und Weise der Erstellung. Obwohl die Zukunft vielversprechend ist, aktualisieren Sie bitte zuerst Ihr Modell.

Es ist so scharf wie Herbstfrost und kann böse Katastrophen abwehren. Arbeits-E-Mail: [email protected]

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo