Wie wurde eine menschliche Verkleidung als Sora zu einem Verkehrspasswort?

Februar 24, 2024 Eskere Guru

Will Smith hat wieder einmal ein Meme beigesteuert, letztes Mal war es Oscars Ohrfeige, dieses Mal war es Spaghetti Mukbang.

Im März 2023 erstellte ein Reddit-Internetnutzer mithilfe von KI ein lustiges Video, in dem Will Smith Nudeln isst. Sein Gesicht war abscheulich und seine Gesichtszüge waren deformiert, was den Menschen den Appetit verlor.

Im Februar 2024, zwei Tage nach der Veröffentlichung von Sora durch OpenAI, veröffentlichte Will Smith auf Instagram ein Vergleichsvideo zum Essen von Nudeln. Er wurde schöner und seine Essbewegungen wurden anständiger.

Glaubst du, dass die zweite Hälfte des Videos von Sora erstellt wurde? Nein, die Nudeln wurden von Will Smith selbst gegessen und er hat die ganze Arbeit erledigt.

Der Vorderfuß war schockiert über Soras offizielle Demonstration, und der Hinterfuß sah diese Dynamik, und die Leute gerieten in Zweifel, wer ich bin, woher ich komme und wohin ich gehe.

Obwohl Sora noch nicht für die Öffentlichkeit zugänglich ist, wird das Internet immer lächerlicher: KI-Videos kommen der Realität immer näher und immer mehr reale Videos sind gefälschte KI.

Ich weiß nicht, ob es Hollywood töten kann. Sora hat zuerst meinen Hirnstamm verbrannt.

Wir haben die Videos von Soras stabiler Leistung mehr oder weniger gesehen. Gleichzeitig hat OpenAI auch die Rollover-Videos großzügig veröffentlicht. Einige davon sind in den sozialen Medien beliebter, insbesondere die folgende Aufforderung: „Archäologen haben eine Handvoll Autos darin gefunden.“ die Wüste. Normaler Plastikstuhl, sorgfältig ausgegraben und entstaubt“-Video.

Der Stuhl scheint ein atmendes, denkendes Wesen aus einer anderen Welt zu sein, das nicht an die Schwerkraft oder menschliche Kraft gebunden ist. Er erscheint und verwandelt sich aus dem Nichts und nimmt sogar heimlich einen Menschen mit. Das kann nicht die Schuld der KI sein, denn das Aufforderungswort sagt ja nicht aus, ob sie sich auf der Erde befinden.

Wenn das Video in den sozialen Medien verbreitet würde, könnte es mit folgenden Tags versehen werden: #streamofbewusstsein, #surrealismus, #kostbares Video der frühen Menschheit, das den wilden Stuhl zähmt …

OpenAI erklärte ernsthaft, warum der Fehler auftrat: Sora konnte den Stuhl nicht als starres Objekt modellieren, also als ein Objekt, das seine Form und sein Volumen unter der Einwirkung äußerer Kräfte nicht verändert, sodass die physikalische Interaktion ungenau war.

Soras Video über das Zerbrechen einer Tasse scheint eine Kunst zu sein, die man nur sehen kann, nachdem man giftige Pilze gegessen hat. Die Tasse bewegt sich tatsächlich automatisch und ohne Wind. Die Flüssigkeit spritzt wie Gelee aus dem Glas, bevor sie zerbricht. Jeder Schritt ist unerwartet.

Darüber hinaus gibt es Sportler, die Laufbänder rückwärts benutzen, Geburtstagskerzen, die nicht ausgeblasen werden können, Wölfe, die aus dem Nichts auftauchen und verschwinden … KI hat versehentlich Dinge getan, die sich weder das menschliche Gehirn noch Spezialeffekte vorstellen können.

Seit der offiziellen Ankündigung von Sora diskutieren KI-Tycoons darüber, ob es die physische Welt verstehen kann. Im technischen Bericht von OpenAI wurde keine klare Position vertreten, sondern nur erwähnt, dass Sora einige Aspekte von Menschen, Tieren und der Umwelt in der realen Welt simulieren kann , aber es kann schwierig sein, die physikalischen Prinzipien komplexer Szenen genau zu simulieren, wie z. B. die Verwechslung von links und rechts und das Hinterlassen von Bissspuren nach dem Biss eines Kekses.

Obwohl die KI noch nicht vollständig entwickelt ist, können Sie genauso gut Ihrer Fantasie freien Lauf lassen. KI-Videos, die noch nicht stabil sind, können als Materialbibliothek für übernatürliche, spannende, Horror- und Fantasy-Themen verwendet werden und bieten neue Inspiration für die Kreation. Je mehr Sie versuchen, Newtons Sarg zu heben, desto künstlerischer wird Ihr Auftritt.

Genau wie „Stühle graben“ und „Tassen zerbrechen“ können sie bereits in MVs, Werbung, Filmen und Spielen verwendet werden. Es sieht immer noch wie eine große Produktion aus. Auch wenn der Effekt seltsam ist, ist er überraschend flüssig. Er übertrifft Station B. „Learned Five Years Animation“-Reihe.

Obwohl der Inhalt so magisch war, zögerten einige Internetnutzer dennoch eine Sekunde: „Wenn der Fehler nicht aufgedeckt würde, würde ich bezweifeln, dass er gefilmt wurde.“ „Ist das ein Zaubertrick?“

Denn selbst Soras Rollover-Video kann „Vorgänger“ wie Pika und Runway in puncto Dauer, Bildqualität und Stabilität immer noch schlagen.

Während andere Tools Videos von maximal 3 bis 4 Sekunden erzeugen und versuchen, eine einzelne Aufnahme so stabil wie möglich zu halten, erhöht Sora die Obergrenze auf 1 Minute, um einen nahtlosen Wechsel mehrerer Aufnahmen zu erreichen und die Konsistenz des Hauptmotivs relativ genau beizubehalten und visueller Stil des Bildes, als ob es damit umzugehen weiß. Linsensprache und Erzählrhythmus erzählen Geschichten.

Auf den ersten Blick sieht es so aus, als würden echte Kameras die Szene verfolgen. Menschen, Objekte und Szenen bewegen sich alle im dreidimensionalen Raum und ein und dieselbe Figur kann mehrere Perspektiven haben.

▲ Sora kann mehrere Perspektiven erreichen.

Manche Leute scherzen, dass dies ein Sprung von „Animationen“ zu „Videos“ sei, die von KI generiert werden.

Das Video von Sora, wie er das Auto umwirft, kann sicherlich dazu gezählt werden. Es ist, als würde man einen Haufen Code durcheinander schreiben, aber es läuft zufällig.

Zhou Hongyi, Vorsitzender von 360, sprach über einen interessanten Punkt auf Weibo: Sora funktioniert wie menschliches Träumen. Wir werden von seltsamen Dingen träumen, aber es basiert auf dem, was wir mit unseren Augen sehen und gesammelter Lebenserfahrung. , es besteht keine Notwendigkeit um ein 3D-Modell zu erstellen und Bild für Bild zu rendern, wie in der Film- und Fernsehindustrie.

Aus einer bestimmten Perspektive ist generative KI in der Tat wie eine Traummaschine, die der Denkweise des Menschen immer näher kommt. Sie verwendet verschiedene schnelle Wörter, um mit Wahrscheinlichkeit vernünftige oder unvernünftige Antworten zu erzeugen. Unabhängig davon, ob sie richtig oder falsch ist, wird sie es auf jeden Fall tun gebe dir eine Antwort.

Tatsächlich wollten Menschen seit den Anfängen von ChatGPT KI nutzen, um Träume in die Realität umzusetzen. Auf Xiaohongshu gibt es viele Beiträge, die Träume visualisieren. Obwohl sie die Wirkung im Geist nicht wirklich wiederherstellen können, bringen sie auch einige Phantome des Spirituellen mit sich Welt in die Realität umsetzen.

In Zukunft könnte Sora Träume oder menschliche Kreativität lebendiger machen. Durch die Eingabe von Text, Bildern oder Videos können Sie mit „einem Klick“ Licht- und Schattenveränderungen hinzufügen, den Bildwinkel anpassen und sogar Soundeffekte hinzufügen …

Ich weiß nicht, ob Hollywoods Elite ihre Jobs verlieren wird. Die Netizens sind bereits begierig darauf, es auszuprobieren. Zusätzlich zu ihrem Instinkt, sich mit Pornografie zu beschäftigen, haben sie auch einen Ort, an dem sie ihrer Fantasie freien Lauf lassen können.

Menschen, die über ihr eigenes Versagen lachen, verwenden die Nachahmung von Sora als Verkehrspasswort

Neben dem Auto-Überschlag-Video sind auch die anderen Videos von Sora auf den ersten Blick verblüffend, können aber der Betrachtung durch ein Vergrößerungsglas nicht standhalten. Die verstümmelten Zeichen auf dem Ladenschild, das fünfte Bein der Katze, die falschen Schritte des Models …

Käfer mögen die letzte Mauer zwischen KI und Realität sein, aber die Menschen selbst wollen sie einreißen.

Obwohl Sora noch nicht für die Öffentlichkeit zugänglich ist, verdienen diejenigen, die Kurse und Chips verkaufen, Geld, und diejenigen, die Spaß daran haben, Streiche zu spielen, haben auch Möglichkeiten gefunden, in unruhigen Gewässern zu fischen, und haben eine neue Methode erfunden, um Verkehr anzulocken.

Als sie das Video in den sozialen Medien veröffentlichten, fügten sie der Kopie „generiert von Sora“ und anständige Aufforderungen hinzu und gaben vor, von KI erstellt worden zu sein, genau wie Will Smith die KI imitiert und sich selbst imitiert.

Es nehmen Kurzvideo-Blogger aus verschiedenen Kreisen teil. Diejenigen, die niedliche Haustiere zur Schau stellen, Spiele spielen, Amway-Idol-Singles sind, für Produkte werben … liefern sie Sora wirklich keine Beschäftigungsinspiration?

Unter ihnen sind Bollywood-Filme zweifellos am schwierigsten zwischen echt und gefälscht zu unterscheiden. Die Handlung und die Spezialeffekte indischer Polizeifilme sind besonders erstaunlich. Sie sind für Menschen zu fortgeschritten und machen die Physik nicht existent. Sogar die KI muss von ihnen lernen . .

Ohne die enthusiastischen Menschen, die Kommentare hinzugefügt und einen vor 11 Jahren hochgeladenen YouTube-Link angehängt hätten, um den unmenschlichen Pioniercharakter indischer Filme zu beweisen, hätte niemand gewagt, dafür zu bürgen.

Sogar der offizielle Account von Netflix India beteiligte sich an dem Spaß. Er fing einen Clip aus dem antibritischen indischen Film „RRR“ ab und gab vor, von Sora generiert worden zu sein. Nach der üblichen Übertreibung indischer Blockbuster könnten die ersten paar Sekunden tatsächlich täuschen die Zuschauer.

Obwohl diese gefälschten KI-Videos von Menschen erstellt wurden und die darin enthaltene KI gewöhnlich erscheint, ist die KI möglicherweise nicht in der Lage, sie nachzuahmen.

Wenn Sie die öffentliche Meinung verwirren und auf sich selbst aufmerksam machen, wird der Schaden immer noch von Menschen verursacht, und es ist eine Kette von Misstrauen entstanden.

Internetnutzer begannen sich Sorgen zu machen, dass sie, wenn KI-generierte und reale Fotos wirklich unklar sind, über „schlüssige Beweise“ verfügen könnten, obwohl sie nichts unternommen haben.

Das ist die Handlung des spannenden britischen Dramas „Truth Capture“: Der Geheimdienst fälscht Überwachungsvideos, um Kriminelle zu überführen.

Sie glauben, dass das Fälschen von Überwachungsvideos lediglich eine „Nachbildung“ illegaler Beweise wie Abhörmaterial in rechtliche Beweise darstellt. Dinge sind passiert und die Kriminellen haben Verbrechen begangen.

Aber niemand weiß, ob Menschen, die Technologie nutzen, die Grenze überschreiten und vom Pfropfen und Pfropfen dazu übergehen, etwas aus dem Nichts zu erschaffen.

Die Identifizierung der Reaktionsmethoden der KI kann auch aus einem anderen Blickwinkel als Trick genutzt werden, um dem Schneckenhaus der goldenen Zikade zu entkommen.

Da KI nicht gut darin ist, Hände zu zeichnen, gab es in der Vergangenheit ein Meme, in dem Kriminelle falsche Finger trugen, um Verbrechen zu begehen. Es sah aus, als hätten sie sechs Finger. Dies könnte dazu führen, dass das Überwachungsvideo als von KI erzeugt und nicht als solcher verwendet werden könnte Beweise vor Gericht.

KI ist nah an der Realität, während der Mensch vorgibt, KI zu sein. KI kann auch dazu eingesetzt werden, vor Gericht vorgelegte Beweise zu fälschen und Beweise für ungültig zu erklären. Es könnte tatsächlich eine magische Welt kommen, in der Magie über Magie siegt. KI kann noch kein aktives Chaos verursachen, und es sind die Menschen selbst, die das Vertrauen brechen können.

KI ist vielleicht noch nicht in der Lage, die Welt zu simulieren, aber sie hat bereits Auswirkungen auf die Art und Weise, wie wir die Welt sehen.

Was das Problem betrifft, dass KI es schwieriger macht, zwischen echt und falsch zu unterscheiden, haben wir, wenn wir über die Gesichtsveränderung durch Deepfakes sprechen, bereits zu viel darüber diskutiert. Wie könnte Sora anders sein?

Kürzlich hat OpenAI einen unerwarteten Schritt unternommen – ein TikTok-Konto eröffnet und Soras Werke hochgeladen.

OpenAI beschriftet nicht nur jedes von der KI generierte Video sorgfältig, um zu verhindern, dass die Realität durcheinander gebracht wird, sondern fügt auch prompte Wörter hinzu.

„Ein realistisches Video zeigt einen Schmetterling, der unter Wasser durch ein wunderschönes Korallenriff schwimmen kann“ „Eine Makroaufnahme eines Blattes zeigt winzige Züge, die sich durch seine Adern bewegen“ „Eine Kamera tief am Boden verfolgt Ameisen im Dschungel genau“… …

Diese Videos werden in den Informationsfluss eines echten Kurzvideos eingemischt und von Hintergrundmusik begleitet. Wenn Sie nicht aufpassen und Ihren Finger zu schnell bewegen, kann es als echt angesehen werden.

Netizens forderten im OpenAI-Kommentarbereich halb im Scherz und halb im Ernst: „Du solltest besser so etwas wie ein Wasserzeichen machen, sonst ist die Menschheit dem Untergang geweiht.“

Sora wurde noch nicht eingeführt. Tatsächlich vermutet jeder, dass Video-Content-Praktiker die ruhigste Gruppe von Menschen sind, weil sie professioneller sind und das Geschäft besser verstehen. Soras Demo hat viele Probleme mit der Konsistenz und Genauigkeit der Inhalte. Wenn dies nicht ausreicht und die genauen Anforderungen von Partei A nicht erfüllt, wird es schwierig sein, die Technologie in den industriellen Prozess einzuführen.

Aber ich bin nicht sehr optimistisch. KI hat bereits nicht nur Wahrheit und Lüge beeinflusst, sondern auch die Art und Weise, wie wir die Welt sehen. Sie ersetzt nicht direkt eine bestimmte Schnittsoftware, ein bestimmtes Drehbuch oder einen bestimmten Regisseur.

Der KI-Praktiker @Kwebbelkop spekuliert, dass OpenAI derzeit nur KI-Kurzvideos auf TikTok veröffentlicht, möglicherweise um relevante Benutzerdaten wie die Anzahl der Aufrufe zu sammeln, das Modell anhand menschlichen Feedbacks zu verfeinern und in Zukunft sogar eine KI-Version von TikTok zu erstellen.

Der Algorithmus für kurze Videos ist bereits sehr gut darin, zu erraten, was Ihnen gefällt. Was passiert, wenn generative KI hinzugefügt wird, um den Videoinhalt individueller zu gestalten?

In Zukunft könnte sich unser Filmerlebnis auch qualitativ verändern. Anstatt sich auf Kinos und Streaming-Medien zu verlassen, können große Sprachmodelle und Videogenerierungsmodelle verwendet werden, um den Inhalt der Geschichte und die Besetzung der Hauptrollen zu bestimmen.

Die Erwartungen von OpenAI an KI-Produkte bestehen jedoch definitiv nicht nur darin, mit Ihnen zu chatten und Videos zu erstellen. Das tiefere Ziel besteht darin, der KI das Erlernen der menschlichen natürlichen Sprache und der physikalischen Gesetze der Welt zu ermöglichen.

Auch wenn es auf den Bereich Video beschränkt ist: Wenn Sora grobe Konzeptfilme machen kann, ist das schon sehr beeindruckend. Die Art und Weise, Videos zu erstellen, der Stil der Inhalte und sogar unsere Vorlieben für Inhalte können sich durch KI ändern.

Abgesehen von der KI hat das Mobiltelefon, das fast jeder besitzt, tatsächlich die Art und Weise beeinflusst, wie Videos gedreht und produziert werden, sodass jeder zum Regisseur seines eigenen Lebens werden kann.

Beauty-Videos, bei denen man sich schminkt, während man in die Kamera spricht, Vlogs, die Ausschnitte aus dem Privatleben zeigen usw. sind die Produkte, die viele Blogger unter diesem Einfluss in ihren Schlafzimmern mit ihren Mobiltelefonen drehen können. Die explosionsartige Verbreitung von Kurzvideos hat uns auch immer mehr daran gewöhnt, auf unseren Mobiltelefonen nach oben und unten zu wischen, was uns weniger geduldig und abgelenkter macht.

Obwohl Videogenerierungstools wie Runway und Pika im Vergleich zu Sora über eingeschränkte Fähigkeiten verfügen, haben einige Leute sie mit Bildgenerierungstools wie Midjourney kombiniert und sie zur Erstellung von Filmtrailern verwendet.

Da die Stabilität schlecht ist, wurde auch der Videostil gewählt. Es handelt sich hauptsächlich um eine schnelle Bearbeitung mit Erzählung, die sich auf Rhythmus und visuelle Wirkung konzentriert, aber es mangelt an Charakterdialogen und komplexeren Szenen.

▲ KI-Science-Fiction-Kurzfilm „Borrowing Time“.

Im Gegensatz dazu kann Sora komplexere Szenen, Charakteraktionen und Interaktionen zwischen Charakteren und der umgebenden Welt unterstützen. Jemand hat Soras Beispielfilm verwendet, ihn dann mit dem KI-Sprachtool ElevenLabs synchronisiert und mit iMovie bearbeitet, um einen flüssigeren „Filmtrailer“ zu erstellen, der „eine Einstellung bis zum Ende“ zu sein scheint.

Die beiden Arten von Videos, die Sora der Außenwelt zeigt, lassen sich grob in zwei Arten einteilen. Die eine ist kreative Fantasie, etwa Astronauten, die auf einem kalten Planeten stehen, zwei Piratenschiffe, die sich im Kaffee duellieren, und Zeichentrickfiguren, die Disco tanzen. Die andere ist ähnlich zur Realität und zum Goldabbau. Kalifornien während der Hitze, Spiegelungen in Zugfenstern, Nigerias Natur im Jahr 2056 …

Die Spiegelung im Zugfenster ist dem, was ein Vlog aufnehmen würde, sehr ähnlich. Auch die Outdoor-Szene in Nigeria, bei der die Kamera vom Open-Air-Markt in die Stadtlandschaft schwenkt, ähnelt stark der Leeraufnahme eines Nachrichtenvideos. Jemand hat bereits geplant, digitale Menschen mit diesem Video zu kombinieren.

Fotografie kann manchmal sogar unnötig erscheinen. Sora kann durch schnelle Worte direkt eine Vogelperspektive auf eine Touristenattraktion erzeugen, was sich nicht wesentlich von den Aufnahmen eines Menschen unterscheidet, der eine Drohne fliegt. Unsere Augen und unser Gehirn wissen, wie Santorini aussieht, und die KI „weiß“ es auch, sodass die Arbeit der KI überlassen werden kann.

Es gab zuvor eine sehr interessante Metapher: Diese Welt ist ein riesiges „Earth Online“, ein von Solar System entwickeltes Massive-Multiplayer-Online-Rollenspiel mit dem besten 3D-Blick-Augen- und VR-System.

Das von OpenAI vorgeschlagene Konzept des „Weltsimulators“ behandelt alles bis zu einem gewissen Grad als Informationseingabe, absorbiert Text, Bilder und Videos und gibt dann Informationen aus, wobei Texte in Gemälde und Bilder in Videos umgewandelt werden, als ob „ „Der Herr der Earth Online“, aber wir verstehen möglicherweise das Prinzip nicht. Wir stellen möglicherweise einfach die Anfrage und erhalten das Ergebnis.

Eine solche Zukunft dürfte in weiter Ferne liegen. Zumindest vorerst wird das Ansehen zu vieler Sora-Videos Langeweile hervorrufen. Frauen, die durch die Straßen Tokios gehen, haben keine Emotionen in ihren Augen und können die menschliche Atmosphäre nicht spüren. Aber wenn wir uns kurze Videos ansehen Manchmal ist das auch so, die Welt braucht subtile Filme und akzeptiert große Redundanzen, so wie es auch auf den Widerstand des Protagonisten von „Matrix“ angelegt ist.

Es naht eine Zukunft, in der KI immer stärker involviert wird. Wenn wir das nächste Mal einen vermuteten Fehler sehen, beurteilen wir ihn möglicherweise nicht direkt als Fälschung. Wir denken möglicherweise darüber nach, ob KI hier einen Zweck hat, genau wie beim Lesenverständnis. Es mag uns vielleicht nicht gefallen, aber wir müssen es akzeptieren.

Zhang Chengchen

Es ist so scharf wie Herbstfrost und kann böse Katastrophen abwehren. Arbeits-E-Mail: [email protected]

E-Mail 8

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo