OpenAI stoppt die kostenlose GPT-4o-Bildgenerierung nach dem viralen Trend von Studio Ghibli

Nach nur einem Tag hat OpenAI die kostenlose Version seines In-App-Bildgenerators eingestellt, der auf dem GPT-4o-Argumentationsmodell basiert. Das Update soll den Realismus von Bildern und Texten im KI-generierten Kontext verbessern; Allerdings haben die Benutzer bereits einen außer Kontrolle geratenen Trend ausgelöst, der das KI-Unternehmen dazu veranlasst hat, seine Einführungsstrategie zu überdenken.

Kurz nachdem das Update auf ChatGPT verfügbar war , begannen Benutzer, von ihnen erstellte Bilder im Stil von Studio Ghibli, dem beliebten japanischen Animationsstudio, auf Social-Media-Plattformen zu teilen. Die Kreationen reichten von persönlichen Familienfotos aus Studio Ghibli bis hin zu ikonischen Szenen der Olympischen Spiele 2024 in Paris, Szenen aus Filmen wie „Der Pate“ und „Star Wars“ und Internet-Memes, darunter ein abgelenkter Freund und ein Katastrophenmädchen.

Studio Ghibli-Stil, erstellt vom X-Benutzer @MDurbar auf ChatGPT.
OpenAI

Während der CEO von OpenAI, Sam Altman, sich am Mittwoch ebenfalls an dem Spaß beteiligte, indem er sein Er machte keine Angaben dazu, ob und wann das Feature zurückkehren würde. Derzeit haben kostenpflichtige ChatGPT-Stufen, darunter Plus, Pro und Team, weiterhin Zugriff auf das Update.

The Verge stellte fest, dass das GPT-4o-Argumentationsmodell eine Methode namens „autoregressiver Ansatz“ zur Generierung von Bildern verwendet, die das Bild von links nach rechts und von oben nach unten entwickelt, anstatt alles auf einmal. Dies trägt zu Genauigkeit und Realismus bei der Generierung von Bildern bei. KI-Text auf älteren Modellen ist dafür bekannt, dass er entweder verschwommen oder unverständlich ist, während GPT-4o-Text scharfen und kohärenten Text erzeugen kann. OpenAI teilte dem Wall Street Journal außerdem mit, dass es das Argumentationsmodell einem von Menschen geleiteten Post-Launch-Training unterzogen habe, um häufige Fehler in Text- und Bilddesigns zu finden.

Studio Ghibli-Stil, erstellt vom X-Benutzer @heyBarsee auf ChatGPT.
OpenAI

Ethik und Legalität sind ein seit langem bestehendes Thema, wenn es um KI geht. Während die Marke versuchte, ihre Grundlagen abzudecken, indem sie dem WSJ die Quellen ihrer Daten zu Schulungszwecken offenlegte, war es unmöglich zu wissen, wie die Öffentlichkeit auf das Produkt reagieren wird, sobald es verfügbar ist.

Evan Brown, Anwalt für geistiges Eigentum bei Neal & McDevitt, sagte gegenüber TechCrunch , dass ChatGPT-Benutzer, die das GPT-4o-basierte Produkt nutzen, um Fotos im Studio Ghibli-Stil zu erstellen, technisch gesehen nicht gegen das Gesetz verstoßen, da „Stil nicht ausdrücklich durch das Urheberrecht geschützt ist“. Allerdings liegt es in einer rechtlichen Grauzone.

Ein OpenAI-Sprecher teilte der Veröffentlichung in einer Erklärung außerdem mit, dass ChatGPT den Stil eines Studios nachahmen könne, nicht jedoch den Stil eines einzelnen Künstlers.

Das KI-Unternehmen scheint darauf abzielen zu wollen, seine Grundlagen abzudecken, indem es das GPT-4o-Update aus seinem kostenlosen ChatGPT-Kontingent entfernt, bis es über seinen nächsten Schritt nachdenkt.

Es gab viele KI-Trends, die auf beliebten Designs basieren. Ein älterer Trend von Ende 2023 ermöglichte es Benutzern, Funko Pop! Zahlen in Microsoft Designer mit ein paar Eingabeaufforderungen erstellen. Während die Hauptprämisse dieses Trends darin bestand, Figuren aus sich selbst zu machen, haben viele Leute Funko Pop! Figuren berühmter Persönlichkeiten wie Elon Musk und Beyoncé. Ebenso hat dieser Trend die rechtlichen Beschränkungen ans Licht gebracht, die auftreten können, wenn man versucht, online Spaß mit KI zu haben. Sie mussten bestimmte Problemumgehungen für Spitznamen wie „Elon X“ und „Queen Bey“ mit korrekten Beschreibungen der Charaktere eingeben, um die gewünschten Ergebnisse zu erzielen.