Nachdem ich das Artefakt TikTok verwendet hatte, habe ich PS sofort deinstalliert

August 20, 2022 Eskere Guru

Aus Bildern wird Text, was heute kein Problem mehr ist. Verschiedene OCR-Funktionen erleichtern Ihnen das Extrahieren von Text aus Bildern, und für die KI ist es kein großes Problem, ein Bild zu interpretieren.

Aber ein Bild zu zeichnen, ist für die heutige KI immer noch schwierig, Bilder zu erkennen und Informationen zu extrahieren, ist für die KI die Verarbeitung von Informationen. Aber es gibt eine zusätzliche Ebene in der Zeichnung, nicht nur um die Informationen zu verarbeiten, sondern auch um die Erstellung abzuschließen. Erstere ist eine Multiple-Choice-Frage, während letztere eine Satzkomposition ist.

Gleich nach der guten Beantwortung der Multiple-Choice-Fragen besteht der nächste Schritt darin, die subjektiven Fragen des freien Spiels zu beantworten. Aber niemand dachte, dass TikTok der erste war, der diese Frage in einer eigenen App beantwortete.

Verwenden Sie TikTok, um Facebook, Jack Ma, zu generieren

Verglichen mit Giganten wie Google und OpenAI, die viel in die KI-Branche investiert haben und schon lange in die KI-Branche eingetaucht sind, ist TikTok vielleicht nur ein „Transferstudent“. Aber warum ist es nicht verwunderlich, dass der Wechselstudent den Riesen umgangen und das Problem zuerst gemacht hat? Obwohl die Transferstudenten auch etwas Einfallsreichtum geleistet haben, sind sie zumindest immer noch sehr beeindruckend.

Die von TikTok erstellte Text-to-Picture-Funktion heißt „AI Greenscreen“, die den ursprünglichen monotonen weißen Hintergrund ersetzt, und AI generiert den Hintergrund des Videos für Sie. Die Hintergründe dieser Videos entsprechen möglicherweise nicht den Anforderungen der Ersteller, aber schließlich handelt es sich um einen einzigartigen Greenscreen-Hintergrund, der für Sie angepasst wurde.Wenn Sie Glück haben, passt er möglicherweise besser zum Thema des Videoinhalts.

▲ Klicken Sie auf den Spezialeffekt, um diese Funktion beim Senden eines Videos zu erleben Das Bild stammt von Silicon Stars

Wir haben einige Tests mit dieser neuen Funktion durchgeführt, um zu sehen, wie das von TikTok gezeichnete Bild aussieht. Unter den Wörtern im Zufallstest waren einige Gemälde verblüffend, während andere als „sehr gut darin, Verrücktes darzustellen“ bewertet wurden.

Am besten kommt das Gemälde an, das bei Eingabe von "Facebook" präsentiert wird. Das blaue Symbol von Facebook ist vage zu erkennen. Das einzelne Auge und ein Ohr auf dem Bild erzeugen ein einzigartiges Gefühl des Grauens. In Kombination mit den jüngsten Nachrichten von Facebook muss ich sagen, dass dieses Gemälde das Gefühl des Wortes Facebook sehr gut einfängt.

Es gibt auch Wörter wie Apfel und China, die im Bild genau dargestellt sind. Ersteres kann leicht erkennen, dass es sich um einen Apfel handelt, und Letzteres kann auch Gebäude im chinesischen Stil sehen, und gleichzeitig vermeidet es auch die Nationalflagge und andere sensible Muster im Bereich des Unternehmertums. Nur ist es schwierig, sich ein Bild von Apple zu machen, selbst die Stichworte Apple + Apple CEO Cook zeigen Muster rund um Äpfel und Gerichte.

Es gibt jedoch auch viele unabhängige, zum Beispiel haben wir Alibaba, Tencent und ByteDance ausprobiert, und man kann nicht sagen, dass die generierten nichts mit diesen Marken zu tun haben. Aber auf den ersten Blick ist es auf jeden Fall schwer zu erkennen, etwas abstrakt.

Es gibt auch viele interessante Bilder, die durch Eingabe der Namen der Charaktere gezeichnet werden. Der Name des berühmten ausländischen handgefertigten Bloggers Li Ziqi ist ein angenehmes Landschaftsgemälde; das Gemälde des berühmten ehemaligen Premier League-Trainers Arsene Wenger ist ebenfalls auf einen Blick erkennbar, das zum Stil der Rekonstruktion klassischer Fotos gehört; Jack Mas Stil ist auch ein bisschen komisch, und die Augen, die mit Facebook übereinstimmen, haben das Gefühl, zu gucken.

Was Musk betrifft, so haben wir vier Bilder mit TikTok generiert und keines davon war erkennbar.

Natürlich gibt es neben dem Erfolg von Charakterwörtern und abstrakten Bildern auch Switch und Guangzhou, die als genau richtig gelten und an die man sich erinnern kann.

Ein Gemälde im Zelda-Stil mit Charakteren, die die Fans erkennen lassen, dass „das Mario sein könnte“. Auch die ikonischen Gebäude und leuchtenden Farben von Guangzhou sind leicht zu erkennen.

Die Zeit zum Generieren jedes Hintergrundbilds beträgt weniger als 5 Sekunden.Wenn das Thema ähnlich ist, eignen sich diese Bilder sehr gut für das Hintergrundbild des Videos. Die Generierungszeit ist kurz und jeder kann sie nutzen, das ist der Vorteil von TikTok, sodass das Erscheinen eines solchen Text-to-Image-Produkts auf einer Anwendung mit Hunderten Millionen täglicher Aktivitäten als wegweisendes Ereignis angesehen werden kann.

Es ist nur so, dass TikTok immer noch Abkürzungen nimmt.

Heutzutage gehören fast alle hergestellten Bilder dem Stil der Malerei an, viele sogar dem Abstraktionismus und Impressionismus.Im Vergleich zur Erzeugung realistischer Bilder ist diese Schwierigkeit viel geringer. Auch wenn Sie nicht wie Sie aussehen, können Sie sich darauf verlassen, dass Ihr Gehirn dies ausgleicht. Die KI, die die von Ihnen eingegebenen Wörter versteht, ist das gleiche Problem, mit dem Sie konfrontiert sind, wenn Sie in ein Kunstmuseum gehen, um es sich anzusehen eine Kunstausstellung – wenn die Ähnlichkeit nicht reicht, dann verstehen und nachholen.

Dies stellt auch eine kostensparende Methode dar. Der Schwierigkeitsgrad ist geringer, die benötigte Rechenleistung ist ebenfalls geringer und die Kosten sind geringer.

▲ Sogar Bilder mit etwas blutigem Text werden nicht zu gruselig sein

Text-to-Image, selbst Google hat kein in Echtzeit generiertes Produkt

Aus Sicht der Wirkung kann der KI-Greenscreen-Rendering-Effekt von TikTok nicht sehr hoch bewertet werden. Aber als Technologie mit hoher Schwelle kann es als Verbesserung angesehen werden, wenn sie von Benutzern ohne jede Schwelle in wenigen Sekunden verwendet werden kann.

Obwohl durch die Tatsache eingeschränkt, dass die generierten Bilder nicht „alltäglich“ genug und nicht realistisch genug sind, um Bedenken hinsichtlich Technologiemissbrauch und Bildbetrug hervorzurufen, können realistische Bilder tatsächlich erstellt werden, aber sie sind noch nicht für alle verfügbar, wie KI-Greenscreens. Das ist es.

Google hat auch ein Imagen-KI-Tool veröffentlicht, das einen einfachen Satz in ein echtes Bild verwandeln kann – so echt wie ein Fotoshooting. Aber leider war selbst Google, das stark in KI investiert hat, nicht in der Lage, Produkte herzustellen, die spontan generiert werden. Mit anderen Worten, die Option, eine KI zu bitten, Ihnen ein Bild zu zeichnen, ist in Imagen AI noch nicht verfügbar.

▲ Imagen AI kann auf verschiedene Optionen klicken, um verschiedene Bilder zu erstellen

Derzeit gibt es auf der offiziellen Website nur einige voreingestellte Optionen. Selbst wenn Sie auf jede einzelne klicken, gibt es nur Dutzende von Kombinationen, aber es stehen realistische Stile und Ölmalstile zur Auswahl. Interessierte Leser können immer noch hingehen und selbst ein bisschen spielen.

Google ist der Typ, der berühmt ist und bei jedem Zug Aufmerksamkeit erregt. Und das Forschungslabor für künstliche Intelligenz OpenAI stützt sich auf Werke und hat den originellsten und beliebtesten Text-zu-Bild-Generator für künstliche Intelligenz, Dall-E, auf den Markt gebracht.

▲ Dall-E

Dall-E kann vorhandene Bilder aus Textinhalten realistisch neu bearbeiten, es kann Elemente für Sie hinzufügen und entfernen, wobei das Rendern von Schatten, Reflexionen und Texturen berücksichtigt wird – die PS-Technologie kann Sie töten. Es ist sehr einfach, die vorhandenen Gemälde zu analysieren, zu imitieren und zu ersetzen.Der Inspirationsstil kommt vom Originalwerk, dh der Protagonist wird geändert.

Als Forschungsprojekt befindet sich Dall-E noch in der geschlossenen Betaphase, und eine „begrenzte Anzahl vertrauenswürdiger Benutzer“ auf der Liste hat Foto um Foto in den sozialen Medien gepostet. Jeder Nutzer, der am Test teilnimmt, kann zunächst 50 Gratispunkte erhalten, danach 15 Punkte pro Monat, 1 Punkt kann 4 Bilder mit einem Textinhalt generieren und kann außerdem drei Malstile auswählen.

Derzeit hat Dall-E noch sehr wenige Monetarisierungsmethoden für interne Beta-Benutzer – wenn Sie den Dienst erleben möchten, nachdem die 15 Punkte pro Monat aufgebraucht sind, können Sie 115 Punkte für 15 US-Dollar kaufen. Die gute Nachricht ist, dass die resultierenden Bilder auch kommerzialisiert werden können, und sobald Sie sie über Dall-E erstellt haben, können Sie sie für alles verwenden, von Illustrationen, Umschlägen, T-Shirt-Designs und mehr.

▲ Der Benutzer kann Elemente an der eingestellten Position hinzufügen, die dem Foto hinzugefügten Elemente werden auch automatisch in Bezug auf Schatten usw. ergänzt.

Video-Regisseurin Karen X. Cheng sagte gegenüber Bloomberg:

Ich habe stundenlang mit der Generierung von Bildern herumexperimentiert und mich verirrt … es fühlt sich eher so an, als würde man mit einer lebenden, atmenden Person arbeiten, als mit einem Tool wie Photoshop.

Natürlich ist Dall-E derzeit nicht perfekt. Es ist noch ein bisschen schwierig, ein vollständig realistisches menschliches Gesicht zu erstellen. Es erfordert professionelles medizinisches Wissen, um menschliche Knochen genau darstellen zu können. Es ist nicht sehr gut. Der Forscher Aditya Ramesh sagte, dass DALL-E nur weiß, wie man Text liest und dann Bilder generiert, also versucht es tatsächlich, visuell ähnliche Inhalte zu erstellen.

▲ Fantastische Bilder, die von Dall-E generiert wurden

Diese Technologie ist natürlich sehr vielversprechend: Sie können sich vorstellen, dass sie die Schwelle für Content-Ersteller senkt, Bilder zu finden, und Sie können sich vorstellen, dass Porträtkünstler mit ihrer Hilfe die Effizienz verbessern können. Aber so wie das Aufkommen jeder Technologie missbraucht werden kann, birgt auch die Technologie der KI, die Texten hilft, Bilder zu generieren, ein solches Risiko – die negativen Anwendungsszenarien, die auf Deepfake aufgetaucht sind, werden sich eines nach dem anderen wiederholen.

Glücklicherweise hatte sich der Technologieanbieter dieses Mal bereits im Vorfeld vorbereitet und wollte KI in einen Käfig stecken.

Die abstrakten Bilder von TikTok sind selbst eine Schutzschicht, weil sie nicht realistisch sind. Darüber hinaus sind die präsentierten Gemälde, selbst wenn Sie in TikTok einige anzügliche Inhalte (Gewalt, Nacktheit) eingeben, immer noch nicht wie erwartet, und der abstrakte Stil ist nicht klar und vermeidet die enormen Kosten der Überprüfung.

▲ Einschränkungen auf der offiziellen Website von Dall-E

Dall-E schränkt auch die Generierung von gewalttätigen, erwachsenen, hasserfüllten Inhalten durch KI ein und minimiert die Exposition von Dall-E gegenüber solchen Konzepten im Algorithmus. Gleichzeitig verfügt die Plattform auch über fortschrittliche Technologie, um die Verwendung echter menschlicher Gesichter zur Generierung von Bildern zu verhindern (Prominente sind erleichtert), und automatisierte und menschliche Überwachungssysteme verhindern auch den Missbrauch von Dall-E.

Es ist nur so, dass das Aufkommen aller neuen Technologien nicht nur von der schlechten Seite gesehen werden kann, und die hocheffizienten Aussichten, die es mit sich bringt, sind es wert, sich darauf zu freuen. Ai Faner jedenfalls freut sich auf das Ende des Artikels, der eines Tages gepusht werden soll: „Die Titelkarte des Artikels wird von Dall-E generiert“.

Leng Sizhen

Nicht zu interessant, nicht zu optimistisch.

Briefkasten 4

#Willkommen beim offiziellen WeChat-Konto von Aifaner: Aifaner (WeChat: ifanr), weitere aufregende Inhalte werden Ihnen so bald wie möglich zur Verfügung gestellt.

Liebe Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo