Magisch modifizierter „Black Myth Wukong“, um Midjourney zu besiegen. Dieses KI-Zeichenartefakt macht Menschen süchtig.
Wenn KI-Ideogramme um Realismus und Kunstfertigkeit konkurrieren, hat Ideogram einen kniffligen Weg eingeschlagen: Es kann Text auf Bildern präzise generieren und die Schriftarten und Layouts sind wunderschön.
Diese Nachfrage ist keine Nische. Die Erstellung von Postern und Illustrationen mit einem Klick ohne die Notwendigkeit von P-Bildern kann viel Ärger ersparen und ist sehr gut für normale Leute geeignet, die keine Ahnung von Design haben.
Wir haben bereits über Version 1.0 von Ideogram geschrieben . Am 21. August kam Version 2.0. Der Realismus ist besser, die Poster sind besser gestaltet und auch die besondere Textkompetenz ist stärker.
Sie haben vielleicht noch nie davon gehört. Dies ist ein KI-Produkt, das von ehemaligen Google-Mitarbeitern entwickelt wurde. Es weist viele Mängel auf, aber das Longboard kann Midjourney in Kurven „überholen“.
den Weg weisen https://ideogram.ai/
AI möchte wissen, von welchem Wukong du sprichst?
Ideogram verfügt über eine besonders einsteigerfreundliche Funktion: „Magic Tips“.
Sie geben das chinesische Eingabeaufforderungswort direkt ein und es hilft Ihnen, es ins Englische zu übersetzen und gleichzeitig zu optimieren. Als Überseeprodukt kann diese Art von Operation die Herzen der Menschen erobern.
Gleichzeitig konzentriert sich Ideogram auf fünf Stile: gewöhnlich, realistisch, Design, 3D und Animation. Sie sind alle leicht zu verstehen, sodass die Auswahl nicht verwirrend ist.
Lassen Sie mich mit einem einfachen chinesischen Aufforderungswort beginnen: „Sun Wukong hält einen goldenen Knüppel“ im Anime-Stil. Lassen Sie mich von der KI bei der Übersetzung und Optimierung helfen und sehen Sie, wie es frei verwendet werden kann.
Als Shui Linglings „Dragon Ball“-Version von Wukong herauskam, war ich schockiert. Als ich mir die Eingabeaufforderungen ansah, übersetzte die KI Sun Wukong in „Son Goku“, also ist es nicht überraschend.
Darüber hinaus möchte ich Ideogram auch fragen, ob es zu offensichtlich ist, Lizenzgebühren zu zahlen.
Um weitere Missverständnisse durch die KI zu vermeiden, habe ich bei der Eingabe des Aufforderungsworts aufgehört, faul zu sein, und betont, dass „Sun Wukong“ „Sun Wukong“ und nicht „Son Goku“ ist.
Diesmal haben wir einen realistischen Stil gewählt und eine detailliertere Szene dargestellt. Der große Weise trägt eine Rüstung und hält einen goldenen Reifen in der Hand. Er steht in warmem Orange vor der Höhle Ton, am unteren Rand des Bildes steht „Black Myth: Wukong“ (Schwarzer Mythos: Wukong).
Es gibt keine Fehler im Text, die Großbuchstaben haben eine starke Wirkung und es entsteht auch die Atmosphäre der buddhistischen Höhle. Allerdings ist das Temperament des „Großen Weisen“ etwas abweichend, das Bild ist etwas atavistisch und In seinen Augen ist kein Licht.
Verwenden Sie einmal die gleichen Aufforderungswörter, um Midjourney zu generieren. Der Text ist sowohl falsch als auch ohne Sinn für Design, aber das etwas hübschere „Monkey King“ und der Stil des Webspiels machen das wieder wett.
▲Midjourney generiert
Da ich mich nicht damit abfinden wollte, probierte ich es noch einmal mit dem 3D-Stil. Das Eingabeaufforderungswort blieb im Wesentlichen dasselbe, aber der Text unten wurde in „Spielstart am 20. August“ geändert.
Daher ähnelt das von Ideogram generierte Ergebnis sehr dem Werbebild einer bestimmten Q-Version-Blindbox-Serie. Das Bild ist sehr sauber, entspricht aber meiner Meinung nach überhaupt nicht dem 3D-Spielstil Auch Monkey King sieht aus wie Erlang Shen.
Und obwohl die KI sehr gut darin war, englischen Text darzustellen, wusste sie nichts über Chinesisch. Dieser Fehler blieb von 1.0 bis 2.0 bestehen.
Es scheint, dass ausländische Produkte die inländische traditionelle Kultur nicht ausreichend verstehen. Die Leistung von Ideogram in der ersten Runde war etwas enttäuschend, aber auch interessant.
Das Ideogram-Team hat gesagt, dass Version 2.0 genauso gut ist wie Flux und DallE. Kürzlich haben die von Flux‘ echter Version von LoRA generierten TED-Sprachfotos viele Internetnutzer getäuscht, weil es schwierig ist zu unterscheiden, ob sie echt oder gefälscht sind. Dann testen wir, wie sehr die von Ideogram generierten Ergebnisse wie Fotos aussehen.
▲ Flusserzeugung
Nachdem ich den realistischen Stil ausgewählt hatte, gab ich die chinesischen Eingabeaufforderungswörter und TED-Talk-Fotos ein und der Folientitel lautete „Ideogram 2.0 Release“. Es gab drei Schlüsselpunkte: „genauer Text“, „gut im Design“ und „realer“. ". Die Sprecherin stand vor dem Whiteboard, im Hintergrund sind ein paar Leute.
Es ist ersichtlich, dass das semantische Verständnis von Ideogram gut ist und alle notwendigen Elemente vorhanden sind. Das TED-Logo ist fast eine Fälschung, die Ausdrücke des Sprechers und des Publikums sind sehr lebendig und die Haare und die Haut sind relativ natürlich.
Allerdings werden die Details nicht gut genug behandelt, obwohl es kein Problem mit dem Text gibt, der generiert werden muss, aber einige kleine Wörter, die zufällig auftauchen, verderben den Pot, und die Finger und Körper der Charaktere sind nicht ganz richtig, aber das ist so bereits viel besser als die vorherige Version 1.0.
Was das Plakatdesign betrifft, kann man sagen, dass Ideogram die „Komfortzone“ anderer vinzentinischer KI übertrifft.
Wenn der Kassenschlager „Alien“ als Testfrage herangezogen wird: Kann KI dieses unbeschreibliche Gefühl des Schreckens erzeugen?
Ich wählte einen Designstil, beschrieb die Elemente des Bildes mit prägnanten Worten und erwähnte ausdrücklich einen Satz am unteren Rand des Posters: „Minderjährige Zuschauer schauen mit Vorsicht zu.“
Der Gesamteffekt ist auffällig und es wurde erfolgreich eine lange Textfolge generiert. Es gibt nur einen kleinen Fehler, der jedoch nicht realistisch ist und eher wie ein Comic-Stil aussieht, der nicht zum Realfilm passt.
Ich habe mich dann von dem schlechten Sommerfilm „A Dream of Red Mansions“ inspirieren lassen und Ideogram gebeten, ein Poster zu erstellen. Der Hintergrund, die Dekorationen und sogar die Charaktere, die in den Aufforderungswörtern erwähnt wurden, waren alle darin enthalten Die prompten Worte sind wirklich gut.
Natürlich ist der Titel des Films korrekt geschrieben, aber die Schriftart sieht aus, als wäre sie dem Herrn der Ringe entlehnt, sie ist etwas dramatisch und der Gesamtstil erinnert eher an den Mulan-Animationsfilm.
Der „Designstil“ von Ideogram ist eher zweidimensional und einzigartig, was aber umgekehrt auch die Einsatzmöglichkeiten von Postern einschränkt.
Zusammenfassend lässt sich sagen, dass Ideogram ein sehr einzigartiges KI-Grafikprodukt ist, dessen Realismusgrad dem von Flux ähnelt und dessen künstlerischer Sinn sich von dem von Midjourney unterscheidet.
▲Muster „regnerischer Sommer“.
Es verfügt jedoch über ein einzigartiges Maß an Textgenerierung und eignet sich besser für die Erstellung von Postern, Illustrationen, Anzeigen, Emoticons, T-Shirt-Druck usw.
Die Ergebnisse der menschlichen Bewertung zeigen, dass Ideogram 2.0 hinsichtlich der schnellen Wortausrichtung, der Gesamtleistung und der Qualität der Textwiedergabe besser ist als Flux Pro und DALL·E 3.
▲ Aber das ist die eigene Aussage von Ideogram
Sehr gut spielbar und bodenständig, Sie könnten genauso gut mehr KI-„Desserts“ wie dieses haben
Ideogram wurde am 22. August letzten Jahres angekündigt, genau ein Jahr nach der Veröffentlichung von 2.0.
Das Gründungsteam besteht aus insgesamt 7 Personen von Google Brain, der University of California, Berkeley, der Carnegie Mellon University und der University of Toronto, von denen 4 die Autoren des Google Vincent Graph Diffusion Model Imagen-Forschungspapiers sind.
Zusätzlich zur Veröffentlichung von 2.0 hat Ideogram dieses Mal auch eine iOS-App herausgebracht, die direkt in China heruntergeladen werden kann. Die Veröffentlichung der Android-Version ist für einen späteren Zeitpunkt geplant. Von Webseiten bis hin zu mobilen Endgeräten können wir jederzeit und überall Bilder generieren.
▲Mobile Schnittstelle
Ideogram steht derzeit allen Benutzern kostenlos zur Verfügung, aber das Kontingent ist sehr begrenzt. Nachdem ich insgesamt 5 Mal 20 Fotos erstellt habe, hat mich Ideogram daran erinnert, dass 10 Punkte aufgebraucht sind. Bitte kommen Sie morgen wieder. (Natürlich generiert das Midjourney nebenan 25 Fotos kostenlos, was nicht sehr beeindruckend erscheint.)
Wenn Sie selten mit vinzentinischen Diagrammen in Berührung kommen und sich für den Einstieg eine vinzentinische Diagramm-KI wünschen, ist Ideogram eine gute Wahl.
Das Eingeben chinesischer Eingabeaufforderungen und die Verwendung von „magischen Eingabeaufforderungen“ zum Übersetzen und Optimieren ist eine Sache. Darüber hinaus bietet Ideogram auch viele Optionen, mit denen Sie Bilder erstellen können, die Ihren Vorstellungen näher kommen.
Durch die Bereitstellung einer begrenzten Auswahl an Optionen zum „Klicken“ für Benutzer ist die Interaktion einfacher als die Eingabe in ein leeres Eingabefeld. Welche Bildproportionen, welchen Stil und welchen Ton Sie auch immer wünschen, mit Ideogram können Sie wählen.
▲ „Mädchen mit Perlenohrring isst McDonald's“ in verschiedenen Farben
Wenn Sie nicht wissen, wie man Aufforderungswörter schreibt, können Sie sie auch zeichnen und Ideogram uns dabei helfen lassen, das Alltägliche in Magie zu verwandeln.
Es tut mir leid für meine schlechten Zeichenfähigkeiten, aber die KI hat die Bedeutung verstanden, die Linien und Farben optimiert, einen Hintergrund hinzugefügt und der Stil hat sich plötzlich verbessert. Wer ist mit KI nicht der Zauberstift Ma Liang?
Darüber hinaus befinden sich unter dem Eingabefeld der Webversion Werke, die von anderen erstellt wurden. Wenn wir auf diejenigen stoßen, die uns gefallen, können wir die Eingabeaufforderungswörter anzeigen und darauf verweisen. Laut Ideogram haben seine Nutzer im vergangenen Jahr mehr als eine Milliarde öffentlich sichtbare Bilder generiert.
Wenn Sie ein bestimmtes Objekt generieren möchten, aber nicht wissen, wie man das Eingabeaufforderungswort schreibt, hat Ideogram auch die Funktion zum Durchsuchen der öffentlichen Erstellungsbibliothek mit Text eingeführt, für diese Funktion ist jedoch derzeit eine Mitgliedschaft erforderlich.
▲ Suchergebnisse für „Katze“
Alles in allem ist Ideogram ein spielbares Vincent-Produkt.
Es kann den vom Benutzer benötigten Textinhalt genauer generieren und sich an verschiedene Bildstile anpassen. Es verfügt über ein breites Einsatzspektrum.
▲ Ideogramm-Blog
Gelegentlich kann es durch Bilder einen emotionalen Wert vermitteln und Ehrgeiz ausdrücken, obwohl die erzeugten Emoticons zu stark auf die Ästhetik des europäischen und amerikanischen Internets ausgerichtet sind.
▲Emoticon-Paket „Ich möchte „Black Myth: Wukong“ spielen“.
Die Gesamtqualität von Ideogram ist nicht schlecht, die Textfunktion ist leistungsstark, für Anfänger geeignet, einfach zu bedienen und die Interaktionen sind angenehm. Wenn KI-Tools Kreativität, Komfort und Mehrwert vereinen, ist es für Menschen leicht, süchtig zu werden.
Eine aus Formen geformte Welt ist zu langweilig. Es ist auch sehr interessant, einen kleinen Bedarf zu erkennen und dann die Lösung zur ersten in der Branche zu machen.
Es gibt viele Produkte auf der Welt und mit mehr Zielgruppen können wir mehr solcher KI-„Desserts“ erwarten.
# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.
Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo