Das Midjourney v5-Sprachmodell-Update fügt den menschlichen Händen Realismus hinzu

Midjourney v5 ist das neueste Sprachmodell des beliebten Text-zu-Bild-Generators, der für seine realistischen Kreationen bekannt ist.

Das Update wurde am Mittwoch für den bezahlten Kundenstamm von Midjourney eingeführt , und viele Benutzer, darunter die Grafikdesignerin Julie Wieland, haben ihre neuen KI-generierten Kunstwerke geteilt. KI-Details, die das v5-Sprachmodell mit sich bringt, umfassen verbesserte „Effizienz, Kohärenz und Qualität“, sagte Midjourney auf seiner Website .

Nur eine Warnung – die KI von Midjourney kann jetzt Hände richtig machen. Seien Sie besonders kritisch gegenüber politischen Bildern (insbesondere Fotografie), die Sie online sehen und die versuchen, eine Reaktion hervorzurufen. pic.twitter.com/ebEagrQAQq

– Del Walker (@TheCartelDel) 16. März 2023

Viele Benutzer haben besonders die Verbesserungen in den Details der menschlichen Hand bemerkt, wobei Probanden eher fünf Finger pro Hand haben. In früheren Modellen wurden menschliche Hände oft mit einer falschen Anzahl von Ziffern generiert, irgendwo zwischen vier und zwischen sieben und zehn. Diejenigen, die Midjourney v5 testen konnten, waren von den visuellen Upgrades beeindruckt.

„Das neueste Midjourney v5-Modell ist sowohl extrem überwältigend/beängstigend als auch mehr als faszinierend“, sagte Wieland gegenüber PetaPixel .

„Seine Fähigkeit, komplizierte Details und Texturen wie realistische Hauttexturen/Gesichtszüge und Beleuchtung nachzubilden, ist beispiellos“, fügte sie hinzu.

Während Midjourney ein etwas einzigartiges Sprachmodell ist, funktioniert es auf ähnliche Weise wie andere Text-zu-Bild-Generatoren wie Stable Diffusion und DALL-E , indem es formulierte Eingabeaufforderungsdeskriptoren verwendet, um Bilder zu erstellen, gemäß dem Modell, das mit Menschen trainiert wird -gemachte Kunst als Referenz, so ArsTechnica .

Es gab eine anhaltende Debatte darüber, ob KI-generierte Kunst legal oder ethisch ist; Viele Benutzer von Midjourney v5 sind jedoch der Meinung, dass es bei fortgesetzten Upgrades möglicherweise nicht mehr von echter Kunst und Fotografie zu unterscheiden ist. Wieland ist der Ansicht, dass KI-Bildgeneratoren wie Midjourney eher Begleiter als Ersatz für Fotografen sein dürften.

Midjourney v5 ist da! (diesmal wirklich, lol)

Hier sind einige meiner Eingabeaufforderungen nebeneinander, v4 vs. v5, sowie einige neue Eingabeaufforderungen und Massenaufnahmen. Ich werde mehr hinzufügen, während ich experimentiere.

pic.twitter.com/qSEZWQBXou

– Nick St. Pierre (@nickfloats) 15. März 2023

Midjourney v5 ist jedoch nicht ohne Fehler. Der KI-Bildschöpfer Nick St. Pierre hat viele seiner Arbeiten geteilt, für die er die gleichen Eingabeaufforderungen in den vorherigen Midjourney v4 und Midjourney v5 verwendet hat. Ein Bild war eine faszinierende Aufnahme junger Frauen im Streetstyle der 1960er Jahre, die an ein Mode-Shooting im Freien erinnert. Bei näherer Betrachtung erkennt man im Hintergrund die schwebenden Hände, die nicht an Körpern befestigt sind, und missgestaltete Gesichter.

Mit seinem neuesten v5-Modell empfahl Midjourney-Gründer David Holz auf dem Discord der Marke, dass Benutzer kurze Eingabeaufforderungen zugunsten von „längeren, expliziteren Texten“ scheuen sollten, um bessere Ergebnisse zu erzielen.