Ich habe 4 KIs gebeten, dasselbe Bild zu generieren, und hier sind die Ergebnisse

Die KI-basierte Bilderzeugung erfreut sich zunehmender Beliebtheit. Viele KI-Begleiter können mittlerweile eine Texteingabe verarbeiten und ein Bild erzeugen, genau wie Sie es beschrieben haben. Bei der großen Auswahl ist es jedoch oft schwierig, die beste Bilderzeugung zu finden. Deshalb habe ich sie getestet.

Ich habe vier der beliebtesten KI-Begleiter – Gemini, ChatGPT, Grok und Microsoft Copilot – mit exakt denselben Eingabeaufforderungen versehen, um herauszufinden, welcher am besten unterschiedliche Bildtypen erstellt. Mit allen diesen Begleitern können Sie kostenlos Bilder aus Texteingabeaufforderungen generieren. Allerdings können Sie mit nur einer bestimmten Anzahl von Generierungen pro Tag keine unbegrenzte Anzahl von Bildern erstellen.

Ich habe mich entschieden, drei verschiedene Aufforderungen zu geben, um zu sehen, wie die KI-Begleiter mit verschiedenen Bildstilen umgehen. Eine davon war die Aufforderung, ein realistisches Porträt zu erstellen, um zu sehen, wie lebensecht das Bild aussieht und ob die Personen auf diesen Bildern die richtige Anzahl an Gliedmaßen und Fingern haben, was bei KI-generierten Bildern oft ein Problem darstellen kann.

Als Nächstes folgte eine Einladung zu einer Geburtstagsparty, um zu sehen, ob es Probleme mit Text, Formatierung und Dekoration gab. Schließlich wollte ich den KI-Begleitern die Möglichkeit geben, ihre Kreativität auszuleben, indem ich ihnen erlaubte, mit einer relativ vagen Aufforderung ein kreatives Bild zu erstellen.

Beim Generieren der Bilder hatten sowohl Gemini als auch Grok Wasserzeichen in der unteren rechten Ecke der Bilder. Sowohl ChatGPT als auch Microsoft Copilot haben keine Wasserzeichen auf den erstellten Bildern, aber ich habe die Logos in der Ecke hinzugefügt, um die Übersichtlichkeit beim Durchsuchen der Bilder zu gewährleisten.

Ein realistisches Porträt

Zunächst wollte ich die KI-Begleiter vor die Herausforderung stellen, ein realistisches Bild mit echten Menschen zu erstellen. Ein häufiges Problem bei KI-generierten Bildern ist die Darstellung von Menschen mit der falschen Anzahl an Gliedmaßen oder Fingern. Die für dieses Bild verwendete Eingabeaufforderung lautet wie folgt:

Ein realistisches Bild von zwei Personen, die Händchen haltend und in Regenmänteln an einer Bushaltestelle sitzen. Es ist ein leicht regnerischer Tag mit blauem Himmel, aber einigen grauen Wolken. Die Stimmung ist fröhlich, beide unterhalten sich und lächeln. Das Bild sollte 1920 x 1080 Pixel groß sein.

Eine KI zu bitten, ein Bild mit Händen zu erstellen, ist schon schwierig genug, ganz zu schweigen von zwei Händchen haltenden Personen. Es scheint, als ob keines der Bilder beim Betrachten der Hände wirklich korrekt aussieht – sie zeigen alle nur ein seltsames Bündel Finger, die ineinander übergehen, besonders bei genauerem Hinsehen. Abgesehen davon schienen alle erstellten Bilder mit einem etwas grauen Himmel, Regenmänteln und entweder Pfützen oder Regentropfen im Hintergrund zur Aufforderung zu passen.

Ein kleiner Nachteil besteht darin, dass zwar in der Aufforderung stand, dass zwei Personen Händchen halten sollten, am Ende jedoch alle Bilder einen Mann und eine Frau zeigten und nicht zwei Frauen oder zwei Männer.

Obwohl es sich um zwei verschiedene KI-Begleiter handelt, weist diese Bildgenerierung darauf hin, dass ChatGPT und Copilot beide mit GPT-5 laufen, wobei die Bilder hinsichtlich der Positionen der Personen, ihrer Blickrichtung zueinander und sogar des Hintergrunds recht ähnlich aussehen.

Insgesamt hat keiner der Begleiter schlechte Arbeit geleistet, obwohl alle eine seltsame Megahand mit mehreren Fingern erschaffen haben. Mein persönlicher Favorit ist von Gemini, da es detaillierter aussieht und einen ausführlicheren Hintergrund hat.

Eine Einladung zu einer Party

Zweitens wollte ich sehen, ob die KI-Begleiter ein Bild generieren können, das Text, Bilder und Dekoration erfordert, und wie sie mit dem Layout zurechtkommen. Dies ist die Eingabeaufforderung, die wir für dieses Bild verwendet haben:

Eine Einladung zu einer 25. Geburtstagsfeier am 4. August 2026 um 18 Uhr mit Datum und Uhrzeit auf der Einladung. Der Veranstaltungsort ist The Shard in London, der auch auf der Einladung angegeben sein sollte. Der Stil der Einladung sollte glitzernd und rosa sein, mit Partydekorationen auf der Einladung. Der Name des Geburtstagskindes ist Jasmine und sollte auf dem Bild zu sehen sein. Das Bild sollte 1920 x 1080 Pixel groß sein.

Egal, wie oft ich diese Eingabeaufforderung optimierte, Grok lieferte mir einfach keine einfache Einladung, die ich ausdrucken und verschicken konnte. Das war frustrierend. Das endgültige Bild war das Ergebnis der obigen Eingabeaufforderung – während alle anderen KI-Generatoren eine einfache Einladung für mich erstellten.

Während alle Einladungen die angeforderten Informationen enthielten, waren sowohl die von ChatGPT als auch die von Copilot nicht zentriert, sondern wirkten, als wären sie auf einer Seite abgeschnitten. Obwohl ich eine Bildgröße von 1920 x 1080 Pixeln angefordert hatte, fielen beide kleiner aus. Das lässt mich vermuten, dass sie mit 1920 x 1080 Pixeln und zentriertem Text erstellt und dann bei der Ausgabe abgeschnitten wurden.

Insgesamt schneidet Gemini hier mit einer wunderschönen Einladung, bei der der Text vollständig zentriert ist, am besten ab. Alle KI-Begleiter haben jedoch eine vollkommen akzeptable Einladung erstellt.

Eine detaillierte kreative Illustration

Schließlich wollten wir den KI-Begleitern die Möglichkeit geben, ihre Kreativität auszuleben, indem wir um eine skurrile Szene im handgemalten Stil baten. Die verwendete Aufforderung lautet wie folgt:

Ein Gemälde einer Prinzessin in einem Wald, umgeben von Feen, Elfen, Zwergen und einem Pony. Die Stimmung ist skurril und magisch, und das Bild soll wie handgemalt aussehen. Die Bildgröße sollte 1920 x 1080 Pixel betragen.

Obwohl das Bild wie handgemalt aussehen sollte, wirkten sowohl die von Gemini als auch die von Grok eher wie ein Cartoon. Ein weiteres Problem bei Groks Kreation ist, dass die Finger der Hand der Prinzessin in die Haare übergehen. Auch hier gilt: Hände gewinnen, KI verliert.

Meine Vorgaben waren relativ vage, um zu sehen, wie kreativ das Bild sein würde. Auch hier ist Gemini in Sachen Details unschlagbar: Kleine Glitzerelemente und Blumen auf der Seite tragen wirklich zu der skurrilen und magischen Atmosphäre bei, die ich mir gewünscht habe.

ChatGPT und Microsoft Copilot kommen der Aufforderung am nächsten und teilen sich hier den Sieg. Die generierten Bilder sehen tatsächlich handgemalt aus und fangen die magische Atmosphäre ein.