Ich habe das neueste KI-Tool von Google ausprobiert, das Bilder auf unterhaltsame, neue Weise generiert

Das AI-Tool Whisk von Google wird mit Bildern verwendet.
Google

Mit dem neuesten KI-Tool von Google können Sie die Bilderzeugung noch weiter automatisieren. Das Tool heißt Whisk und basiert auf dem neuesten Bildgenerierungsmodell Imagen 3 von Google. Anstatt sich ausschließlich auf Texteingabeaufforderungen zu verlassen, hilft Ihnen Whisk dabei, Ihre gewünschten Bilder zu erstellen, indem Sie andere Bilder als Basiseingabeaufforderung verwenden.

Whisk befindet sich derzeit in einer experimentellen Phase, ist aber nach der Einrichtung recht einfach zu navigieren. Google erläuterte in einem Blogbeitrag, in dem Whisk vorgestellt wurde, dass es für „schnelle visuelle Erkundung und nicht für pixelgenaue Bearbeitungen“ gedacht sei.

Im Vergleich zu anderen textbasierten Tools, bei denen es bei der Erstellung eines Bildes mehr auf die Details und die Genauigkeit der Wörter ankommt, wirkt die Erkundung des Tools rasant.

Nachdem Sie die Willkommensseite durchgesehen haben, auf der die wichtigen Details aufgeführt sind, die Sie über die Funktionsweise des Tools wissen sollten, die Seite, auf der Sie gefragt werden, ob Sie sich für E-Mails anmelden möchten, und die Datenschutzrichtlinie, gelangen Sie direkt auf die Hauptseite von Schneebesen. Ich habe eine Aufforderung mit einem Dinosaurier-Plüschtier als Bildstil gesehen, aber die anderen Optionen sind eine Emaille-Anstecknadel und ein Aufkleber. Ich bin einfach mit dem ersten gegangen.

Google Whisk wird mit hochgeladenen Bildern verwendet.
Google

Als Nächstes werden Sie aufgefordert, ein Bild für das Thema hochzuladen. Ich habe ein Foto einer Smartwatch an meinem Handgelenk hochgeladen und schnell gemerkt, dass das nicht funktionieren würde. Die dritte Option auf der rechten Seite befand sich im Dauerlademodus, also habe ich es noch einmal versucht, mit einem eher cartoonartigen Bild, das ich auf meiner Festplatte gefunden hatte, und dieses sofort in Plüschfiguren von drei Fabelwesen geladen.

Sobald das Bild erstellt war, konnte ich in einen Bearbeitungsbereich mit einem Texteingabebereich wechseln. Indem ich einfach die vorgeschlagene Eingabeaufforderung „Die Figur isst Eis“ verwendete, generierte ich zusätzliche Bilder mit denselben Kreaturen, die Eistüten hielten.

Alternativ können Sie unter der Hauptaufforderungserstellung nach unten scrollen und „Von Grund auf neu starten“ auswählen. Auf diese Weise können Sie alle Ihre eigenen Bilder hochladen oder Ihren eigenen Text eingeben. Sie können auch von Anfang an zusätzlichen Text hinzufügen, damit Ihre Charaktere eine Aktion ausführen können. Wenn Sie nicht wissen, welche Bilder Sie hinzufügen oder welchen Text Sie eingeben sollen, können Sie auf die Schaltfläche „Inspiriere mich“ klicken und Whisk füllt die Bilder aus.

Das KI-Tool Google Whisk wird mit Bildern verwendet.
Google

Das Tool ermöglicht Ihnen auch den Zugriff auf den Bereich „Meine Bibliothek“, in dem Sie alle von Ihnen erstellten Bilder anzeigen können. In diesem Abschnitt können Sie die Bibliothek aktivieren oder deaktivieren, wenn Sie Ihre Kreationen nicht speichern möchten. Sie können Bilder auch einzeln oder Bibliotheksdaten als Ganzes löschen.

Das Whisk-Tool erinnert an die Microsoft Designer-Eingabeaufforderung, mit der Benutzer Funko Pop! erstellen können. Figuren. Insgesamt können Sie mit Microsoft Designer eine Reihe skurriler oder realistischer Bilder erstellen. Allerdings läuft der KI-Generator ausschließlich auf Texteingabeaufforderungen.

Wie bereits erwähnt, bietet Whisk weiterhin die Möglichkeit, Texteingabeaufforderungen hinzuzufügen. Laut Google ist dies enthalten, da das Tool das Potenzial hat, „das Ziel zu verfehlen“, sodass Sie bei Bedarf immer die Möglichkeit haben, Eingabeaufforderungen auszufüllen.