Das neueste Modell von OpenAI erzeugt lebensechte Bilder und lesbaren Text. Probieren Sie es kostenlos aus

OpenAI hat sein 4o-Modell in ChatGPT eingeführt, um die native Bildgenerierung innerhalb der Chatbot-Atmosphäre zu ermöglichen. Durch dieses Upgrade müssen Sie das Dall-E-Bilderzeugungsmodell von OpenAI nicht als separate Einheit verwenden, obwohl Dall-E für diese weiterhin als Präferenz verfügbar bleibt. Die KI-Marke hat auch ihren Sora AI-Videogenerator in ChatGPT aktiviert.

Die neuen Funktionen sind derzeit für kostenlose ChatGPT-Benutzer sowie für ChatGPT Plus- , Team- und Pro-Benutzer verfügbar. Die Verfügbarkeit wird nächste Woche für Unternehmens- und Bildungsbenutzer verfügbar sein.

Von OpenAI generiertes Bild – Ein ehrliches Foto im Paparazzi-Stil von Karl Marx, der eilig über den Parkplatz der Mall of America läuft. Von OpenAI generiertes Bild – Realistisches Foto eines Pferdes, das von rechts nach links über eine weite, ruhige Meeresoberfläche galoppiert. Von OpenAI generiertes Bild – fotorealistisches Bild des Bauernmarktes in Toronto an einem Samstag im Sommer 2006.

Zuvor war Dall-E 3 das Plug-in zur Bildgenerierung für zahlende ChatGPT-Abonnenten. In der Zwischenzeit konnten diejenigen, die den Generator kostenlos testen wollten, dies über die Basisversion von Microsoft Copilot tun.

Das Modell wurde als einer der besten verfügbaren Bildgeneratoren gelobt, insbesondere in der kostenpflichtigen Version. Trotz des Vorteils, dass alle ChatGPT- Benutzer die Bildgenerierung nativ mit dem 4o-Modell nutzen können, sollten diejenigen, die die kostenlose ChatGPT-Stufe nutzen, darauf vorbereitet sein, auf einige Einschränkungen zu stoßen, wie z. B. Höchstwerte für Datei-Uploads und Datenanalysen, stellte CNET fest.

Dennoch wird ChatGPT von realistischeren Bildern mit besser lesbarem Text profitieren, nachdem OpenAI laut Wall Street Journal ein Jahr damit verbracht hat, GPT-4o nach dem Start einer Schulungsmaßnahme namens „Reinforcement Learning from Human Feedback“ (RLHF) zu unterziehen.

Nach der Ankündigung von GPT-4o im Mai 2024 ließ OpenAI ein Team von über 100 „menschlichen Trainern“ das Modell auf Tippfehler sowie häufige Fehler in Händen und Gesichtern untersuchen, sagte der leitende Forscher des Projekts, Gabriel Goh, der Veröffentlichung.

Das GPT-4o-Modell bietet ChatGPT auch die Möglichkeit, transparente Hintergründe zu erstellen. Dies sollte ein großer Vorteil für Geschäftsanwender und Kreative sein, da sie damit Logos oder andere Ikonografien erstellen können, sagte Jackie Shannon, Leiterin des multimodalen Produkts von ChatGPT, gegenüber WSJ.

Trotz der Verbesserungen, die OpenAI vorgenommen hat, weist das aktualisierte GPT-4o-Modell insgesamt immer noch seine Mängel auf. Es neigt immer noch zu Halluzinationen, was ein häufiges KI-Merkmal ist, das noch gelöst werden muss. Die Aufrechterhaltung der Bearbeitungskonsistenz bleibt in der ChatGPT-Atmosphäre eine Herausforderung. OpenAI hat jedoch bereits nächste Woche schnelle Updates versprochen .

Ein weiteres aktuelles Thema für OpenAI ist die Frage der Ethik und Legalität. Die Marke besteht darauf, dass ihr Modell auf „öffentlich verfügbaren Daten“ und auf proprietären Daten trainiert wurde, die sie über Partnerschaften mit Marken wie Shutterstock besitzt, so WSJ.

Bilder, die über ChatGPT basierend auf dem 4o-Modell generiert wurden, haben keine KI-Wasserzeichen. Die Marke hat jedoch angegeben, dass Bilder C2PA⁠-Metadaten enthalten werden, die sie als KI-generiert kennzeichnen. Dies bleibt der Industriestandard.