ChatGPT-Modelle erklärt: Wie man sie jeweils verwendet, laut OpenAI

Obwohl der gesamte KI-Boom durch nur ein einziges ChatGPT-Modell ausgelöst wurde, hat sich seit 2022 viel verändert. Neue Modelle wurden veröffentlicht, alte Modelle wurden ersetzt, Updates werden eingeführt und wieder zurückgesetzt, wenn sie schiefgehen – in der Welt der LLMs ist ziemlich viel los. Im Moment haben wir sechs OpenAI-LLMs zur Auswahl, und wie sowohl die Benutzer als auch Sam Altman wissen, sind ihre Namen völlig nutzlos.

Die meisten Leute haben wahrscheinlich gerade das neueste Modell verwendet, das ihnen in die Finger kommt, aber es stellt sich heraus, dass jedes der sechs aktuellen Modelle in unterschiedlichen Dingen gut ist – und OpenAI hat sich endlich entschieden, uns zu sagen, welches Modell wir für welche Aufgaben verwenden sollen.

Warum gibt es überhaupt sechs Modelle?

LLMs sind unvorhersehbar – Benutzer wissen nie, welche Art von Antworten sie erhalten, und die Entwickler wissen es auch nicht wirklich. Natürlich wäre es vielleicht praktischer, wenn wir alle verfügbaren Funktionen in einem Modell bündeln würden, aber das ist nicht so einfach, wie es sich anhört.

Während OpenAI seine Modelle optimiert, werden einige Dinge besser und andere schlechter – und manchmal treten unerwartete Nebenwirkungen auf. Es ist nicht abzusehen, wie lange es dauern würde, alles perfekt auszubalancieren. Daher ist es sinnvoller, nur neue Versionen zu veröffentlichen, auch wenn sich die Verbesserungen nur auf einige wenige Bereiche konzentrieren.

Das Ergebnis dieses Ansatzes sind die sechs Hauptmodelle, die wir derzeit haben: GPT-4o , GPT-4.5, OpenAI o4-mini, OpenAI o4-mini-high, OpenAI o3 und OpenAI o1 pro mode. Und ich sage es noch einmal: Diese Namen sind wirklich nutzlos. OpenAI hat uns vielleicht ein Dokument gegeben, in dem erklärt wird, was jeder einzelne jetzt macht, aber das bedeutet nicht, dass Sie sich merken können, welcher Name zu welchen Fähigkeiten passt – denken Sie also darüber nach, diesen kleinen Spickzettel aus dem Dokument aufzubewahren, wenn Sie sich daran erinnern müssen.

GPT-4o

Als Teil der neuesten 4o-Modellfamilie zeichnet sich der GPT-4o „bei alltäglichen Aufgaben aus“. Dazu gehört:

  • Brainstorming
  • Zusammenfassend
  • E-Mails schreiben/überprüfen
  • Kreative Inhalte

Sie können damit das Internet durchsuchen, Bilder generieren , erweiterte Sprachfunktionen nutzen, Daten analysieren und benutzerdefinierte GPTs erstellen. Sie können auch verschiedene Dateitypen hochladen, um Ihre Eingabeaufforderungen zu unterstützen.

Nach eigenen Untersuchungen von OpenAI hat 4o jedoch ein gewisses Halluzinationsproblem. Es ist nicht das Schlimmste von allen, aber es halluzinierte während des Tests etwa doppelt so stark wie o1.

Dies kann problematisch sein, wenn Sie damit im Internet suchen oder neue Dinge lernen. Der schwierigste Aspekt von Halluzinationen ist, dass sie oft völlig plausibel klingen, was es schwieriger macht, einfach „zu überprüfen, wann etwas komisch klingt“. Stattdessen können Sie nur sicher sein, dass Sie so ziemlich alles überprüfen, von dem Sie nicht bereits wissen, dass es wahr ist.

GPT-4.5

Laut OpenAI liegt die Stärke von GPT-4.5 in der emotionalen Intelligenz. Das bedeutet, dass es Ihnen bei der Kommunikation mit anderen Menschen gut helfen sollte. Zu den offiziellen Empfehlungen gehören:

  • Social-Media-Beiträge
  • Produktbeschreibungen
  • Entschuldigungsschreiben des Kunden

Mit weiteren Stärken wie klarer Kommunikation und Kreativität ist GPT-4.5 besser dafür gerüstet, Ihnen dabei zu helfen, den perfekten Ton oder die perfekte Formulierung für bestimmte Situationen zu finden – und sicherzustellen, dass alles immer noch menschlich klingt.

OpenAI o4-mini

Als eines der schrecklicher benannten Modelle verzichtet o4-mini auf das „GPT“-Element des Namensschemas und tauscht umständlich das 4o gegen o4 aus. Es handelt sich um ein kleineres Modell, was bedeutet, dass es nicht bis zum Rand mit so vielen zufälligen Internetinformationen gefüllt ist wie ein Modell in voller Größe.

Der Vorteil davon ist, dass die Ausführung schnell und kostengünstiger ist, und der Nachteil ist, dass das Modell über weniger „Weltwissen“ verfügt und als Ausgleich zu Halluzinationen neigt.

Anstatt ihm Fragen über die Welt zu stellen, empfiehlt OpenAI die Verwendung von o4-mini für schnelle technische Aufgaben. Beispiele hierfür sind:

  • Extrahieren von Schlüsseldaten aus einer CSV-Datei
  • Schnelle Zusammenfassungen von Artikeln erstellen
  • Überprüfen oder Beheben von Fehlern in kleinen Codeblöcken

OpenAI o4-mini-high

Dies ist ein weiterer schrecklicher Name, wenn man ihn isoliert betrachtet, aber ziemlich leicht zu verstehen, wenn man bereits weiß, was OpenAI o4-mini ist. Es ist immer noch ein kleines Modell, aber es ist eine Weiterentwicklung des normalen o4-mini, weil es „länger denkt, um eine höhere Genauigkeit zu erzielen“.

Dadurch eignet es sich besser für detailliertere Codierungsaufgaben, Mathematik und wissenschaftliche Erklärungen. Hier sind Beispiele von OpenAI:

  • Komplexe mathematische Gleichungen mit Erklärungen lösen
  • Entwerfen von SQL-Abfragen zur Datenextraktion
  • Wissenschaftliche Konzepte in einfachen Worten erklären

OpenAI o3

Technisch gesehen handelt es sich um ein älteres Modell (weil es keine „4“ hat), aber da die o4/4o-Familie nicht in allen Bereichen Verbesserungen vorgenommen hat, ist es immer noch sehr relevant. o3 eignet sich besonders gut für komplexe, mehrstufige Aufgaben – Projekte, die in mehreren Phasen mit mehreren Eingabeaufforderungen durchgeführt werden müssen.

Dazu gehören strategische Planung, detaillierte Analysen, umfassende Codierung, fortgeschrittene Mathematik, Naturwissenschaften und visuelles Denken. Wenn Sie eine Aufgabe beginnen möchten, von der Sie wissen, dass sie eine Sitzung mit mehreren Eingabeaufforderungen erfordert, hilft die Verwendung von o3 dabei, die Wahrscheinlichkeit zu minimieren, dass das Modell den Überblick über den Kontext verliert oder mittendrin halluziniert.

OpenAI schlägt Anwendungsfälle vor wie:

  • Entwicklung einer Risikoanalyse
  • Ausarbeitung einer datenbasierten Geschäftsstrategie
  • Ausführen mehrstufiger Datenanalyseaufgaben

OpenAI o1 Pro-Modus

OpenAI o1 gilt mittlerweile als „Legacy-Modell“, obwohl es noch nicht einmal ein Jahr alt ist. Die „Pro-Modus“-Version ist auf komplexe Überlegungen abgestimmt – was bedeutet, dass das Nachdenken mehr Zeit in Anspruch nimmt, dafür aber besser durchdachte Antworten liefert.

o1 erhält auch die besten Ergebnisse bei der PersonQA-Bewertung von OpenAI, die die Halluzinationsrate misst. Im Test halluzinierte o1 etwa halb so stark wie o3 und dreimal weniger als kleinere Modelle wie 04-mini. Wenn Sie ein großer ChatGPT-Benutzer sind und Ihre Sitzungen in der Regel lange dauern, können Sie durch die Minimierung der Halluzinationsrate auf lange Sicht eine beträchtliche Zeitersparnis erzielen.

Hier sind Beispiele von OpenAI:

  • Erstellung detaillierter Risikoanalysen
  • Erstellen einer mehrseitigen Forschungszusammenfassung
  • Erstellen eines Algorithmus für Finanzprognosen

So verwenden Sie verschiedene ChatGPT-Modelle

Leider können Sie auf GPT-4o und GPT-4o mini nur im kostenlosen Kontingent von OpenAI zugreifen. Wenn Sie ein Plus-, Pro-, Team- oder Enterprise-Benutzer sind, können Sie mithilfe der Modellauswahl auswählen, welches Modell Sie verwenden möchten.

ChatGPT ist auch in verschiedene andere kostenlose und kostenpflichtige Produkte von Drittanbietern integriert. Daher lohnt es sich zu prüfen, welche Modelle die verschiedenen Produkte verwenden. Mit meiner kostenpflichtigen Suchmaschine Kagi habe ich beispielsweise Zugriff auf mehrere OpenAI-Modelle. Es gibt auch viele andere KI-Aggregatdienste, mit denen Sie zu einem günstigeren Preis auf mehrere Modelle von OpenAI und anderen Unternehmen zugreifen können, als wenn Sie jedes Unternehmen einzeln abonnieren würden.

Obwohl diese Informationen über die verschiedenen Modelle nützlich sind, betreffen sie nicht jeden. Wenn Sie ChatGPT hauptsächlich zum Generieren von Bildern, zum Durchsuchen des Webs und zum Senden allgemeiner Anfragen verwenden, ist das Standard-GPT-4o völlig in Ordnung. Nur wenn Sie sich für Programmierung, Mathematik, Naturwissenschaften oder besonders große Projekte interessieren, sollten Sie darüber nachdenken, welches Modell für den Job am besten geeignet ist.