Das fortschrittliche „Project Strawberry“-Modell von OpenAI ist endlich da

chatGPT auf einem Telefon in einer Enzyklopädie
Shantanu Kumar / Pexels

Nach Monaten der Spekulation und Vorfreude hat OpenAI die Produktionsversion seines fortschrittlichen Argumentationsmodells Project Strawberry veröffentlicht, das in „o1“ umbenannt wurde. Hinzu kommt eine „Mini“-Version (genau wie GPT-4o), die schnellere und reaktionsfähigere Interaktionen auf Kosten der Nutzung einer größeren Wissensbasis bietet.

Es scheint, dass o1 eine bunte Mischung an technischen Fortschritten bietet. Es ist das erste in der Reihe der Argumentationsmodelle von OpenAI, die darauf ausgelegt sind, menschenähnliche Schlussfolgerungen zu nutzen, um komplexe Fragen zu Themen – einschließlich Naturwissenschaften, Codierung und Mathematik – schneller zu beantworten, als es Menschen können.

Während der Tests wurde o1 beispielsweise einer Eignungsprüfung für die Internationale Mathematikolympiade unterzogen. Während sein Vorgänger GPT-4o nur 13 % der gestellten Probleme richtig lösen konnte, hat o1 83 % davon richtig gelöst. Bei einem Online-Codeforces-Wettbewerb erreichte o1 das 89. Perzentil. Darüber hinaus kann o1 auf Fragen antworten, die frühere Modelle überforderten (z. B. „Was ist größer, 9.11 oder 9.9?“). Allerdings stellt das Unternehmen klar, dass es sich bei dieser Veröffentlichung lediglich um eine Vorschau auf die volle Leistungsfähigkeit des Neophyte-Modells handelt.

Der neue o1 „wurde mit einem völlig neuen Optimierungsalgorithmus und einem neuen, speziell darauf zugeschnittenen Trainingsdatensatz trainiert“, sagte Jerry Tworek, Forschungsleiter von OpenAI, gegenüber The Verge . Mithilfe einer Kombination aus Verstärkungslernen und Gedankenketten-Argumentation liefert o1 Berichten zufolge genauere Schlussfolgerungen als sein Vorgänger. „Wir haben festgestellt, dass dieses Modell weniger halluziniert“, sagte Tworek, „wir können jedoch nicht sagen, dass wir Halluzinationen gelöst haben.“

Sowohl ChatGPT-Plus- als auch Teams-Abonnenten können ab heute o1 und o1-mini testen. Enterprise- und Edu-Abonnenten sollten bis nächste Woche Zugriff haben.

Das Unternehmen gibt an, dass o1-mini irgendwann auch für Free-Tarif-Benutzer verfügbar sein wird, nannte jedoch keinen Zeitplan. Entwickler werden einen starken Anstieg der API-Preise für o1 im Vergleich zu GPT-4o bemerken. Der Zugang zu o1 kostet 15 US-Dollar pro Million Input-Tokens (im Vergleich zu 5 US-Dollar pro Million für GPT-4o) und 60 US-Dollar pro Million Output-Tokens, viermal mehr als die 5 US-Dollar pro Million Gebühr von 4o. Die eigentliche Frage ist, ob das neue Modell denkt, dass das Wort „Erdbeere“ zwei oder drei R enthält .