Start von ChatGPT 5.0: Sechsmal habe ich „Wow“ gesagt und dreimal „Hmmmm“

Das OpenAI-Team unter der Leitung von Sam Altman stellte ChatGPT 5.0 heute Morgen per Livestream auf YouTube vor. Rund 600.000 Menschen verfolgten den Start entweder live oder in den ersten drei Stunden danach. Zwar liegt das etwas hinter bestimmten Weltraumaufnahmen und WM-Events zurück, doch das Publikum zeigt großes Interesse an der neuesten Version von ChatGPT. YouTube ist mit Zuschauerdaten nicht ganz so auskunftsfreudig, aber nur bei zwei oder drei Apple-Events sahen deutlich mehr Menschen den Livestream.

Ich habe gestern diesen Artikel mit einer Vorschau auf ChatGPT 5.0 geschrieben und so ziemlich alles angekündigt, was wir erwartet hatten. Hier ist ein Link zu diesem Artikel . Im Folgenden werde ich darüber sprechen, was mich überrascht/beeindruckt und was mich zum Grübeln gebracht hat.

Wow #1. Sie haben in 2 1/2 Jahren einen langen Weg zurückgelegt

Viele Autoren, mich eingeschlossen, haben sich über Halluzinationen, Fehler und andere Patzer beschwert. Alles wahr. Aber wir müssen auch tief durchatmen und die enormen Fortschritte anerkennen, die OpenAI seit der ersten öffentlichen Version von ChatGPT gemacht hat. Diese Version war eher ein Spielzeug als ein Werkzeug. Die aktuell verfügbaren Versionen – 4.0, 4.1 und 4.5 – sind sehr leistungsfähig und nützlicher. Wenn ChatGPT 5.0 auch nur die Hälfte der heutigen Versprechen einhält, wird das einen gewaltigen Sprung nach vorne darstellen. Wow 1.5 erschien, als Sam Altman sagte, sie hätten jetzt 700 Millionen Nutzer. Ich bewundere ihren Ehrgeiz und erinnere mich an ein Zitat von Leo Burnett, dem Mount Rushmore der Werbung: „ Wenn du nach den Sternen greifst, wirst du vielleicht nicht ganz einen finden, aber du wirst auch nicht mit einer Handvoll Schlamm wiederkommen.“ OpenAI greift eindeutig nach den Sternen

Wow #2: Sie stellen alte Modelle ab und stellen alle auf Version 5.0 um

Wenn Sie sich das Menü oben auf der ChatGPT-Seite ansehen, werden Ihnen mehrere Optionen für verschiedene Modelle angezeigt. Es wird kurz erklärt, wofür jedes Modell gut sein soll. Das war immer verwirrend, zumindest für mich. Jetzt stellen sie alle auf GPT-5 um und stellen die älteren Modelle ab. Diese Tabelle fasst die Unterschiede zwischen GPT-4 und GPT-5 zusammen. Altman sagte, wenn GPT-3 ein Schüler und GPT-4 ein Student war, würde GPT-5 auf Doktorandenniveau arbeiten. Diese Version wird bald allen kommerziellen Nutzern zur Verfügung stehen (Unternehmen und Bildungseinrichtungen später). Für kostenlose Nutzer wird die Nutzung begrenzt und sie werden auf ein weniger leistungsfähiges Modell umgestellt, wenn sie diese Begrenzung überschreiten.

Besonderheit GPT-4 GPT-5 (erwartet)
Argumentationsfähigkeit Starke, gelegentliche Logiklücken Argumentation fast auf Doktorandenniveau
Multimodalität Text, Bilder, Sprache Text, Bilder, Sprache, Video
Kontextspeicher Bis zu ~128.000 Token Bis zu ~1 Million Token
Agentenautonomie Begrenzt, erfordert häufige Eingaben Mehr unabhängige, mehrstufige Aufgaben
Geschwindigkeitsoptionen Ein Hauptmodell Flaggschiff-, Mini- und Nano-Versionen
Medienunterstützung Keine Videounterstützung Vollständiges Videoverständnis und -generierung

Wow #3: Weniger Halluzinationen

Sie betonten, dass GPT-5 weniger Zeit im Fantasyland verbringen wird als frühere Versionen. Das ist eine erfreuliche Nachricht, vorausgesetzt, es stimmt. Sie haben die Prozentangaben besser dargestellt, aber ihre Arbeit nicht gezeigt. Mein Bauchgefühl sagt mir, dass es richtungsweisend (und wahrscheinlich deutlich) besser sein wird, aber noch nicht perfekt.

Wow #4: Viel stärkere Sprachintegration

Einige Nutzer haben in früheren Versionen per Sprache auf ChatGPT zugegriffen. Es wurden offensichtlich große Anstrengungen unternommen, die Spracheingabe auf das gleiche Niveau wie die Texteingabe zu heben. Ich bin mir noch nicht sicher, wie stark diese Nutzung ausfallen wird, aber es ist definitiv eine großartige Option. Meine Skepsis beruht teilweise auf meinem übermäßigen Optimismus, wie schnell Alexa den Handel für Amazon revolutionieren würde. Ich habe mir eine Welt vorgestellt, in der Menschen in der Küche Lebensmittel bestellen, während sie kochen, aber das habe ich nicht erlebt. Das Tippen ist für viele Menschen möglicherweise immer noch die bevorzugte Eingabemethode.

Wow #5: Leistungsstärkere Code-Entwicklung

Dies fällt in beide Kategorien. Sie versuchten zu demonstrieren, wie einfach es ist, Webanwendungen mit GPT-5 zu entwickeln. Ein Kollege „entwickelte“ eine App, um seiner Freundin Französisch beizubringen. Es funktionierte zwar einigermaßen, sah aber aus wie ein Schulprojekt. Sie behaupteten, dass Programmierer lieber mit GPT-5 arbeiten, zeigten aber weder ihre Arbeit noch die Quellen. Sie zeigten auch, wie GPT-5 beim Debuggen helfen könnte. Das wäre toll, wenn es tatsächlich klappt.

Wow #6: Große Fortschritte im Kampf gegen schlechte Schauspieler

Erstens: keinen Schaden anrichten. Es scheint, als würde OpenAI seine gesellschaftliche Verantwortung ernst nehmen. Es wurde diskutiert, wie GPT-5 auf problematische Suchanfragen reagieren würde. Es wird mehr Kontext liefern, warum etwas falsch, unethisch oder gefährlich ist. Sie nennen dies „sichere Vervollständigung“. Es lohnt sich, dies im Laufe der Zeit weiter zu verfolgen.

Hmmm #1: Das kam mir eher wie eine Klassenpräsentation vor, nicht wie die Produkteinführung eines großen Unternehmens.

Vielleicht haben uns Apple und andere verwöhnt, aber die eigentliche Präsentation war amateurhaft. Sie haben nervöse Produktleute in dreiminütigen Abschnitten auf die Bühne und wieder herunter gejagt. Viele der „Witze“ wirkten unvorbereitet und ungeschickt. Ich weiß, es geht um das Produkt, nicht um die Verpackung, aber es scheint, als wäre es Zeit für sie, sich zu steigern.

Hmmm #2: Sie brauchen Hilfe, um ihre Begeisterung und Gedanken ins Englische zu übersetzen

Ein sehr interessantes Beispiel zeigte, wie Eltern ihrem Highschool-Kind bei einem wissenschaftlichen Aufsatz über den Bernoulli-Effekt helfen können. So weit, so gut. Die Moderatorin fragte dann: „Wäre es nicht toll, eine Animation zu haben, die das zeigt?“ Ja! Und wenn sie in einfachem Englisch weitergemacht hätte, wäre es auch super gewesen. Stattdessen sagte sie: „Erstellen Sie ein SVG mit Canva“ und zeigte eine Menge Python-Code. Es besteht noch die Möglichkeit, die Leistungsfähigkeit von ChatGPT 5.0 dem Durchschnittsnutzer zugänglicher zu machen, aber die Nutzer müssen dafür ihr Englisch verbessern.

Hmmm #3: Sie behaupten, die Entwicklung der KI um zwei oder drei Jahre vorangetrieben zu haben

Einer der führenden KI-Wissenschaftler ist Daniel Kokotajlo . Vor seinem Ausscheiden war er leitender Ingenieur bei OpenAI. Er ist außerdem Hauptautor von „AI 2027“, einer sehr gut dokumentierten und begründeten Studie zum Entwicklungspfad von KI. Laut dieser Studie wird es noch zwei bis drei Jahre dauern, bis KI wirklich einen Großteil der Arbeit von Entwicklern übernimmt. OpenAI behauptet, mit GPT-5 so weit zu sein. Ich bin mir nicht sicher, ob ich das glaube. Auch hier gilt: vielleicht richtungsweisend. Den ganzen Weg? Nicht, bis ich mehr sehe.