GPT-5-Start: Sechsmal habe ich „Wow“ gesagt, aber dreimal „Hmmmm“
Das OpenAI-Team unter der Leitung von Sam Altman hat GPT-5 endlich vorgestellt. Rund 600.000 Menschen verfolgten den Livestream entweder live oder in den ersten drei Stunden danach ( und Sie können das auch tun, falls Sie ihn verpasst haben). Zwar liegt das bei bestimmten Weltraumaufnahmen und WM-Events etwas zurück, doch das Publikum zeigt großes Interesse an der neuesten Version von ChatGPT. YouTube ist mit Zuschauerdaten nicht ganz so auskunftsfreudig, aber nur bei zwei oder drei Apple-Events sahen deutlich mehr Menschen den Livestream.
Ich habe GPT-5 vor dem Start getestet und es wurde so ziemlich alles angekündigt, was wir erwartet hatten. Im Folgenden werde ich darüber sprechen, was mich überrascht/beeindruckt hat und was mich zum Grübeln gebracht hat.
Wow #1. Sie haben in 2 1/2 Jahren einen langen Weg zurückgelegt
Viele Autoren, mich eingeschlossen, haben sich über Halluzinationen, Fehler und andere Patzer beschwert. Alles wahr. Aber wir müssen auch tief durchatmen und die enormen Fortschritte anerkennen, die OpenAI seit der ersten öffentlichen Version von ChatGPT gemacht hat. Diese Version war eher ein Spielzeug als ein Werkzeug. Die aktuell verfügbaren Versionen – 4.0, 4.1 und 4.5 – sind sehr leistungsfähig und nützlicher. Wenn GPT-5 auch nur die Hälfte der heutigen Versprechen einhält, wird das einen gewaltigen Sprung nach vorne darstellen. Wow 1.5 erschien, als Sam Altman sagte, dass sie jetzt 700 Millionen Nutzer haben. Ich bewundere ihren Ehrgeiz und erinnere mich an ein Zitat von Leo Burnett (dem Mount Rushmore der Werbung): „ Wenn du nach den Sternen greifst, bekommst du vielleicht nicht ganz einen, aber du wirst auch nicht mit einer Handvoll Schlamm wiederkommen.“ OpenAI greift eindeutig nach den Sternen
Wow #2: Sie schließen alte Modelle und stellen alle auf GPT-5 um
Wenn Sie sich vor dem Start das Menü oben auf der ChatGPT-Seite angesehen haben, wurden Ihnen mehrere Optionen für verschiedene Modelle angezeigt. Es gab ein oder zwei Wörter darüber, wofür jedes Modell gut sein sollte. Das war immer verwirrend, zumindest für mich. Jetzt stellen sie alle auf GPT-5 um und schließen die älteren Modelle ab. Dieses Diagramm fasst die Unterschiede zwischen GPT-4 und GPT-5 zusammen. Altman sagte, wenn GPT-3 ein Highschool-Schüler und GPT-4 ein College-Student war, würde GPT-5 auf Doktorandenniveau arbeiten. Diese Version wird bald allen kommerziellen Nutzern zur Verfügung stehen (Unternehmen und Bildungseinrichtungen später). Für kostenlose Nutzer wird die Nutzung begrenzt und sie werden auf ein weniger leistungsfähiges Modell umgestellt, wenn sie die Begrenzung überschreiten.
| Besonderheit | GPT-4 | GPT-5 (erwartet) |
|---|---|---|
| Argumentationsfähigkeit | Starke, gelegentliche Logiklücken | Argumentation fast auf Doktorandenniveau |
| Multimodalität | Text, Bilder, Sprache | Text, Bilder, Sprache, Video |
| Kontextspeicher | Bis zu ~128.000 Token | Bis zu ~1 Million Token |
| Agentenautonomie | Begrenzt, erfordert häufige Eingaben | Mehr unabhängige, mehrstufige Aufgaben |
| Geschwindigkeitsoptionen | Ein Hauptmodell | Flaggschiff-, Mini- und Nano-Versionen |
| Medienunterstützung | Keine Videounterstützung | Vollständiges Videoverständnis und -generierung |
Wow #3: Weniger Halluzinationen
OpenAI betonte, dass GPT-5 weniger Zeit im Fantasyland verbringen wird als frühere Versionen. Das ist eine erfreuliche Nachricht, vorausgesetzt, es stimmt. Sie haben die Prozentangaben besser dargestellt, aber ihre Arbeit nicht gezeigt. Mein Bauchgefühl sagt mir, dass es richtungsweisend (und wahrscheinlich deutlich) besser sein wird, aber noch nicht perfekt.
Wow #4: Viel stärkere Sprachintegration
Einige Nutzer haben in früheren Versionen per Sprache auf ChatGPT zugegriffen. Es wurden offensichtlich große Anstrengungen unternommen, die Spracheingabe auf das gleiche Niveau wie die Texteingabe zu heben. Ich bin mir noch nicht sicher, wie stark diese Nutzung ausfallen wird, aber es ist definitiv eine großartige Option. Meine Skepsis beruht teilweise auf meinem übermäßigen Optimismus, wie schnell Alexa den Handel für Amazon revolutionieren würde. Ich habe mir eine Welt vorgestellt, in der Menschen in der Küche Lebensmittel bestellen, während sie kochen, aber das habe ich nicht erlebt. Das Tippen ist für viele Menschen möglicherweise immer noch die bevorzugte Eingabemethode.
Wow #5: Leistungsstärkere Code-Entwicklung
Dies fällt in beide Kategorien. Sie versuchten zu demonstrieren, wie einfach es ist, Webanwendungen mit GPT-5 zu entwickeln. Ein Kollege „entwickelte“ eine App, um seiner Freundin Französisch beizubringen. Es funktionierte zwar einigermaßen, sah aber aus wie ein Schulprojekt. Sie behaupteten, dass Programmierer lieber mit GPT-5 arbeiten, zeigten aber weder ihre Arbeit noch die Quellen. Sie zeigten auch, wie GPT-5 beim Debuggen helfen könnte. Das wäre toll, wenn es tatsächlich klappt.
Wow #6: Große Fortschritte im Kampf gegen schlechte Schauspieler
Erstens: keinen Schaden anrichten. Es scheint, als würde OpenAI seine gesellschaftliche Verantwortung ernst nehmen. Es wurde diskutiert, wie GPT-5 auf problematische Suchanfragen reagieren würde. Es wird mehr Kontext liefern, warum etwas falsch, unethisch oder gefährlich ist. Sie nennen dies „sichere Vervollständigung“. Es lohnt sich, dies im Laufe der Zeit weiter zu verfolgen.
Hmmm #1: Das kam mir eher wie eine Klassenpräsentation vor, nicht wie die Produkteinführung eines großen Unternehmens.
Vielleicht haben uns Apple und andere verwöhnt, aber die eigentliche Präsentation war amateurhaft. Sie haben nervöse Produktleute in dreiminütigen Abschnitten auf die Bühne und wieder herunter gejagt. Viele der „Witze“ wirkten unvorbereitet und ungeschickt. Ich weiß, es geht um das Produkt, nicht um die Verpackung, aber es scheint, als wäre es Zeit für sie, sich zu steigern.
Hmmm #2: Sie brauchen Hilfe, um ihre Begeisterung und Gedanken ins Englische zu übersetzen
Ein sehr interessantes Beispiel zeigte, wie Eltern ihrem Highschool-Kind bei einem wissenschaftlichen Aufsatz über den Bernoulli-Effekt helfen könnten. So weit, so gut. Die Moderatorin fragte dann: „Wäre es nicht toll, eine Animation zu haben, die das zeigt?“ Ja! Und wenn sie es in Laiensprache weiter erklärt hätte, wäre es auch super gewesen. Stattdessen sagte sie: „Erstellen Sie ein SVG mit Canva“ und zeigte eine Menge Python-Code. Es besteht noch die Möglichkeit, die Leistungsfähigkeit von ChatGPT 5.0 für den Durchschnittsnutzer zugänglicher zu machen, aber es muss auf diesem Niveau angegangen werden.
Hmmm #3: Sie behaupten, die Entwicklung der KI um zwei oder drei Jahre vorangetrieben zu haben
Einer der führenden KI-Wissenschaftler ist Daniel Kokotajlo . Vor seinem Ausscheiden war er leitender Ingenieur bei OpenAI. Er ist außerdem Hauptautor von AI 2027 , einer sehr gut dokumentierten und fundierten Studie zum Entwicklungspfad von KI. Laut dieser Studie wird es noch zwei bis drei Jahre dauern, bis KI wirklich einen Großteil der Arbeit von Entwicklern übernimmt. OpenAI hat mehr oder weniger behauptet, dass sie mit GPT-5 auf dem Weg dorthin sind. Ich bin mir nicht sicher, ob ich das glaube. Auch hier gilt: vielleicht richtungsweisend. Den ganzen Weg? Nicht, bis ich mehr sehe.
