GPT-4.5 ist veröffentlicht! Das größte und teuerste Modell von OpenAI sieht DeepSeek nicht als Rivalen

Februar 28, 2025 Eskere Guru

Freunde, kündigen Sie Ihre ChatGPT-Mitgliedschaft noch nicht überstürzt.

Vor kurzem war die DeepSeek Open Source Week in vollem Gange, und Entwickler auf der ganzen Welt waren damit beschäftigt, Code auszutauschen und mit Inspirationen zusammenzustoßen. Andererseits wählte OpenAI den letzten Tag der Open Source Week, um den „großen Killer“ von GPT-4.5 rauszuwerfen.

Sam Altman teilte seine persönlichen Erfahrungen auf der X-Plattform:

Dies war das erste Mal, dass ich das Gefühl hatte, dass KI ein Gespräch mit einer nachdenklichen Person führt. Es liefert wirklich wertvolle Ratschläge und ich habe mich ein paar Mal sogar in meinem Stuhl zurückgelehnt und war erstaunt darüber, wie gut die KI Antworten finden konnte.

Er erinnerte jedoch auch daran, dass GPT-4.5 kein Inferenzmodell ist und andere Modelle in Benchmark-Tests nicht vernichten wird. Der Grund, warum er nicht zur Pressekonferenz erschien, war, dass er sich im Krankenhaus um seine Kinder kümmerte.

Ab heute haben ChatGPT Pro-Benutzer Zugriff auf GPT-4.5 (Research Preview). Nächste Woche wird es schrittweise für Plus- und Team-Benutzer geöffnet; nächste Woche können auch Enterprise- und Edu-Benutzer diese neue Version erleben.

Die Erfahrung ist sehr einfach. Sie müssen nur zwischen den Modellauswahlmöglichkeiten in der Webversion, der mobilen Version und der Desktop-Version wechseln.

GPT-4.5 unterstützt die Internetsuche, kann das Hochladen von Dateien und Bildern verarbeiten und kann Canvas auch zum Schreiben und Programmieren verwenden. Derzeit unterstützt GPT-4.5 jedoch keine multimodalen Funktionen wie Sprachmodus, Video und Bildschirmfreigabe.

GPT-4.5 wird hauptsächlich durch „unüberwachtes Lernen“ (d. h. Lernen aus einer großen Datenmenge selbst) intelligenter, anstatt sich auf Argumentationsfunktionen wie OpenAI o1 oder DeepSeek R1 zu konzentrieren.

Einfach ausgedrückt: GPT-4.5 weiß mehr, während die o1-Serie besser denken kann.

Nachfolgend sind die Highlights zusammengefasst:

Breiteres Wissen: Es lernt mehr Informationen und versteht daher mehr als zuvor
Weniger Bullshit: weniger „Halluzinationen“ (bei denen die KI Fakten erfindet)
Besseres Verständnis der Herzen der Menschen: höhere „emotionale Intelligenz“ und besseres Verständnis Ihrer wahren Absichten
Gespräche sind natürlicher: Chatten fühlt sich eher wie die Kommunikation mit einer echten Person an und ist weniger roboterhaft
Kreativer: bessere Leistungen beim Schreiben und Gestalten

GPT-4.5 ist offiziell veröffentlicht, ich verstehe Ihr Herz besser

Die intuitivste Änderung von GPT-4.5 besteht darin, dass es Sie besser versteht.

Es ist eher wie ein verständnisvoller Freund, der in der Lage ist, Ihre Implikationen zu verstehen und Ihre subtilen emotionalen Veränderungen zu erfassen.

OpenAI stellte in internen Tests fest, dass die Tester die Antworten von GPT-4.5 gegenüber GPT-4o bevorzugten, da sie der Meinung waren, dass sie natürlicher, wärmer und eher den menschlichen Kommunikationsgewohnheiten entsprächen.

In Vergleichsauswertungen mit menschlichen Testern hat GPT-4.5 eine höhere Gewinnquote (menschlicher Präferenztest) als GPT-4o, einschließlich, aber nicht beschränkt auf kreative Intelligenz (56,8 %), berufliche Probleme (63,2 %) und alltägliche Probleme (57,0 %).

Als bisher größtes und wissensreichstes Modell von OpenAI erweitert GPT-4.5 das auf GPT-4o basierende Vortraining weiter und ist allgemeiner konzipiert als die leistungsstarken Modelle von OpenAI, die sich auf das Denken in MINT-Bereichen konzentrieren.

Der Durchbruch von GPT-4.5 ist maßgeblich auf die Fortschritte des „unüberwachten Lernens“ zurückzuführen.

Einfach ausgedrückt: Unüberwachtes Lernen ermöglicht es der KI, selbstständig aus riesigen Datenmengen zu lernen, anstatt sich auf die manuelle Kennzeichnung von Daten zu verlassen.

Das ist, als würde man einem Kind erlauben, die Welt alleine zu sehen, anstatt sich von Erwachsenen alles erzählen zu lassen. Auf diese Weise können Kinder mehr und reichhaltigeres Wissen erlernen und sich ein eigenes „Weltbild“ bilden.

OpenAI glaubt, dass unbeaufsichtigtes Lernen und Denkfähigkeiten die beiden Säulen der KI-Entwicklung sind.

Dadurch verfügt GPT-4.5 über eine breitere Wissensbasis, ein genaueres Verständnis der Benutzerabsichten und eine verbesserte emotionale Intelligenz. Es eignet sich daher besonders zum Schreiben, Programmieren und Lösen praktischer Probleme und reduziert gleichzeitig Halluzinationen.

SimpleQA wird verwendet, um die Faktizität großer Sprachmodelle (LLMs) bei der Beantwortung einfacher, aber anspruchsvoller Wissensfragen zu bewerten. Die Genauigkeit von GPT-4.5 in SimpleQA (je höher der Wert, desto besser) erreicht 62,5 % und liegt damit weit vor anderen OpenAI-Modellen.

Darüber hinaus erzielte GPT-4.5 bei der Auswertung der SimpleQA-Halluzinationsrate (je niedriger der Wert, desto besser) einen Wert von 37,1 %, was ebenfalls weit hinter anderen OpenAI-Modellen liegt.

Im PersonQA-Datensatz erreichte GPT-4.5 eine Genauigkeit von 0,78, was besser ist als GPT-4o (0,28) und o1 (0,55).

Darüber hinaus führte OpenAI umfangreiche Sicherheitstests für GPT-4.5 durch, darunter die Ablehnung schädlicher Inhalte, die Bewertung von Halluzinationen, die Erkennung von Verzerrungen, den Schutz vor Jailbreak-Angriffen usw.: GPT-4.5 schnitt bei der Ablehnung unsicherer Inhalte gut ab, war jedoch in Bezug auf die übermäßige Ablehnung etwas besser als das Modell der vorherigen Generation.

In Bezug auf die Mehrsprachenleistung unterstützt GPT-4.5 14 Sprachen und übertrifft GPT-4o in der MMLU-Bewertung, insbesondere in Sprachen mit geringen Ressourcen (wie Swahili und Yoruba).

Was die Programmierung und Softwareentwicklung betrifft, hat sich die Leistung bei GPT-4.5-Codegenerierungs- und Reparaturaufgaben verbessert.

Agentic Tasks bewertet die Fähigkeit der KI, komplexe Aufgaben in einer realen Umgebung unabhängig auszuführen, einschließlich Terminaloperationen (Linux + Python-Umgebung), Ressourcenbeschaffung (z. B. automatisches Herunterladen, Ausführen von Programmen) und komplexe Aufgabenausführung (z. B. Laden und Ausführen von KI-Modellen) usw.

Die von OpenAI veröffentlichte Systemkarte zeigt, dass GPT-4.5 bei autonomen Aufgaben noch gewissen Einschränkungen unterliegt und weit von einem wirklich autonomen KI-Agenten entfernt ist.

Neben normalen Benutzern öffnet GPT-4.5 auch Entwicklern die Tür.

OpenAI hat gleichzeitig GPT-4.5-APIs geöffnet, darunter die Chat Completions API, die Assistants API und die Batch API.

GPT-4.5 unterstützt Funktionsaufrufe, strukturierte Ausgaben, Streaming-Antworten und Systemnachrichten und verfügt über visuelle Funktionen, die durch Bildeingabe verarbeitet werden können.

Entwickler können GPT-4.5 über die API-Schnittstelle in ihre eigenen Anwendungen integrieren, um interessantere und nützlichere Produkte zu erstellen.

GPT-4.5 ist jedoch rechenintensiv und kostspielig und wird daher GPT-4o nicht ersetzen. Darüber hinaus prüft OpenAI noch, ob GPT-4.5 langfristig in der API bereitgestellt werden soll, um die Entwicklung zukünftiger Modelle weiter voranzutreiben und gleichzeitig aktuelle Funktionen zu unterstützen.

Betritt KI das Zeitalter der „emotionalen Intelligenz“?

Diese Live-Session wird von Mia Glaese, Rapha Gontijo Lopes, Youlong Cheng, Jason Teplitz und Alex Paino moderiert.

Als GPT-4.5 von einer Demo gebeten wurde, eine verärgerte Textnachricht an einen Freund zu schreiben, der häufig Termine abgesagt hatte, konnte er die Frustration des Benutzers erkennen und eine subtilere und konstruktivere Antwort geben, sodass der Benutzer seine Gefühle rationaler ausdrücken konnte.

Eine weitere Demonstration demonstrierte die Fähigkeit von GPT-4.5, eine komplexe Frage zu erklären: „Warum ist Meerwasser salzig?“

GPT-1 hatte überhaupt keine Ahnung von der Antwort, GPT-2 gab eine relevante, aber falsche Antwort, GPT-3.5 Turbo gab zum ersten Mal eine richtige, aber schlecht erklärte Antwort, GPT-4 führte die Fakten übermäßig detailliert aus und GPT-4.5 lieferte eine prägnante, kohärente und interessante Erklärung, die zu Beginn sogar einprägsame Satzstrukturen verwendete.

Berichten zufolge hat OpenAI bei der Entwicklung von GPT-4.5 mehrere wichtige Innovationen bei den Trainingsmechanismen erzielt.

Das Training eines so groß angelegten Modells erfordert erhebliche Verbesserungen der Post-Training-Infrastruktur, da die Trainingsdaten und Parametergrößen der Phasen vor und nach dem Training völlig unterschiedlich sind.

Das Team entwickelte einen neuen Trainingsmechanismus, der ein so großes Modell mit kleineren Rechenressourcen verfeinern kann.

Konkret schlossen sie den Post-Training-Prozess durch mehrere Iterationen ab, kombinierten überwachte Feinabstimmung und verstärkendes Lernen mit menschlichem Feedback und entwickelten schließlich ein einsetzbares Modell.

Im Hinblick auf die Vorschulung ergriff das von Alex und Jason geleitete Team eine Reihe von Maßnahmen, um die Nutzung der Computerressourcen zu maximieren:

Verwenden Sie ein Training mit geringer Präzision, um die GPU-Leistung voll auszunutzen
Trainieren Sie Modelle gleichzeitig über mehrere Rechenzentren hinweg vor, da sie mehr Rechenressourcen erfordern, als eine einzelne Netzwerkarchitektur mit hoher Bandbreite bereitstellen kann

Darüber hinaus hat das Team ein neues Inferenzsystem entwickelt, um sicherzustellen, dass das Modell schnell auf Benutzer in ChatGPT reagieren und den reibungslosen Ablauf der Konversation gewährleisten kann. Gleichzeitig sagten sie, dass sie nach der Veröffentlichung weitere Verbesserungen vornehmen werden, um das Modell schneller laufen zu lassen.

Diese Innovationen bei den Trainings- und Bereitstellungsmechanismen ermöglichen es dem Team, mehr Rechenleistung in das Modell zu integrieren, um eine massive Skalierung des unbeaufsichtigten Lernens zu erreichen. Dies ist ein wesentlicher Grund dafür, dass GPT-4.5 immer noch ein starkes Verständnis und niedrige Halluzinationsraten aufweisen kann, ohne sich auf schrittweises Denken verlassen zu müssen.

Erwähnenswert ist, dass Mark Chen, Chief Research Officer von OpenAI, vor der Veröffentlichung von GPT-4.5 von Alex Kantrowitz interviewt wurde.

Auf die Frage, ob OpenAI Verbesserungen bei der Modelllaufeffizienz erzielt hat, sagte er:

Der Prozess, ein Modell effizienter laufen zu lassen, ist oft relativ unabhängig von der Entwicklung der Kernfunktionen des Modells. Ich sehe, dass sich viele Arbeiten auf Inferenzarchitekturen konzentrieren. DeepSeek leistet hier großartige Arbeit und wir haben uns viel Mühe gegeben. Wir konzentrieren uns sehr darauf, wie wir diese Modelldienste allen Benutzern zu geringeren Kosten anbieten können, und haben hart daran gearbeitet, die Kosten zu senken.
Ob es sich um ein Inferenzmodell wie GPT-4 oder andere Modelle handelt, wir drängen immer auf eine kostengünstigere Inferenzoptimierung. Seit der ersten Veröffentlichung von GPT-4 wurden die Betriebskosten um Größenordnungen gesenkt, und wir machen in diesem Bereich gute Fortschritte.

Später antwortete Mark Chen auf die Frage, ob das aktuelle Skalierungsgesetz auf einen Engpass gestoßen sei oder ob sinkende Erträge aus der Expansion zu beobachten seien:

„Ich habe ein anderes Verständnis von Skalierung. Wenn es um unüberwachtes Lernen geht, braucht man mehr Schlüsselelemente wie Rechenressourcen, Algorithmusoptimierung und mehr Daten. Und GPT-4.5 beweist wirklich, dass wir das Skalierungsparadigma weiter vorantreiben können, und dieses Paradigma steht nicht im Widerspruch zur Fähigkeit zur Vernunft.

Argumentationsfähigkeiten müssen auf Wissen basieren. Ein Modell kann nicht im luftleeren Raum argumentieren, sondern muss sich zunächst Wissen aneignen und dann auf dieser Grundlage Argumentationsfähigkeiten entwickeln. Daher glauben wir, dass diese beiden Paradigmen komplementär sind und dass zwischen ihnen eine sich gegenseitig verstärkende Rückkopplungsschleife besteht. "

Tatsächlich zeigt GPT-4.5 nicht nur das enorme Potenzial des unbeaufsichtigten Lernens, sondern kündigt auch die Entwicklungsrichtung der KI an – eher wie beim Menschen.

In der Vergangenheit konzentrierte sich die Entwicklung der KI hauptsächlich auf die Verbesserung der Intelligenz, wie z. B. Schach spielen, Probleme lösen, Bilder erkennen usw. Im Gegensatz zu dem Aufsehen, das die Veröffentlichung von GPT-4 vor zwei Jahren hervorrief, haben sich die Erwartungen der Menschen an KI heute von „was sie kann“ vor zwei Jahren zu „was sie besser kann, sicherer und kontrollierbarer ist“ verschoben.

Immer mehr KI-Unternehmen konzentrieren sich auf „emotionale Intelligenz“ und versuchen, die KI dazu zu bringen, menschliche Emotionen und Bedürfnisse besser zu verstehen.

GPT-4.5 steht stellvertretend für diesen Trend. Die Investition von Ressourcen in die Entwicklung von KI, die die Gedanken der Menschen besser versteht, ist nach wie vor ein Vorschlag, der die Aufmerksamkeit der Branche verdient. Obwohl GPT-4.5 die Höhe zeigt, die Sprachmodelle, die auf riesigen Datenmengen und Rechenleistung basieren, erreichen können, scheint seine Leistung immer noch etwas überfordert zu sein.

Aus dieser Perspektive könnte es sich eher um ein stufenweises Ende handeln, das eine Übergangsrolle zwischen der Vergangenheit und der nächsten spielt. Es ist nicht nur eine Zusammenfassung und Reparatur vergangener Modellgenerationen, sondern ebnet auch den Weg für die nächste Technologiewelle.

Der wirkliche Durchbruch muss möglicherweise auf die Verwirklichung von GPT-5 warten.

Wenn Sie befürchten, dass OpenAI nicht mehr genug Zeit zum Iterieren hat, machen Sie sich keine Sorgen, ich habe einen Trick: Die Iteration der gefälschten Version ist GPT-4.5→GPT-5. In den nächsten „Monaten“ sollte der tatsächliche Veröffentlichungsrhythmus GPT-4.5→GPT-4.6→GPT-4.7 sein.

Die gute Nachricht ist, dass Sie dieses Mal nicht noch zwei Jahre warten müssen.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo