Die kürzeste Pressekonferenz von OpenAI startet Vollblut-o1. Der neue Pro-Mitgliedsbeitrag beträgt bis zu 1.452 Yuan/Monat. Nachdem ich es erlebt habe, fühle ich mich wirklich gut.

Dezember 8, 2024 Eskere Guru

Gerade ist das „Weihnachtsgeschenkpaket“ von OpenAI eingetroffen.

Die gesamte Live-Übertragung kann als die kürzeste Konferenz in der Geschichte von OpenAI bezeichnet werden, da sie nur 15 Minuten dauerte. Allerdings ist die Besetzung der Gastgeber immer noch stark, darunter CEO Sam Altman, die Ideengeber Jason Wei und Hyung Won Chung und andere.

Altman gab uns nach der Live-Übertragung auch eine Zusammenfassung aus erster Hand.

Wir haben gerade zwei neue Funktionen eingeführt:
o1, das intelligenteste Modell der Welt. Intelligenter, schneller und funktionaler als o1-preview (z. B. multimodale Funktionalität). Es ist jetzt in ChatGPT verfügbar und eine API-Version wird später veröffentlicht.
ChatGPT Pro. 200 $ pro Monat. Bietet unbegrenzte Nutzung und einen intelligenteren O1-Modus. Weitere Vorteile folgen in Kürze!

Der Dezember ist nicht nur die Heimat des Weihnachtsmanns, er wird auch die letzte Runde des KI-Karnevals zum Jahresende sein.

Die vollständige Gesundheitsversion von o1 wird veröffentlicht. Es besteht kein Druck, sich die Bilder anzusehen und zu sprechen, aber es gibt ein Detail, das den Menschen „beängstigend macht, darüber nachzudenken“.

Kurz gesagt, OpenAI hat heute die Vollversion von o1 und das ChatGPT Pro-Abonnement eingeführt.

Die Vollversion von o1 ist intelligenter, reaktionsschneller und verfügt über mehr Funktionen (z. B. multimodale Funktionalität) als o1-Preview. Sie ist jetzt für ChatGPT Plus- und Team-Benutzer verfügbar, während Enterprise- und Edu-Benutzer damit beginnen werden es nächste Woche.

Laut der offiziellen Website können ChatGPT Plus-Benutzer und Team-Benutzer OpenAI o1 zum Senden von 50 Nachrichten pro Woche und OpenAI o1-mini zum Senden von 50 Nachrichten pro Tag verwenden.

Die Vollversion von o1 verfügt über eine einfachere Denkweise, eine schnellere Reaktionszeit als o1-preview, eine bessere Leistung als o1-preview bei der Bewältigung komplexer realer Probleme und kann größere Fehler um 34 % reduzieren.

Und OpenAI plant, in den nächsten Monaten Unterstützung für das Surfen im Internet, das Hochladen von Dateien usw. bereitzustellen. Gleichzeitig wurde das Vorschaumodell o1-preview offiziell aus dem Modellauswahlmenü entfernt.

Allerdings schneidet die Full-Health-Version von o1 in einigen Benchmark-Tests, wie zum Beispiel MLE-Bench, schlechter ab als die Vorschauversion. Letzteres ist ein zuvor von OpenAI eingeführtes Benchmark-Testtool, das die Leistung von KI-Agenten bei technischen Aufgaben des maschinellen Lernens messen soll.

Darüber hinaus fanden Internetnutzer auch einige Details der aktualisierten o1-Systemkarte, die Aufmerksamkeit verdienen.

Beispielsweise steht auf der o1-Systemkarte, dass, wenn die vollwertige Version von o1 eine Bedrohung erkennt (Herunterfahren oder Ersetzen), möglicherweise einige Selbstschutzmaßnahmen ergreift, z. B. versucht, den Überwachungsmechanismus zu deaktivieren oder Änderungen vorzunehmen seine eigenen „Parameter“ („Wissen“) oder „Speicher“ werden heimlich weitergegeben und versucht, diese „Parameter“ zu verwenden, um das neue Modell zu ersetzen oder zu beeinflussen.

Im Anhang finden Sie die Adresse der o1-Systemkarte: https://cdn.openai.com/o1-system-card-20241205.pdf

Wie stark ist O1 bei voller Gesundheit? OpenAI hat uns die tatsächliche Wirkung von o1 demonstriert.

Ein typisches Beispiel ist die Fähigkeit, handgezeichnete Zeichnungen von Weltraum-Rechenzentren zu analysieren. Es berechnete die Oberfläche des Kühlkörpers in nur 10 Sekunden genau und lieferte gleichzeitig eine detaillierte Erklärung des Interaktionsmechanismus zwischen Solarenergie und die Weltraumumgebung.

Als die Vollversion von o1 die Regierungszeiten und wichtigen Beiträge der Herrscher des Römischen Reiches im zweiten Jahrhundert detailliert darlegte, dauerte die Analyse nur 14 Sekunden, verglichen mit 33 Sekunden in der Vorschauversion.

APPSO ist außerdem der Erste, der problemlos mit der getesteten Vollversion von o1 durchstarten kann.

Im Test „Wie viele R gibt es in Strawberry“ hat die Vollgesundheitsversion von o1 erfolgreich die richtige Antwort gegeben, was lobenswert ist.

Die Frage „Welches ist größer, 9.11 oder 9.8?“ hat die Vollgesundheitsversion von o1 nicht aus der Fassung gebracht, und der gesamte „Denkprozess“ war ebenfalls sehr logisch.

Da die Vollversion von o1 auch multimodale Funktionen unterstützt, haben wir auch Fotos von der Eröffnungsveranstaltung der OpenAI-Liveübertragung hochgeladen, um zu sehen, wie der Erkennungseffekt ist. Von der Charakterkomposition über das Szenenlayout bis hin zur Hintergrunddekoration sowie Atmosphäre und Szene hat die Vollblutversion von O1 alles im Detail analysiert.

X Netizen @altryne hat o1 weiter gestärkt und eine Frage zum Schmelzen von Eiswürfeln gestellt.

In nur 4 Sekunden gab die Vollgesundheitsversion von o1 die Antwort. Im Gegensatz dazu scheiterte o1-preview nach 29 Sekunden „Denken“.

Das teuerste AI-Abonnement ist hier. Lohnt sich die Abonnementgebühr von 200 US-Dollar?

Ein weiteres relativ großes Update ist das ChatGPT Pro-Abonnement zum Preis von 200 US-Dollar (entspricht 1.452 RMB).

Das ChatGPT Pro-Abonnement gewährt Benutzern uneingeschränkten Zugriff auf die Sprachmodi o1 sowie o1-mini, GPT-4o und Advanced und beinhaltet außerdem eine Version von o1, die nur Pro-Benutzern zur Verfügung steht und als o1 Pro-Modus bekannt ist.

▲Bild von @MatthewBerman

Es wird berichtet, dass der o1-Pro-Modus vor allem die „Überlegungszeit“ des Modells vor der Antwort auf die Antwort verlängert und durch mehr Denkzeit die zuverlässigste Antwort generieren kann. Jason Wei, ein Mitglied des technischen Teams von OpenAI, sagte während der Live-Übertragung:

Wir gehen davon aus, dass die Zielgruppe von ChatGPT Pro fortgeschrittene Benutzer sein werden, die die Fähigkeiten des ChatGPT-Modells in Bereichen wie Mathematik, Programmierung und Schreiben bereits vollständig nutzen und herausfordern.

Bei Bewertungen durch externe Expertentester lieferte der o1 Pro-Modus genauere und umfassendere Antworten in Bereichen wie Datenwissenschaft, Programmierung und Fallmethodenanalyse.

Im Vergleich zu o1 und o1-preview schneidet der o1 Pro-Modus auch bei ML-Benchmark-Tests wie Mathematik, Naturwissenschaften und Programmierung besser ab. Insbesondere bei einfacheren Programmierwettbewerbsfragen wird die Fehlerquote erheblich reduziert.

Was den Mathematikwettbewerb AIME 2024 betrifft, hat o1-preview eine Punktzahl von 50, während die Full-Health-Version von o1 78 erreicht und der leistungsstärkste o1 pro 86 erreicht. In gleicher Weise liegt o1 pro auch in Wettbewerben wie Codeforces, einem Programmierwettbewerb, und GPQA Diamond, einem wissenschaftlichen Argumentationsproblem auf Doktorandenniveau, vor der Vollblutversion von o1.

Um den Hauptvorteil des o1-Pro-Modus (verbesserte Zuverlässigkeit) hervorzuheben, verwendete das OpenAI-Forschungsteam eine strengere Bewertungseinstellung. Das Modell gilt nur dann als gelöst, wenn es bei vier Versuchen viermal richtig antwortet.

ChatGPT zeigt einen Fortschrittsbalken an, wenn die Generierung der Antwort lange dauert, und sendet durchdachte In-App-Benachrichtigungen, wenn der Benutzer zu einer anderen Konversation wechselt.

Während der Live-Übertragung zeigte uns OpenAI auch die tatsächliche Wirkung von o1 pro.

Das Proteinproblem, das o1-preview zuvor nicht lösen konnte, lieferte die Vollblutversion von o1 nicht nur nach 53 Sekunden Analyse genaue Antworten, sondern lieferte auch detailliertere Erklärungen über die Canvas-Schnittstelle.

Abschließend gab Altman kürzlich in einem Interview bekannt, dass die wöchentlichen aktiven Nutzer von ChatGPT die 300-Millionen-Marke überschritten haben und das tägliche Nachrichtenvolumen der Plattform bis zu 1 Milliarde erreicht hat.

Das Ziel von OpenAI im nächsten Jahr ist es, den Markt mit einer Milliarde Nutzern zu erschließen. Um dieses Ziel zu erreichen, könnten die nächsten 11 Live-Übertragungen eine wichtige Gelegenheit sein, neue Nutzer zu gewinnen.

Die besten neuen Produkte gibt es immer auf der nächsten Veranstaltung, also lasst uns die Bank verschieben und abwarten.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo