OpenAI hat plötzlich die o3-mini-Denkkette veröffentlicht! Die erste Show wurde im Vergleich zu DeepSeek R1 in der tatsächlichen Messung in Frage gestellt, die Lücke ist zu offensichtlich.

Februar 7, 2025 Eskere Guru

Wir danken DeepSeek noch einmal.

Heute früh gab OpenAI die Veröffentlichung der Denkkette des neuesten Modells der O3-Mini-Serie bekannt.

Einfach ausgedrückt können Benutzer jetzt den „Denkprozess“ von o3-mini und o3-mini(high) sehen und besser verstehen, wie das Modell argumentiert und zu Schlussfolgerungen gelangt.

Der OpenAI-Forscher Noam Brown hat auf der X-Plattform gepostet:

„Bevor o1-Preview veröffentlicht wird, stellen wir es Ihnen vor Der Anblick der Chain of Thoughts (CoT) in Echtzeit ist für sie oft ein Aha-Erlebnis, das ihnen klar macht, dass es sich um etwas Großes handelt.

Obwohl es sich hierbei nicht um originelle Gedankenketten handelt, liegen sie doch sehr nahe beieinander. Ich freue mich so sehr, dass wir diese Erfahrung mit der Welt teilen dürfen! "

Anschließend führte er weiter aus:

„o3-mini ist das erste große Sprachmodell, das Tic-Tac-Toe-Probleme konsistent und genau beantworten kann. Obwohl die zusammengefasste Denkkette etwas verwirrend erscheint, können Sie auf der rechten Seite sehen, dass das Modell schließlich erfolgreich die richtige Antwort gefunden hat.“

Bild

Es ist öffentlich, aber nicht vollständig öffentlich.

Nach Angaben der ausländischen Medien TechCrunch wird OpenAI die vollständigen Argumentationsschritte von o3-mini noch nicht vollständig offenlegen, sagte jedoch, dass es „einen Gleichgewichtspunkt gefunden“ habe und o3-mini nun „frei denken“ und dann eine detailliertere Zusammenfassung der Argumentation erstellen könne.

Zuvor hat OpenAI aus Wettbewerbsgründen die Inferenzschritte von o3-mini und seinen Vorgängern (o1 und o1-mini) nicht vollständig offengelegt, sondern lediglich Inferenzzusammenfassungen für Benutzer bereitgestellt, und selbst diese Zusammenfassungen waren manchmal ungenau.

Um die Klarheit und Sicherheit zu verbessern, führt OpenAI außerdem einen zusätzlichen Nachbearbeitungsschritt ein. Das Modell überprüft zunächst die „Denkkette“, um potenziell unsichere Inhalte zu eliminieren und komplexe Konzepte mäßig zu vereinfachen.

In dem Bericht wurde ein OpenAI-Sprecher mit der Erklärung zitiert: „Dieser Nachbearbeitungsschritt unterstützt auch nicht englischsprachige Benutzer, um sicherzustellen, dass sie die ‚Gedankenkette‘ in ihrer Muttersprache anzeigen können, was das Erlebnis benutzerfreundlicher und verständlicher macht.“

Tatsächlich wird die Argumentationstransparenz zu einem wichtigen Wettbewerbsfaktor im Bereich der KI. Wenn der KI ermöglicht wird, vollständige Argumentationsschritte anzuzeigen, kann dies nicht nur das Vertrauen der Benutzer stärken, sondern auch die Erforschung und Verbesserung von KI erleichtern.

Die öffentliche Denkkette kann jedoch von Wettbewerbern ausgenutzt werden, beispielsweise um die Argumentationslogik des Modells durch Destillationstechnologie zu extrahieren. Bei der AMA-Veranstaltung (Ask Me Anything) auf Reddit letzte Woche sagte Kevin Weil, Chief Product Officer von OpenAI:

„Wir arbeiten daran, mehr Argumentationsprozesse als bisher darzustellen – [diese Änderung] wird bald erfolgen. Ob die vollständige „Gedankenkette“ dargestellt werden soll, ist aufgrund von Wettbewerbsproblemen noch offen. Wir wissen aber auch, dass Benutzer (insbesondere Power-Benutzer) mehr Details sehen möchten, daher finden wir die richtige Balance. "

Im Gegensatz dazu ist die Denkkette von DeekSeek R1 bedingungslos offen und transparent, und ihr tiefgreifender Denkprozess wurde von vielen Internetnutzern gelobt. Die „erzwungene“ Anpassung von OpenAI ist dieses Mal offensichtlich eine Reaktion auf den Druck von DeepSeek und anderen KI-Unternehmen.

X Netizen @thegenioo hat dieses Update der Denkkette sofort getestet. Er sagte: „Die neue Version bietet nicht nur eine reibungslosere Benutzeroberfläche, sondern macht auch den Denkprozess des Modells transparenter.“

Das Folgende ist ein Vergleich der Überlegungen von DeepSeek R1 und OpenAI o3-mini(high) zum gleichen Problem.

„Wie viele E’s gibt es in deepseeeeeek?“

DeepSeek R1

Bild

OpenAI o3-mini (hoch)

„Angenommen, es gibt einen Teich mit unendlich viel Wasser darin. Es gibt zwei leere Wasserkocher mit einem Fassungsvermögen von 5 Litern bzw. 6 Litern. Das Problem besteht darin, wie man mit nur diesen beiden Wasserkochern 3 Liter Wasser aus dem Teich bekommt.“

▲DeepSeek R1

OpenAI o3-mini (hoch)

„Ein Mann kaufte ein Huhn für 8 Yuan und verkaufte es für 9 Yuan. Dann dachte er, es sei kein gutes Geschäft, also kaufte er es für 10 Yuan zurück und verkaufte es für 11 Yuan an eine andere Person. Fragen Sie ihn, wie viel er verdient hat?“

▲DeepSeek R1

▲OpenAI o3-mini (hoch)

Nachdem wir die oben genannten Fälle gelesen haben, werden wir feststellen, dass die beiden Modelle völlig unterschiedliche „Denkstile“ haben.

DeepSeek R1 ähnelt eher einem Studenten der Geisteswissenschaften. Sein Denkprozess ist Schritt für Schritt und sein Denken ist gründlich und feinfühlig. Dies hat den Vorteil, dass die Ergebnisse zuverlässiger sind und es weniger logische Abweichungen gibt. Der o3-mini(high) ähnelt eher einem Naturwissenschaftsstudenten. Der Argumentationsprozess ist prägnant und klar und geht direkt zum Kern des Problems.

Dieser Unterschied spiegelt sich auch in der Reaktionsgeschwindigkeit wider. DeepSeek R1 hat eine relativ lange Denkzeit, während o3-mini (hoch) schneller ist.

Was die Antworten betrifft, sind die Antworten von DeepSeek R1 oft vollständiger und detaillierter. Beispielsweise enthält die erste Testfrage auch durchdachte Anmerkungen. Im Gegensatz dazu wirkt o3-mini(high) „sachlich“.

Wie eingangs erwähnt, handelte es sich bei dem, was o3-mini dieses Mal veröffentlichte, nicht um die vollständige Version der Denkkette, so dass nach der Veröffentlichung auch viele Zweifel aufkamen.

Angesichts der Kontroversen erklärte OpenAI-CEO Sam Altman auch schnell auf der X-Plattform: „Wir versuchen, die ursprüngliche Denkkette so zu organisieren, dass sie besser lesbar ist, und übersetzen sie bei Bedarf, versuchen aber, ihren ursprünglichen Stil beizubehalten.“

Doch wie ein Internetnutzer ausdrücklich betonte: Wären wir ohne DeepSeek überhaupt noch in der Lage, auch nur eine „kastrierte Version“ der Denkkette von o3-mini zu sehen? Ich fürchte, die Antwort liegt auf der Hand.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo