Musk veröffentlicht das „leistungsstärkste Modell“, das DeepSeek übertrifft und mehr als 200-mal teurer ist

Februar 18, 2025 Eskere Guru

„Scary smart“, das sagte Musk, als er Grok 3 vorstellte, und so früh am Morgen wartete das gesamte Internet sehnsüchtig.

Während der Pressekonferenz im gesamten Netzwerk wurde zunächst der App Store aktualisiert. Während der Pressekonferenz war die Grok-Webversion so beliebt, dass sie abstürzte.

Okay, ich sehe sehr zuversichtlich aus.

Grok 3 ist keine einfache Produktiteration, sondern ein von Musk gebautes Rechenzentrum, eine großzügige Grafikkartenkonfiguration, das beste Pre-Training-Modell und die kontinuierliche Nutzung von Reinforcement Learning für das Training. Es kann als eine neue Generation bezeichnet werden, die aus „Anreicherung“ hervorgegangen ist.

Die wichtigsten Punkte sind wie folgt zusammengefasst:

Konten in den USA können aktualisiert werden und in Großbritannien und Europa werden sie in 2.28 eingeführt
Einführung des SuperGrok-Premium-Abonnements mit einer monatlichen Gebühr von 30 US-Dollar und einer Jahresgebühr von 300 US-Dollar, das zusätzliche Inferenz- und DeepSearch-Abfragefunktionen, einschließlich unbegrenzter Bildgenerierungsdienste, bietet

Die Argumentationsfähigkeit von Grok 3 ist der von DeepSeek R1 überlegen

Im LMSYS-Blindtest, bekannt als Chatbot Arena, belegte Grok 3 in verschiedenen Aspekten wie Code und Befehlsantwort den ersten Platz.

Als Produkt, das aus 200.000 Grafikkarten hervorgegangen ist, beweist die Leistung auf Fehlerebene von Grok 3 immer noch, dass das Skalierungsgesetz immer noch in Kraft ist.

Im Vergleich zu DeepSeek, das bei niedrigen Kosten hohe Gewinne erzielt, konzentriert sich Grok 3 darauf, „Wunder mit großer Kraft geschehen zu lassen“.

Diesmal liegt der Schwerpunkt von Grok 3, das Argumentationsfunktionen einführt, auf einer flexibleren Zuweisung von Echtzeit-Rechenressourcen, um eine möglichst intelligente Nutzung der Rechenressourcen zu gewährleisten und gleichzeitig die Qualität der Argumentation sicherzustellen.

Die Argumentationsfähigkeiten von Grok 2 hatten zu diesem Zeitpunkt bereits das SOTA-Niveau erreicht. Nach mehreren Iterationen wurde die Generalisierungsfähigkeit des Modells erheblich verbessert. Grok 3 hat im neuesten AIME-Wettbewerb erneut seinen eigenen Rekord aufgefrischt.

Es reicht jedoch offensichtlich nicht aus, über ein starkes Denkvermögen zu verfügen. Nur wer schnell, rücksichtslos und genau ist, kann an der Weiterentwicklung großer Modelle teilnehmen. Auf der Pressekonferenz zeigte das Ingenieurteam zwei Fälle.

Eine davon war die Anfrage, einen 3D-Animationscode zu generieren, der von der Erde zum Mars und zurück zur Erde geschickt wurde. Grok dachte 19 Sekunden lang nach und beschrieb seinen Denkprozess im Detail, einschließlich der Verwendung von Python zum Zeichnen und NumPy für Berechnungen.

Der andere versucht, Grok dazu zu bringen, die beiden Spiele „Tetris“ und „Bejeweled“ zu einem neuen Spiel zu kombinieren.

Unglücklicherweise erlitt Grok gleich nach der Veröffentlichung zwei aufeinanderfolgende Überschläge. Sogar Musk blickte auf die schlechte Demonstrationssitzung auf dem Bildschirm zurück und stieß ein verlegenes „Oh Mann“ aus.

Allerdings wurden in späteren Demonstrationen auch Normalfälle vorgestellt (sollte die Demo noch nicht fertig sein).

Und einige glückliche Internetnutzer haben bereits Grok 3 gespielt.

▲Bild von X Netizen @jesselaunz

DeepSearch ist hier, um Suchmaschinen zu revolutionieren

Als Blockbuster-Produkt dieses Updates gilt DeepSearch powered by Grok 3 als Suchmaschine der nächsten Generation. Das Modell wird autonom wie ein Agent agieren und die Absicht hinter den Fragen des Nutzers verstehen, wodurch Zeit für Google gespart wird.

Während der Live-Demonstrationssitzung stellte der Ingenieur Grok 3 eine interessante Frage: Sagen Sie die Anzahl der Siege und Niederlagen im NCAA „March Madness“ voraus, also die Ergebnisse der Spiele auf allen Ebenen.

Hierbei handelt es sich um eine von Buffett im Jahr 2014 ins Leben gerufene Veranstaltung mit einem Einsatz von bis zu einer Milliarde US-Dollar, und die Wette zielte darauf ab, Buffett in den Bankrott zu treiben. In der Vergangenheit ist es niemandem gelungen oder auch nur annähernd gelungen, denn selbst wenn Experten es vorhersagen, gibt es nach den ersten paar Runden jede Menge Fehler.

▲2023 NCAA-Matchup-Chart

Das war damals eine Marketingkampagne, schließlich war die Gewinnwahrscheinlichkeit sehr gering, fast eins zu hundert Milliarden, was im Grunde unmöglich war. Es ist nicht unvernünftig, dieses Problem Grok 3 zu überlassen.

Zusätzlich zu den zitierten Materialien waren auch die zurückgegebenen Antworten strukturiert. Die einleitende Einleitung, das Hintergrundwissen, die Analysediagramme und die abschließenden Bemerkungen sind recht vollständig.

Der Fokus der Suche liegt auf der Gegenprüfung verschiedener Informationsquellen. Grok 3 erfüllt diese Aufgabe durch die Gestaltung eines Unteraufgaben-Panels, sodass Benutzer laufende Aufgaben in Echtzeit überwachen können, um sicherzustellen, dass die Antworten verfügbar und zuverlässig sind.

Auf dieser Basis kann der Agent zehn Minuten lang selbständig suchen, was eine Suchstunde allein wert ist, was den Arbeitsaufwand effektiv reduzieren kann.

Am Ende gab Grok 3 auch das, was es für die NCAA-Meisterschaft 2025 hielt. Der März ist noch nicht gekommen, wir wollen abwarten, ob seine „Gottesprophezeiung“ wahr wird.

Bezüglich der Art und Weise, wie man Grok 3 erleben kann, sagten Beamte, dass die Premium+-Abonnenten von

SuperGrok kostet 30 US-Dollar pro Monat und 300 US-Dollar pro Jahr und bietet lediglich zusätzliche Inferenz- und DeepSearch-Abfragefunktionen sowie unbegrenzte Bildgenerierungsdienste.

Jarvis ist hier? Noch nicht ganz da

Erst gestern Abend enthüllte Shivon Zilis ihr Gespräch mit Ara, dem von Grok 3 betriebenen Assistenten für künstliche Intelligenz, und sagte, es sei der unerwartetste Gewinn im Leben.

Es steigerte lediglich die Erwartungen aller an den Sprachmodus. Musk hatte vor der Pressekonferenz angekündigt, dass der Sprachmodus erst innerhalb einer Woche eingeführt werden würde, was auch bedeutete, dass es keine Chance für die Demonstrationssitzung gab.

Während der Live-Übertragung sagte Musk jedoch auch, dass dies eines der besten Grok-Erlebnisse sein würde. Am Ende der Konferenz veröffentlichte das Stimmmodell auch eine männliche Stimme, die ziemlich menschlich klang.

Dieser kleine Teil von Reuters weckte große Neugier und während der QA-Sitzung tauchten viele Fragen zum Sprachmodus auf. Natürlich gibt es jetzt auch die unverzichtbare Seelenquälerei: „Ist es Open Source?“ Wir haben einen Teil davon extrahiert

Qualitätssicherung

F: Wann wird das Grok-Sprachmodell eingeführt? Basiert es auf Text-to-Speech oder ist es ein Modell, das menschliche Sprache verstehen und direkt reagieren kann?
A: Grok wird grundsätzlich verstehen, was Menschen sagen, und innerhalb einer Woche zunächst eine frühe Version veröffentlichen, gefolgt von schnellen, iterativen Updates.

F: Wann wird die Grok-API eingeführt?
A: Es wird in den nächsten Wochen eingeführt und wird Inferenzmodelle und umfassende Forschungsfunktionen umfassen.

F: Kann sich Grok an interaktive Gespräche erinnern?
Antwort: Wir arbeiten intensiv an der Entwicklung dieser Funktion, sie ist jedoch noch nicht vollständig abgeschlossen.

F: Wird das Grok-Modell Open Source sein? A: Wenn Grok 3 ausgereift und stabil ist, wird Grok 2 in etwa ein paar Monaten Open Source sein.

F: Was war der schwierigste Teil bei diesem Projekt?
Antwort: Die größte Herausforderung besteht darin, das gesamte Modell auf massivem H100 zu trainieren und die Konsistenz aufrechtzuerhalten

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo