Der Grok-3 von xAI ist beeindruckend, aber er muss noch viel mehr tun, um mich zu überzeugen

Februar 18, 2025 Eskere Guru

xAI unter der Leitung von Elon Musk hat sein neuestes KI-Modell, Grok-3 , per Livestream angekündigt. Von Anfang an war klar, dass das Unternehmen schnell alle praktischen Lücken schließen möchte, um seinen Chatbot für einen durchschnittlichen Benutzer zugänglicher zu machen, anstatt nur Rhetorik über Wachsamkeit und das Verständnis des Universums zu verkaufen.

Das Unternehmen wird zwei Versionen seines neuesten KI-Modells veröffentlichen, nämlich. Grok-3 und Grok-3 mini. Letzteres ist für Szenarien mit geringem Rechenaufwand trainiert, während ersteres alle Grok-3-Vorteile wie DeepSearch, Think und Big Brain bietet.

Was soll denn die ganze Aufregung?

Homepage des Grok 3-Chats. — Nadeem Sarwar / Digitale Trends

Als Musk zusammen mit xAI-Experten über alle neuen Funktionen von Grok-3 sprach, war klar, dass es bei dieser Veröffentlichung nicht nur darum geht, neue Leistungsmaßstäbe zu setzen, sondern auch alle aktuellen Trends aufzugreifen, die die KI-Landschaft im Jahr 2025 bestimmen werden.

Laut den vom Unternehmen geteilten Benchmarks schnitten Grok-3 und sogar Grok-3 mini bei Aufgaben wie Codierung, Mathematik und wissenschaftlicher Problemlösung besser ab als die Modelle GPT-4o, Gemini, Claude und Deep Seek von OpenAI .

In der Rangliste der Chatbot Arena (LMSYS) erreichte eine frühe Version von Grok-3 einen Bestenlistenhöchstwert von 1.400 Punkten, vor Gemini 2.0 Flash Thinking, DeepSeek und anderen. Das Unternehmen hat Grok-3 in einem beeindruckenden Tempo entwickelt, und das Erreichen dieser Leistungszahlen ist eine ziemliche Leistung, obwohl es im Vergleich zu Google oder OpenAI ein relativer Neuling ist.

Es wird jedoch die größte Herausforderung sein, es in den Mainstream zu bringen, insbesondere aus Zugangssicht. Grok-3 wird zunächst X Premium+-Abonnenten im Rahmen eines Early-Access-Programms zur Verfügung stehen. Premium+ ist derzeit die höchste Stufe des X-Abonnements und kostet 22 US-Dollar pro Monat und 229 US-Dollar für den Jahresplan.

Berechtigte Benutzer erhalten Zugriff auf Grok-3-Funktionen wie Reasoning, DeepSearch, höhere Nutzungsbeschränkungen und frühen Zugriff auf neue Tools. Das Unternehmen führt außerdem einen separaten Abonnementdienst namens SuperGrok ein, der vorrangigen Zugriff auf Grok-3 und höhere Limits für die Bilderzeugung bietet.

Einführung von SuperGrok durch das xAI-Team. — xAI

Dieses Abonnement ist auf die mobile Grok-App und die neu gestartete Grok.com-Website beschränkt. Musk sagt jedoch, dass die neuesten und fortschrittlichsten Funktionen über die Website bereitgestellt werden.

„Das ist eine Art Beta-Version, daher sollte man zunächst mit einigen Unvollkommenheiten rechnen, aber wir werden uns schnell verbessern“, sagte Musk im Livestream und fügte hinzu, dass Benutzer jeden Tag mit Verbesserungen rechnen können. Es wäre interessant zu sehen, wie xAI die Interessenlücke eines durchschnittlichen Chatbot-Enthusiasten füllt, der sein Telefon rockt und gleichzeitig ein interessantes Pitch-Deck an gut zahlende Unternehmenskunden sendet.

Informieren Sie sich über die Trends

xAI scheint viel mit Grok-3 zu tun, nicht nur in Bezug auf erweiterte Funktionen, sondern auch in Bezug auf die Funktionsparität. Eines der herausragenden Elemente von Grok-3 sind die verbesserten Argumentations- und Denkfähigkeiten, was der heiße neue Trend in der Welt der Sprachmodelle zu sein scheint.

Nehmen Sie zum Beispiel den Think-Modus des Grok-3, der ein direkter Konkurrent zu den Modellen der o-Serie von OpenAI ist. Solche KI-Modelle sollen mehr Zeit damit verbringen, über die Benutzeranfragen nachzudenken und sie aufzuschlüsseln, bevor sie eine Antwort liefern.

Benutzer können die Gedankenkette in Echtzeit sehen, und die Vorteile bestehen laut Anwendern in einer verbesserten Leistung bei naturwissenschaftlichen, mathematischen und codierungsbezogenen Abfragen. xAI schließt diese Kluft nicht nur mit dem Think-Modus, sondern mit einem separaten Big-Brain-Tool für Grok-3, das seine Rechenkapazitäten für fortgeschrittenere und komplexere Szenarien steigert.

Google liegt mit seiner Gemini-Reihe nicht allzu weit zurück. Das Unternehmen hat kürzlich die KI-Modellreihe Gemini 2.0 auf den Markt gebracht, zu der Gemini 2.0 Flash Thinking Experimental und eine separate App-First-Iteration gehören, die Informationen aus YouTube, Maps und der Google-Suche priorisiert.

DeepSeek , der Open-Source-KI-Chatbot aus China, der kürzlich die Wall Street für Aufruhr sorgte, bietet auch ein Denk- und Argumentationsprodukt namens DeepThink an. Auch wenn die Antworten zensiert sind , ist die Leistung durchaus beeindruckend.

Auch xAI verfolgt mit Grok-3 die KI-Agenten-Formel, obwohl es noch viel zu tun hat, insbesondere im Vergleich zu Unternehmen wie OpenAI und Google. Zu diesem Zweck bringt das Unternehmen sein erstes auf Grok-3 basierendes Agentenprodukt auf den Markt, das es DeepSearch nennt.

Es funktioniert mehr oder weniger auf die gleiche Weise wie Deep Research in Google Gemini und gleichnamige Konkurrenzprodukte von Perplexity und OpenAI. Es führt eine Websuche durch, erstellt einen vollständigen Bericht und stellt außerdem alle Quellen, aus denen die Informationen stammen, als Zitate bereit.

xAI ist spät dran, aber der Preis könnte ein Hindernis sein, wenn es um die Massenattraktivität geht. Perplexity bietet eine begrenzte Anzahl kostenloser Deep Research-Abfragen an, während Google mit Gemini Deep Research ein großzügigeres Paket für 20 US-Dollar für Gemini Advanced-Abonnenten anbietet.

Deep Research (oder DeepSearch für Grok-3) ist ein äußerst rechenintensiver Prozess, daher ist es sinnvoll, dass es sich um einen Premium-Vorteil handelt. Aber Kunden einen Vorgeschmack darauf zu geben, auch bei einer begrenzten Anzahl von Anfragen, erhöht die Chance, neue Abonnenten zu gewinnen, eine Strategie, die sowohl Perplexity als auch OpenAI verfolgen.

Eine Demonstration von Gemini Live auf einem Google Pixel 9. — Gemini Live von Google. Joe Maring / Digitale Trends

Musk erwähnte auch, dass Grok auch einen Sprachinteraktionsmodus erhalten wird, der in etwa einer Woche eingeführt wird. Der Schwerpunkt liegt auf der Bereitstellung einer alternativen Methode zur Konversation mit Grok, die sich natürlicher anfühlt.

ChatGPT von OpenAI bietet seit einiger Zeit einen sogenannten Sprachmodus an, und eine ähnliche Funktion namensGemini Live steht auch Google Gemini-Benutzern zur Verfügung .

xAI hat nicht viele Details zum Sprachmodus von Grok-3 angegeben, bestätigte jedoch, dass es über einen Konversationsspeicher verfügen wird, sodass es sich an Details früherer Interaktionen erinnern kann. „Es ist eine der besten Erfahrungen von Grok“, sagte Musk während des Livestreams.

Die Herausforderung besteht darin, Massenanklang zu finden

Tools zur Verwendung von Grok-3 AI. — xAI

Deep Research ist nicht die einzige Agentenimplementierung von KI-Chatbots, und da hinkt xAI weit hinterher. OpenAI hat kürzlich Operator eingeführt , einen KI-Agenten, der komplexe webbasierte Aufgaben im Auftrag von Benutzern ausführen kann, indem er im Wesentlichen die Kontrolle über die Aufgaben beim Surfen im Internet übernimmt.

Dank des zugrunde liegenden CUA-Frameworks (Computer-Using Agent) kann es Aufgaben wie Einkaufen, Restaurantreservierungen und reisebezogene Arbeiten ausführen. Am wichtigsten ist, dass OpenAI bereits Verträge mit Unternehmen wie DoorDash, InstaCart, Uber und eBay abgeschlossen hat, um den Operator als beeindruckendes Beispiel praktischer Agentenfähigkeiten zu etablieren.

Dann gibt es noch das System der ChatGPT-Plug-ins , das den Chatbot durch die Integration mit Plattformen wie Zapier, Expedia, Klarna, Slack und Shopify und anderen wesentlich funktionaler macht. Sie machen ChatGPT für Unternehmen zu einem weitaus attraktiveren Produkt als Grok-3.

Google hingegen nutzt sein umfangreiches Portfolio an Produkten und Apps, die Menschen täglich nutzen. Die tiefe Integration auf Systemebene mit Apps (über Erweiterungen) auf Android und die Verfügbarkeit multimodaler Gemini-Funktionen in allen Workspace-Produkten wie Gmail und Docs verleihen ihm einen erheblichen Funktionsvorteil.

DeepSeek hingegen wurde bereits von Marken wie Honor übernommen . Apple hat außerdem einen ChatGPT-gesteuerten Apple Intelligence-Stack auf Millionen von iPhones und Macs eingeführt undeinen Vertrag mit Alibaba unterzeichnet, um diese Funktionen in China anzubieten.

xAI hat für Grok noch keinen solchen Abnehmer gefunden. Das ist derzeit die größte Herausforderung für xAI, und es wäre interessant zu sehen, welche Marken es einbinden kann, um Grok-3 mit all seinem Schnickschnack in den Mainstream zu bringen.