DeepSeek hat einen neuen Konkurrenten und Sie können es jetzt ausprobieren
Alibaba hat gerade sein neuestes Argumentationsmodell vorgestellt, und es scheint, dass DeepSeek und OpenAI Grund zur Sorge haben könnten – zumindest wenn sich alle Versprechen von Alibaba als wahr erweisen. Es ist Open Source, also habe ich es mir angesehen. Sie können es auch kostenlos ausprobieren. Es überrascht jedoch nicht, dass Sie feststellen werden, dass es einige Dinge gibt, über die es Sie nicht ansprechen wird.
Das neue Modell mit dem Namen QwQ-32b (Quan-with-Questions) läuft mit viel weniger Parametern, was bedeutet, dass es weniger Ressourcen benötigt, aber Alibaba behauptet, dass es auf dem gleichen Niveau wie DeepSeek oder OpenAIs o1-mini leistungsfähig ist.
Das R1 Large Language Model (LLM) von DeepSeek war Anfang Februar der letzte Schrei, als es auf den Markt kam und plötzlich in der Lage war, mit dem goldenen Standard von ChatGPT und anderen Alternativen mitzuhalten, allerdings zu viel geringeren Kosten. Es scheint, dass Alibaba hier noch weiter an die Grenzen gehen könnte.

Wie von VentureBeat erklärt, benötigt DeepSeek-R1 zum Ausführen 671 Milliarden Parameter, von denen 37 Milliarden aktiviert sind. Mittlerweile kommt Alibabas neuer QwQ-32b mit 32 Milliarden Parametern aus. Diese Zahlen sind für viele völlig abstrakt, aber es gibt einen großen Unterschied in der Rechenleistung; Während DeepSeek R1 zum Betrieb 1600 GB VRAM benötigt, kommt QwQ-32b mit nur 24 GB VRAM aus. In den meisten Fällen handelt es sich dabei um Nvidias H100 oder gleichwertige Modelle, aber selbst die auf Spiele ausgelegte RTX 4090 verfügt über 24 GB. Mit der neuesten RTX 5090 sind es 32 GB.
Alibabas QwQ-32b ist unter einer Apache 2.0-Lizenz verfügbar, was bedeutet, dass Unternehmen und Forscher es nutzen können. Noch wichtiger ist, dass wir es nutzen können, indem wir Alibabas Qwen Chat ausprobieren. Wie DeepSeek bringt es einige Einschränkungen mit sich, bietet aber auch ein paar unmittelbare Vorteile, die mir ziemlich schnell aufgefallen sind.
Es scheint selbst auf schnelle, einfache Fragen recht ausführliche Antworten zu geben. Das kann gut sein, aber in gewisser Weise war es vor allem ärgerlich, da es Ihnen eine Menge unnötigen Kontext liefert, nach dem Sie nicht gefragt haben. Mir gefällt jedoch, dass es Ihnen den gesamten Denkprozess zeigt, der der Deep Thinking-Funktion von ChatGPT ähnelt – aber mit viel weniger Tiefe.
Wenn man ihn zu politischen Themen befragt, bezeichnet Qwen Chat dies als unangemessen. Es könnte Möglichkeiten geben, es zu jailbreaken – mit DeepSeek war das schließlich möglich –, aber ich habe es bisher noch nicht geschafft.
Ob sich Alibabas Behauptungen als wahr erweisen, bleibt abzuwarten, aber es sieht so aus, als hätten ChatGPT und DeepSeek nun einen neuen Rivalen.