DeepSeek: Alles, was Sie über die KI wissen müssen, die ChatGPT entthront hat

Januar 28, 2025 Eskere Guru

Ein einjähriges Startup aus China erobert die KI-Branche im Sturm, nachdem es einen Chatbot veröffentlicht hat, der mit der Leistung von ChatGPT mithalten kann und dabei nur einen Bruchteil der Strom-, Kühlungs- und Schulungskosten verbraucht, die die Systeme von OpenAI, Google und Anthropic erfordern. Hier finden Sie alles, was Sie über die V3- und R1-Modelle von Deepseek wissen müssen und warum das Unternehmen Amerikas KI-Ambitionen grundlegend auf den Kopf stellen könnte.

Was ist DeepSeek?

DeepSeek (technisch gesehen „Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.“) ist ein chinesisches KI-Startup, das ursprünglich im April 2023 als KI-Labor für seine Muttergesellschaft High-Flyer gegründet wurde. Im Mai dieses Jahres gründete DeepSeek wurde in ein eigenes Unternehmen ausgegliedert (wobei High-Flyer als Investor blieb) und veröffentlichte auch sein DeepSeek-V2-Modell. V2 bot eine Leistung, die der anderer führender chinesischer KI-Unternehmen wie ByteDance, Tencent und Baidu ebenbürtig war, jedoch zu deutlich geringeren Betriebskosten.

Das Unternehmen folgte mit der Veröffentlichung von V3 im Dezember 2024. V3 ist ein Modell mit 671 Milliarden Parametern, dessen Training Berichten zufolge weniger als zwei Monate dauerte . Laut einer aktuellen Analyse von Jeffries betragen die Schulungskosten von DeepSeek außerdem „nur 5,6 Mio. US-Dollar (bei angenommenen Mietkosten von 2 US-Dollar pro 800 Stunden). Das sind weniger als 10 % der Kosten für Metas Lama.“ Das ist ein winziger Bruchteil der Hunderte Millionen bis Milliarden Dollar, die US-Firmen wie Google, Microsoft, xAI und OpenAI für die Schulung ihrer Modelle ausgegeben haben.

Wir stellen DeepSeek-V3 vor!
Bisher größter Sprung nach vorne:
⚡ 60 Token/Sekunde (3x schneller als V2!)
Erweiterte Funktionen
API-Kompatibilität intakt
Vollständig Open-Source-Modelle & Papiere
1/n pic.twitter.com/p1dV9gJ2Sd
– DeepSeek (@deepseek_ai) 26. Dezember 2024

Benchmark-Tests ergaben, dass die Leistung von V3 mit GPT-4o und Claude 3.5 Sonnet vergleichbar ist. Ein Kommentar in The Hill vom Dezember 2024 kategorisierte den Erfolg von DeepSeek als Amerikas „Sputnik-Moment“.

DeepSeek veröffentlichte im November 2024 sein R1-Lite-Preview-Modell und behauptete, dass das neue Modell die o1-Familie von Argumentationsmodellen von OpenAI übertreffen könnte (und das zu einem Bruchteil des Preises). Das Unternehmen schätzt, dass der Betrieb des R1-Modells je nach Aufgabe zwischen 20 und 50 Mal günstiger ist als der o1 von OpenAI. Anschließend veröffentlichte DeepSeek im Januar 2025 DeepSeek-R1 und DeepSeek-R1-Zero. Das R1-Modell ist im Gegensatz zu seinem Konkurrenten o1 Open Source, was bedeutet, dass es von jedem Entwickler verwendet werden kann.

Daher erfreuen sich V3 und R1 seit ihrer Veröffentlichung einer explosionsartigen Beliebtheit, wobei der auf V3 basierende KI-Assistent von DeepSeek ChatGPT an der Spitze der App-Stores verdrängt hat . Der Risikokapitalgeber Marc Andreesen bezeichnete den Chatbot von DeepSeek in einem aktuellen Social-Media-Beitrag als „einen der erstaunlichsten und beeindruckendsten Durchbrüche, die ich je gesehen habe“ und als „tiefgreifendes Geschenk an die Welt“.

Was kann DeepSeek?

Als Open-Source-Modell für große Sprachen können die Chatbots von DeepSeek im Wesentlichen alles tun, was ChatGPT, Gemini und Claude können. Dazu gehört die Text-, Audio-, Bild- und Videogenerierung. Darüber hinaus übertrifft die neu veröffentlichte Familie multimodaler Modelle von DeepSeek mit dem Namen Janus Pro Berichten zufolge DALL-E 3 sowie PixArt-alpha, Emu3-Gen und Stable Diffusion XL bei zwei Branchen-Benchmarks. DeepSeek-R1 ist im Gegensatz zu o1 speziell darauf ausgelegt, komplexe Denkaufgaben auszuführen, dabei Schritt-für-Schritt-Lösungen für Probleme zu generieren und „logische Gedankenketten“ zu etablieren, in denen es den Denkprozess bei der Lösung eines Problems Schritt für Schritt erklärt .

Oh Junge #deepseek
– Alexios Mantzarlis (@mantzarlis.com) 27.01.2025T16:50:40.640Z

Was die Produkte von DeepSeek nicht können, ist über den Platz des Himmlischen Friedens zu sprechen. Oder die Proteste des Gelben Regenschirms. Oder Präsident Xi Jinpings Ähnlichkeit mit Winnie the Pooh. Grundsätzlich gilt: Wenn es sich um ein Thema handelt, das von der Kommunistischen Partei Chinas als verboten erachtet wird, werden die Chatbots von DeepSeek es nicht ansprechen oder sich in irgendeiner sinnvollen Weise darauf einlassen.

Wer kann DeepSeek nutzen?

Vorübergehendes Anmeldeverbot für DeepSeek — Andrew Tarantola / DeepSeek / Digitale Trends

Als Open-Source-LLM kann das DeepSeek-Modell von jedem Entwickler kostenlos genutzt werden. OpenAI berechnet 200 US-Dollar pro Monat für das Pro-Abonnement, das für den Zugriff auf o1 erforderlich ist. Die Modelle von DeepSeek sind im Internet, über die API des Unternehmens und über mobile Apps verfügbar. Sie müssen sich für ein kostenloses Konto auf der DeepSeek-Website anmelden, um es nutzen zu können. Das Unternehmen hat jedoch als Reaktion auf „groß angelegte böswillige Angriffe auf die Dienste von DeepSeek“ vorübergehend neue Anmeldungen ausgesetzt . Bestehende Benutzer können sich anmelden und die Plattform wie gewohnt nutzen. Es gibt jedoch noch keine Informationen darüber, wann neue Benutzer DeepSeek selbst ausprobieren können.

Warum ist DeepSeek plötzlich so eine große Sache?

Seit der Veröffentlichung von ChatGPT im November 2023 konzentrieren sich amerikanische KI-Unternehmen stark auf die Entwicklung größerer, leistungsfähigerer, expansiverer, leistungsfähigerer und ressourcenintensiverer großer Sprachmodelle. Anstatt zu versuchen, kostengünstigere und energieeffizientere LLMs zu bauen, hielten es Unternehmen wie OpenAI, Microsoft, Anthropic und Google stattdessen für angebracht, die Weiterentwicklung der Technologie einfach mit brutaler Gewalt voranzutreiben, indem sie in amerikanischer Tradition einfach absurde Mengen an Geld und Ressourcen hineinwarfen am Problem. Allein im Jahr 2024 wird erwartet, dass Elon Musk, CEO von xAI, persönlich mehr als 10 Milliarden US-Dollar für KI-Initiativen ausgeben wird. OpenAI und seine Partner haben gerade eine 500-Milliarden-Dollar-Project-Stargate-Initiative angekündigt, die den Bau grüner Energieversorger und KI-Rechenzentren in den gesamten USA drastisch beschleunigen würde. Laut CEO Sundar Pichai plant Google, der Skalierung der Gemini-Plattform im Laufe des Jahres 2025 Priorität einzuräumen , und wird voraussichtlich in diesem Jahr Milliarden ausgeben, um dieses Ziel zu erreichen. Meta gab Mitte Januar bekannt, dass es in diesem Jahr bis zu 65 Milliarden US-Dollar für die KI-Entwicklung ausgeben werde.

DeepSeek hat der Welt gerade gezeigt, dass nichts davon wirklich notwendig ist – dass der „KI-Boom“, der in den letzten Monaten die amerikanische Wirtschaft angekurbelt hat und GPU-Unternehmen wie Nvidia exponentiell reicher gemacht hat, als sie es im Oktober 2023 waren, möglicherweise der Fall ist nichts weiter als eine Täuschung. Es stellt auch in Frage, wie groß der Vorsprung der USA tatsächlich im Bereich KI ist, obwohl sie im vergangenen Jahr wiederholt die Lieferung von Spitzen-GPUs nach China verboten haben .

„Unter dem Strich ist die Outperformance der USA auf Technologie und den Vorsprung zurückzuführen, den US-Unternehmen bei KI haben“, sagte Keith Lerner, Analyst bei Truist, gegenüber CNN . „Die Einführung des DeepSeek-Modells führt dazu, dass Investoren sich fragen, welchen Vorsprung US-Unternehmen haben und wie viel ausgegeben wird und ob diese Ausgaben zu Gewinnen (oder Mehrausgaben) führen werden.“

Kurz gesagt, DeepSeek hat die amerikanische KI-Branche einfach mit seinen eigenen Mitteln geschlagen und zeigt damit, dass das aktuelle Mantra „Wachstum um jeden Preis“ nicht mehr gültig ist. „DeepSeek hat offensichtlich nicht so viel Rechenleistung wie US-amerikanische Hyperscaler und hat es irgendwie geschafft, ein Modell zu entwickeln, das äußerst wettbewerbsfähig erscheint“, sagte Srini Pajjuri, Halbleiteranalyst bei Raymond James, gegenüber CNBC . Wenn ein chinesisches Startup ein KI-Modell entwickeln kann, das genauso gut funktioniert wie das neueste und beste von OpenAI, und das in weniger als zwei Monaten und für weniger als 6 Millionen US-Dollar, welchen Nutzen hat dann Sam Altman noch?

„Die Zeit wird zeigen, ob die DeepSeek-Bedrohung real ist – der Wettlauf darüber, welche Technologie funktioniert und wie die großen westlichen Player reagieren und sich weiterentwickeln werden, ist im Gange“, sagte Michael Block, Marktstratege bei Third Seven Capital, gegenüber CNN. „Die Märkte waren zu Beginn der Trump-2.0-Ära zu selbstgefällig geworden und suchten möglicherweise nach einem Vorwand, sich zurückzuziehen – und hier haben sie einen großartigen gefunden.“