Plötzlich! DeepSeek wurde von den Vereinigten Staaten als „Diebstahl“ angeklagt und von OpenAI und Microsoft untersucht. Das Papier enthüllte, dass es den Burggraben von Nvidia durchbrochen hat.

Während des Frühlingsfestes schlägt ein Sturm um Deepseek hohe Wellen im KI-Kreis.

Laut dem neuesten Bericht von Bloomberg entdeckten Microsoft-Sicherheitsforscher im vergangenen Herbst, dass Personen, die möglicherweise mit DeepSeek in Verbindung stehen, groß angelegte Datenextraktionen über die OpenAI-API durchführten.

Laut mit der Angelegenheit vertrauten Personen hat Microsoft als Technologiepartner und größter Geldgeber von OpenAI OpenAI sofort benachrichtigt, nachdem es die Situation entdeckt hatte.

Plötzlich! DeepSeek wurde von den Vereinigten Staaten als „Diebstahl“ angeklagt und von OpenAI und Microsoft untersucht. Das Papier enthüllte, dass es den Burggraben von Nvidia durchbrochen hat. - 1 16

Berichten zufolge verstößt dieses Verhalten möglicherweise gegen die Nutzungsbedingungen von OpenAI. Denn in den Nutzungsbedingungen von OpenAI heißt es eindeutig, dass Benutzer ohne Genehmigung keine automatisierten oder programmatischen Methoden verwenden dürfen, um Daten aus seinem Dienst zu extrahieren.

Selbst wenn DeepSeek irgendeine Form von API-Zugriff erhält, kann dies als Verstoß gegen die Nutzungsbedingungen angesehen werden, wenn es in einer Weise verwendet wird, die über den Rahmen der Autorisierung von OpenAI hinausgeht, beispielsweise für illegale oder nicht autorisierte kommerzielle Zwecke.

OpenAI antwortete nicht auf Anfragen nach Kommentaren, Microsoft lehnte eine Stellungnahme ab und DeepSeek hat noch nicht geantwortet.

Es ist erwähnenswert, dass viele Außenstehende zuvor glaubten, dass DeepSeek möglicherweise die Ausgabedaten von Modellen wie ChatGPT während des Trainingsprozesses als Schulungsmaterial verwendet hat. Durch die Modelldestillationstechnologie wurde das „Wissen“ in diesen Daten auf das eigene Modell von DeepSeek übertragen.

Diese Praxis ist im KI-Bereich nicht ungewöhnlich, Skeptiker sind jedoch besorgt darüber, ob DeepSeek die Ausgabedaten des OpenAI-Modells ohne vollständige Offenlegung verwendet hat. Dies scheint sich im Selbstbewusstsein von DeepSeek-V3 widerzuspiegeln.

Plötzlich! DeepSeek wurde von den Vereinigten Staaten als „Diebstahl“ angeklagt und von OpenAI und Microsoft untersucht. Das Papier enthüllte, dass es den Burggraben von Nvidia durchbrochen hat. - 2 16

Im technischen Bericht des neuesten Modells R1 machte das DeepSeek-Team deutlich, dass die Ausgabedaten des OpenAI-Modells nicht verwendet wurden, und gab an, dass eine hohe Leistung durch verstärkendes Lernen und eine einzigartige Trainingsstrategie erreicht wurde.

Beispielsweise wird eine mehrstufige Trainingsmethode angewendet, die grundlegendes Modelltraining, RL-Training (Reinforcement Learning), Feinabstimmung usw. umfasst. Diese mehrstufige zyklische Trainingsmethode hilft dem Modell, in verschiedenen Phasen unterschiedliche Kenntnisse und Fähigkeiten zu absorbieren.

Frühere Benutzer stellten fest, dass sich ein Modell bei der Frage nach der Identität eines Modells mit GPT-4 verwechselte.

Der Bloomberg-Bericht wies auch darauf hin, dass David Sacks, der Leiter der US-amerikanischen KI-Angelegenheiten, kürzlich in einem Interview mit Fox News sagte, dass es „schlüssige Beweise“ dafür gebe, dass DeepSeek die Ausgabedaten des OpenAI-Modells zur Entwicklung seiner eigenen Technologie verwende. Sacks legte jedoch keine konkreten Beweise vor.

Viele US-Beamte haben außerdem erklärt, dass DeepSeek des „Diebstahls“ verdächtigt wird, und leiten eine nationale Sicherheitsuntersuchung zu seinen Auswirkungen ein.

Plötzlich! DeepSeek wurde von den Vereinigten Staaten als „Diebstahl“ angeklagt und von OpenAI und Microsoft untersucht. Das Papier enthüllte, dass es den Burggraben von Nvidia durchbrochen hat. - 3 17

Auf die Bemerkungen von David Sacks reagierte OpenAI relativ konservativ und vorsichtig. Sein Sprecher sagte: „Wir wissen, dass Unternehmen aus China sowie einige andere Unternehmen versucht haben, die Modelle führender amerikanischer KI-Unternehmen zu ‚destillieren‘.“

Der Sprecher betonte, dass OpenAI als führender Anbieter im Bereich KI entsprechende Gegenmaßnahmen zum Schutz seines geistigen Eigentums ergriffen habe, darunter eine strenge Überprüfung modernster Fähigkeiten und die Entscheidung, welche Funktionen öffentlich freigegeben werden können. Sie glauben, dass eine enge Zusammenarbeit mit der US-Regierung für den Schutz modernster KI-Modelle von entscheidender Bedeutung ist.

Während diese Kontroverse jedoch weiter schwelt, richtet sich die Aufmerksamkeit ausländischer Medien auch auf das zuvor von DeepSeek veröffentlichte Open-Source-V3-Modell, das in einem technischen Bericht auch die relevanten detaillierten zugrunde liegenden Optimierungsdetails detailliert offenlegte.

Ausländische Medien enthüllten, dass die Entwicklung des V3-Modells sogar CUDA umging und durch die Optimierung der Low-Level-Assemblersprache PTX der NVIDIA GPU maximale Leistung erreichte.

Plötzlich! DeepSeek wurde von den Vereinigten Staaten als „Diebstahl“ angeklagt und von OpenAI und Microsoft untersucht. Das Papier enthüllte, dass es den Burggraben von Nvidia durchbrochen hat. - 4 12

PTX ist eine Zwischenbefehlssatzarchitektur für NVIDIA-GPUs, die feinkörnige Optimierungen wie Registerzuordnung und Thread-/Warp-Level-Anpassung ermöglicht. Wenn CUDA eine „Hochsprache“ ist, die mit NVIDIA-GPUs kommuniziert, dann ist PTX wie eine „Maschinensprache auf niedriger Ebene“.

Stellen Sie sich vor, Sie spielen eine Spielekonsole. Normalerweise müssen wir zum Spielen nur einen Controller (wie CUDA) verwenden, was sehr praktisch ist, aber möglicherweise nicht die volle Stärke der Spielekonsole nutzen kann.

Der PTX ist so, als würde man die hintere Abdeckung der Spielekonsole öffnen und die verschiedenen Zubehörteile und Schaltkreise im Inneren direkt anpassen. Obwohl dies kompliziert ist und viel Fachwissen erfordert, kann es dazu führen, dass die Spielekonsole schneller läuft und eine bessere Leistung erbringt.

Plötzlich! DeepSeek wurde von den Vereinigten Staaten als „Diebstahl“ angeklagt und von OpenAI und Microsoft untersucht. Das Papier enthüllte, dass es den Burggraben von Nvidia durchbrochen hat. - 5 13

Einfach ausgedrückt ist PTX ein Tool, mit dem Entwickler den Deckel der GPU „anheben“ und ihr Innenleben direkt optimieren können. Es ist, als würde man ein Auto umbauen: Anstatt einfach aufs Gaspedal zu treten, stimmt man jeden Teil des Motors direkt ab, um maximale Leistung herauszuholen.

Als DeepSeek das V3-Modell trainierte, wurde die H800-GPU neu konfiguriert, einschließlich der Aufteilung von 20 SMs für die Kommunikation zwischen Servern und der Implementierung eines erweiterten Pipeline-Algorithmus. Die Optimierungsmöglichkeiten gingen weit über das herkömmliche CUDA-Entwicklungsniveau hinaus. Wenn diese Technologie wahr ist, wird sie auch den Hardware-Graben aufrütteln, den Nvidia seit langem aufgebaut hat.

Plötzlich! DeepSeek wurde von den Vereinigten Staaten als „Diebstahl“ angeklagt und von OpenAI und Microsoft untersucht. Das Papier enthüllte, dass es den Burggraben von Nvidia durchbrochen hat. - 6 8

▲Bild-Screenshot aus dem technischen Bericht von DeepSeek v3

Doch obwohl PTX eine extremere Leistungsoptimierung bringen kann, stellt es auch extrem hohe Anforderungen an das Entwicklungsteam. Im Gegensatz dazu ist NVIDIAs Moat-CUDA für die meisten Entwickler immer noch die erste Wahl, da es die Vorteile einer einfachen Entwicklung und einer schnellen Iteration bietet.

Darüber hinaus erfordert die PTX-Optimierung häufig eine Anpassung an ein bestimmtes Hardwaremodell.

Obwohl diese „maßgeschneiderte“ Optimierungsstrategie effektiv ist, erhöht sie auch die Entwicklungsschwierigkeiten und Wartungskosten erheblich. Dies erklärt auch, warum CUDA auf absehbare Zeit weiterhin die Mainstream-Entwicklung dominieren wird.

Allerdings ist die Suche nach Durchbrüchen außerhalb der bestehenden Regeln oft der Beginn einer Subversion. Es ist zu erwarten, dass die von DeepSeek im In- und Ausland ausgelöste Technologiewelle diesmal die bestehende Ordnung der gesamten KI-Industriekette ausnutzt.

# Willkommen beim offiziellen öffentlichen WeChat-Konto von Aifaner: Aifaner (WeChat-ID: ifanr) wird Ihnen so schnell wie möglich zur Verfügung gestellt.

Ai Faner |. Ursprünglicher Link · Kommentare anzeigen · Sina Weibo