Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - NVIDIA SIGGRAPH 2023

Jedes Jahr im August wird Nvidia auf der SIGGRAPH, der weltweit wichtigsten Computergrafikkonferenz, seine „Muskeln“ unter Beweis stellen.

Vor fünf Jahren veröffentlichte Nvidia-CEO Huang Renxun auf der SIGGRAPH 2018 die Quadro RTX, die erste Grafikkarte, die Raytracing unterstützt. Dies ist Nvidias wichtigstes Produkt seit dem G80 und brachte Nvidia-GPUs von der GTX-Ära in die RTX-Ära.

Zu diesem Zeitpunkt war Nvidia noch ein reiner Hersteller von Grafikchips und beschäftigte sich mit der Frage, wie man die 3D-Wiedergabe auf die Spitze treiben könnte. Sein Marktwert betrug etwa 81,4 Milliarden US-Dollar und hatte den 100-Milliarden-Club noch nicht erreicht .

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - 1 24

Doch bis 2023 hat Nvidia einen radikalen Wandel erlebt. Nachdem Lao Huang auf der GTC-Konferenz im März den goldenen Satz „AIs iPhone-Zeit ist gekommen“ verkündete, begann der Aktienkurs von Nvidia stetig zu steigen und erreichte ständig neue historische Höchststände.

In den letzten fünf Jahren ist der Aktienkurs von Nvidia fast um das Zehnfache gestiegen, und sein aktueller Marktwert hat 1,1 Billionen US-Dollar überschritten. Damit ist Nvidia das weltweit erste Chipunternehmen mit einem Marktwert von über einer Billion US-Dollar und die fünftgrößte Technologieaktie in den USA Aktienmarkt.

Die Grafikkarten von Nvidia erfreuen sich immer noch großer Beliebtheit auf dem Markt, doch nun sind es nicht mehr die Gamer, die dem ultimativen Bild nachjagen, sondern Technologiegiganten wie Microsoft und Meta, die begierig darauf sind, große Modelle einzusetzen und zu trainieren.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - sigg 23 photography social size keynote image 12 1600x900 1

Beim SIGGRAPH 2023 gestern Abend fiel es Ihnen schwer, Lao Huang bekannte Schlüsselwörter wie Spiele, Echtzeit-Rendering und 3D aussprechen zu hören und sie durch Konzepte wie generative KI, Rechenzentren und beschleunigtes Rechnen zu ersetzen.

Dies ist ein neues Nvidia und eine neue Ära.

Nvidia hat sich verändert

Um welche Art von Unternehmen es sich hierbei handelt, können wir dem Finanzbericht von Nvidia entnehmen.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - number

Das Spielegeschäft war lange Zeit das Hauptgeschäft von Nvidia. Bis zum ersten Geschäftsquartal 2023, unter dem doppelten Einfluss des Konsumrückgangs im PC-Markt und des Anstiegs im KI-Computing, erholte sich schließlich das Rechenzentrumsgeschäft von Nvidia auf und wurde Nvidias Nr. 1. Dies markiert auch die offizielle Transformation von Nvidia von einem traditionellen GPU-Anbieter zu einem der weltweit größten Anbieter von Rechenleistung.

Danach begannen die Rechenzentren von Nvidia in die Höhe zu schießen, und seine H100-, A100- und andere Computergrafikkarten wurden in der KI-Branche zu harter Währung, und es herrschte zeitweise ein ernsthafter Mangel. Einige Analysten spekulieren, dass die Welt möglicherweise 432.000 H100 benötigt, um die Marktnachfrage zu decken.

Der jüngste vierteljährliche Finanzbericht von Nvidia zeigt, dass der Umsatz aus dem Rechenzentrumsgeschäft von Nvidia dank der starken Nachfrage von Unternehmen im ersten Quartal etwa 4,2 Milliarden betrug, was einer Steigerung von 14 % gegenüber dem Vorjahr und einer Steigerung von 18 % gegenüber dem Vormonat entspricht Die Erwartungen der Wall Street.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - screenshot00 176

Aber wenn Sie glauben, Nvidia sei nur der Glückliche, der zufällig von der KI-Geldbörse getroffen wurde, dann unterschätzen Sie Lao Huang.

Für Nvidia sind der Bau einer „Atombomben-GPU“ und die Investition in KI lediglich „Vorbereitungsarbeiten“ zur Verwirklichung ihrer ultimativen Vision. Was Nvidia wirklich tun möchte, ist der Aufbau eines echten Metaversums.

Die fortschrittlichste „Hacke“

Wenn ein Arbeiter gute Arbeit leisten will, muss er zuerst seine Werkzeuge schärfen, und Nvidia versteht das sehr gut.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - 1d0b7a86 1beb 49fd 926b ef3969745fcd

Im März dieses Jahres veröffentlichte Nvidia vier KI-Inferenzchips, H100 NVL GPU, L4 Tensor Core GPU, L40 GPU und NVIDIA Grace Hopper, um den wachsenden Rechenleistungsbedarf von Unternehmen zu decken.

Auf der Taipei Computer Show im Mai stellte Lao Huang den Supercomputer DGX GH200 vor, der aus 256 NVIDIA GH200 Grace Hopper-Superchips besteht.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - NVIDIA Jensen Huang SIGGRAPH 2023

Und erst gestern hat Lao Huang eine neue Version der GH200 veröffentlicht, die mit HBM3e-Speicher ausgestattet ist. Selbst die vorherige Generation der GH200 wurde noch nicht offiziell ausgeliefert, und die Aktualisierungsgeschwindigkeit ist beängstigend.

Die Unterschiede zwischen der alten und neuen GH200 liegen hauptsächlich im Speicher.

Der GH200 Grace Hopper ist der weltweit erste GPU-Chip mit HBM3e-Speicher, einer 50-prozentigen Steigerung der Speicherkapazität von 96 GB auf 144 GB pro GPU.

HBM3e-Speicher ist eine neue Art von Speichertechnologie mit hoher Bandbreite. In Bezug auf die Rechengeschwindigkeit kann HBM3e 50 % schneller sein als die HBM3-Rechengeschwindigkeit und bietet eine maximale Übertragungsrate von 5 TB/s. Dadurch kann die neue Version des GH200 KI-Modelle 3,5-mal schneller ausführen als aktuelle Modelle.

Unter anderem kann der GH200-Speicher mit Dual-Konfiguration 282 GB HBM3e-Speicher erreichen, was einer 3,5-fachen Steigerung der Kapazität und einer 3-fachen Steigerung der Bandbreite im Vergleich zur vorherigen Generation entspricht. Im Vergleich zum beliebten H100 ist der Speicher um das 1,7-fache und die Bandbreite um das 1,5-fache gestiegen.

Wie die Vorgängergeneration verfügt auch die neue GH200 über eine übertriebene Skalierbarkeit.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - 2023 08 09 14 03 02.2023 08 09 14 08 51

Dank der NVLink-Verbindungstechnologie von Nvidia kann der GH200 je nach den Anforderungen von Unternehmen in Formen unterschiedlicher Größe kombiniert werden, z. B. als Einzelkarten-, Doppelkarten- oder Mehrkartenserver, Schränke und sogar Supercomputer.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - nvidia dgx gh200

Letztendlich können die GH200s zum 256-Karten-Supercomputer DGX GH200 SuperPod kombiniert werden, der über 144 TB schnellen Speicher verfügt und 1018 Gleitkommaoperationen pro Sekunde ausführen kann.

Wem das nicht reicht, der kann auch mehrere Nvidia DGX GH200 SuperPods mit einem Nvidia Quantum-2 InfiniBand Switch verbinden.

Lao Huang sagte scherzhaft: „Das sollte „Crysis“ bewegen können.“

Die starke Erweiterbarkeit bietet unbegrenzte Möglichkeiten für die Zukunft des GH200.

Mit anderen Worten: Wenn Sie die Rechengeschwindigkeit erhöhen möchten, müssen Sie lediglich weitere Serverschränke hinzufügen. Dies ist in Zukunft sehr vorteilhaft. Huang Renxun glaubt, dass das typische Anwendungsszenario von GH200 in der Zukunft das große Sprachmodell ist und „beschleunigtes Rechnen“ und „KI-Computing“ nach und nach das „allgemeine Computing“ herkömmlicher x86-GPUs ersetzen werden.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - screenshot00 174

Beispielsweise war es mit dem Budget von 100 Millionen US-Dollar in der Vergangenheit nur möglich, ein kleines Rechenzentrum zu bauen, 800 x86-GPUs zu kaufen und für den Betrieb 5 Megawatt Strom zu verbrauchen.

Aber mit dem gleichen Budget muss Grace Hopper, der sich für beschleunigtes Rechnen entscheidet, nur 3 Megawatt Strom verbrauchen, und der Datendurchsatz kann um eine Größenordnung gesteigert werden. Und wenn der Berechnung der gleiche Arbeitsaufwand zugrunde liegt, benötigt der Berechnungsplan von Grace Hopper nur 8 Millionen US-Dollar.

Als Lao Huang darüber sprach, brachte er sein berühmtes Sprichwort zum Ausdruck: „Je mehr Sie kaufen, desto mehr sparen Sie.“

Beamte gehen davon aus, dass die Markteinführung des neuen GH200 bis zum zweiten Quartal 2024 warten muss. Die Auslieferung der mit HBM3-Speicher ausgestatteten GH200 erfolgt wie ursprünglich geplant in der zweiten Jahreshälfte.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - rtx workstation image

Natürlich ist es für einzelne Entwickler und kleine Teams nicht realistisch, ein Rechenzentrum im Wert von Hunderten Millionen zu bauen. Aus diesem Grund hat Nvidia „intim“ eine neue Generation von Workstation-Grafikkarten auf den Markt gebracht, die fortschrittliche RTX-Technologie integrieren: NVIDIA RTX 5000 , NVIDIA RTX 4500 und NVIDIA RTX 4000.

Unter anderem übernimmt NVIDIA RTX 5000 als Flaggschiff-GPU den Tensor Core der 4. Generation und den RT Core der 3. Generation. 32 GB GDDR6-Videospeicher, unterstützt ECC-Fehlerprüfung, geeignet für High-End-Workstations, Rechenzentren und Cloud-Gaming.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - rtx 5000 ada generation gpu

Als GPU der mittleren bis oberen Preisklasse ist die NVIDIA RTX 4500 mit 24 GB GDDR6-Videospeicher ausgestattet und unterstützt auch die ECC-Verifizierung.

Im Vergleich zur vorherigen Produktgeneration verdoppelt NVIDIA RTX 4500 die Leistung des Raytracings und verdoppelt die Leistung der KI-Verarbeitung.

NVIDIA RTX 4000 verwendet den gleichen GPU-Kern wie RTX 4500, ist mit 20 GB GDDR6-Videospeicher ausgestattet und seine Raytracing- und KI-Rechenleistung wurde erheblich verbessert.

Die neue NVIDIA RTX 5000-GPU ist derzeit im Verkauf und die NVIDIA RTX 4500- und RTX 4000-GPUs werden in der zweiten Hälfte dieses Jahres ausgeliefert.

Das fruchtbarste „Land“

Mit den Werbeworten von Nongfu Spring können wir Nvidias neueste KI-Strategie wie folgt vorstellen:

Wir produzieren keine KI, wir sind nur KI-Träger.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - nvidia AI workbench 04

Wie wir alle wissen, ist die lokale Konfiguration von KI-Modellen eine mühsame und komplizierte Aufgabe. Um Entwicklern bei der Lösung dieses Problems zu helfen, kündigte Lao Huang an, dass Nvidia „AI Workbench“ auf den Markt bringen wird.

Vereinfacht ausgedrückt kann AI Workbench Entwicklern das Framework, das Tool Development Kit und andere Umgebungen zur Verfügung stellen, die sie zum Konfigurieren von KI-Modellen aus einer Hand benötigen, und sie können direkt mit der Erstellung von Projekten beginnen.

Lao Huang gab vor Ort ein sehr anschauliches Beispiel.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - screenshot00 170

Beispielsweise muss das Unternehmen ein Stable Diffusion-Modell zum Malen konfigurieren, aber Sie verfügen weder über Hardware noch wissen Sie, wie das Modell konfiguriert wird.

Keine Sorge, zu diesem Zeitpunkt müssen Sie nur AI Workbench öffnen, eine Cloud-Workstation mit 4 RTX 6000 Ada-GPUs auswählen und dann können Sie das Stable Diffusion-Modell mit einem Klick konfigurieren.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - screenshot00 172

Wenn Sie mit den generierten Bildern nicht zufrieden sind, können Sie die Bilder auch selbst hochladen, das Modell neu trainieren und erneut generieren.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - screenshot00 171

In weniger als einer Minute wird ein anständiges Bild erstellt, und Sie müssen sich während des gesamten Prozesses nicht um andere Probleme kümmern, da AI Workbench bereits alles Weitere vorbereitet hat.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - NVIDIA Hugging Face logos image 0823

Nvidia kündigte an, eine strategische Partnerschaft mit Hugging Face, einer Open-Source-KI-Plattform, einzugehen und diese Technologie auf die Unternehmensseite anzuwenden.

Mit nur wenigen einfachen Klicks in der Hugging Face-Plattform können Entwickler generative KI-Projekte ganz einfach von Laptops auf Workstations und dann in Rechenzentren oder Clouds verschieben und schließlich NVIDIA DGX Cloud AI Supercomputing-Ressourcen zum Trainieren von KI-Modellen nutzen.

Lao Huang betonte, dass Nvidias fortschrittlichste KI-Technologie durch die Zusammenarbeit mit Hugging Face alle Lebensbereiche unterstützen kann. Unternehmen können auch die Leistungsfähigkeit der Open-Source-Community nutzen, um KI-Schulungen entsprechend den Planungsanforderungen des Unternehmens zu fördern.

Größter Traum"

Nachdem er das Update der Software- und Hardwareplattform vorgestellt hatte, sagte Lao Huang mit einem langen Atemzug: „Lassen Sie uns heute Abend über das wichtigste Thema sprechen – OpenUSD.“

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - openusd002

OpenUSD dürfte für die meisten Menschen ein unbekannter Begriff sein. OpenUSD ist ein Open-Source-Framework von Pixar (ja, dem Pixar, der die Animation erstellt hat) im Jahr 2015. Davor hat Pixar dieses Framework mehr als 10 Jahre lang verwendet. Viele Animationen, die wir gesehen haben, basieren auf dem OpenUSD-Framework.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - Alliance for OpenUSD

OpenUSD kann als universeller Standard für die Erstellung von 3D-Welten zur Beschreibung, Kombination, Simulation und Zusammenarbeit verstanden werden. Huang verglich es mit „der Bedeutung von HTML für 2D-Webseiten“ und „wirklich die ganze Welt zusammenbringen“.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - 169095778013x640 375

Erst letzte Woche gaben Pixar, Adobe, Apple, Autodesk, Nvidia und JDF die Gründung der OpenUSD Alliance (AOUSD) bekannt, um die Standardisierung, Entwicklung, Weiterentwicklung und das Wachstum von OpenUSD zu fördern.

Warum vereint dieser wenig bekannte Name so viele große Unternehmen in verschiedenen Bereichen? Es beginnt mit dem Arbeitsablauf der 3D-Arbeit.

3D-Arbeitsabläufe sind sehr granular und komplex, z. B. sind Designer, Künstler und Ingenieure alle auf einen bestimmten Teil des 3D-Arbeitsablaufs spezialisiert, z. B. Modellierung, Texturierung, Materialien, physikalische Simulation, Animation, Bühnenbild und Compositing.

Da die von ihnen verwendeten Tools (PS, AutoCAD, Blender usw.) von verschiedenen Unternehmen entwickelt wurden, sind viele Dateiformate nicht miteinander kompatibel, was dazu führt, dass Benutzer häufig exportieren, Formate konvertieren und importieren, was mühsam und leicht zu beschädigen ist der Inhalt.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - jensen

OpenUSD ist eine Technologie, die zur Lösung dieser Probleme entwickelt wurde. Über OpenUSD können Tools wie Adobe Stager, Houdini, Maya, Blender, Renderman, Pixars Minuteman und Epics Unreal Engine alle Daten austauschen und eine leistungsfähigere Rolle spielen.

Später gab Lao Huang feierlich bekannt, dass Nvidias Omniverse die erste Plattform sein wird, die vollständig für OpenUSD entwickelt wurde. Von der zugrunde liegenden Datenbank bis zum Engine-System ist jede Codezeile auf OpenUSD ausgerichtet.

Darüber hinaus hat Nvidia auch APIs wie RunUSD, ChatUSD und DeepSearch eingeführt, die die Hürde für Entwickler, OpenUSD-basierte Anwendungen zu erstellen, weiter senken und die Kombination von 3D-Workflows mit KI und anderen Technologien ermöglichen.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - 2023 08 09 18 57 41.2023 08 09 18 58 51

Beispielsweise wurde die von WPP, dem weltweit größten Werbeunternehmen, produzierte Werbung für den Denza N7 von BYD in „Metaverse“ gefilmt.

WPP hat die hochpräzisen CAD-Daten des Denza N7 auf Omniverse hochgeladen, um ein digitales Zwillingsauto zu erstellen, und dann können WPP-Künstler in der Omniverse-Umgebung erstellen.

Sie können beispielsweise die ChatUSD-API aufrufen und müssen nur eine Beschreibung mit einem Satz eingeben, damit die KI verschiedene Hintergrundumgebungen generieren und so Tausende personalisierter Inhaltsclips für globale Marketingaktivitäten erstellen kann.

Der Bau einer „Atombomben-Grafikkarte“ kann Nvidia nicht mehr zufriedenstellen - NVIDIA SIGGRAPH 000

Metaverse und generative KI sind wie ein natürliches Paar. Wenn die beiden aufeinandertreffen, wird ihr Wert exponentiell vergrößert, und die OpenUSD-Technologie macht all dies möglich.

Lao Huang glaubt, dass sich in Zukunft immer mehr Branchen einer digitalen Transformation unterziehen müssen und Omniverse und künstliche Intelligenz bald zum wichtigsten Workflow für diese Unternehmen werden, um die digitale Transformation abzuschließen.

Der Aufbau von Omniverse und künstlicher Intelligenz ist natürlich untrennbar mit der Unterstützung einer starken Rechenleistung verbunden. Dies ist die wahre Form von Nvidia:

Mit der GPU als Rückgrat und der KI als Hülle bildet sie die stärkste Hand zur Förderung der industriellen digitalen Transformation.

Schluss mit dem Mist.

#Willkommen, dem offiziellen öffentlichen WeChat-Konto von Aifaner zu folgen: Aifaner (WeChat-ID: ifanr). Weitere spannende Inhalte werden Ihnen so schnell wie möglich präsentiert.

Ai Faner | Ursprünglicher Link · Kommentare anzeigen · Sina Weibo