Nvidia RTX 4080: Was wir von GTC 2022 gelernt haben
Jensen Huang, CEO von Nvidia, hat gerade seine erste GTC-Keynote des Jahres 2022 abgeschlossen, und währenddessen kündigte die Führungskraft Nvidias Hopper-Architektur der nächsten Generation an. Es startet im H100, einer leistungsstarken GPU, die auf den Einsatz in Rechenzentren beschränkt ist, aber die Ankündigung enthält auch einige Hinweise für die RTX 4080 und Nvidias Consumer-Grafikkarten der nächsten Generation.
Nvidia hat auf der GTC nicht über die RTX 4080 gesprochen und sie wird die Hopper-Architektur nicht verwenden, zumindest basierend auf Gerüchten. Vor ein paar Jahren, vor der Einführung der Grafikkarten der RTX 30-Serie, deuteten Gerüchte an, dass Nvidia die Hopper-Architektur für seine Grafikkarten der RTX 40-Serie verwenden würde. Nun sieht es so aus, als würde Nvidia 2022 zwei Generationen herausbringen: Hopper für das Rechenzentrum und Ada Lovelace für Verbraucher. Das heißt aber nicht, dass wir den Ankündigungen keine Informationen entnehmen können.
Duale Architekturen
Dies ist erst das zweite Mal, dass Nvidia seine Verbraucher- und Rechenzentrumsprodukte aufteilt. Zwischen Pascal und Turing führte Nvidia die Volta-Architektur für Rechenzentren ein. Es war eine Art Notlösung, die es Nvidia ermöglichte, in Vorbereitung auf die nächste Generation von Verbraucherprodukten zu einem kleinen Herstellungsprozess für seine Rechenzentrumsprodukte überzugehen.
Das änderte sich mit der RTX 30-Serie, bei der Nvidia seine beiden Produktreihen unter der Ampere-Architektur vereinte. All dies bedeutet, dass es nicht viele Präzedenzfälle für das gibt, was Nvidia hier tut. Dies ist das erste Mal, dass wir zwei Architekturen von Nvidia wirklich nebeneinander live sehen.
Für Hopper haben wir erfahren, dass es den N4-Fertigungsprozess von TSMC verwenden wird und dass Nvidia auf Effizienz abzielt. Interessant ist, dass Nvidia Gerüchten zufolge den N5-Prozess von TSMC für den 4080 verwendet, nicht den kleineren und effizienteren Prozess, den Hopper-GPUs verwenden.
N5 und N4 leben in derselben Familie, aber N4 ist etwas effizienter als N5. Basierend auf den Gerüchten, die wir über die massiven Leistungsanforderungen für Grafikkarten der RTX 40-Serie gesehen haben, scheint N5 eher für den Consumer-Bereich geeignet zu sein. Dies baut auf dem Vorschlag von Leakern auf, dass die RTX 4080 große Probleme mit der Effizienz haben wird.
Wir könnten eine Wiederholung der Pascal/Volta/Turing-Situation sehen. Nvidia scheint mit Hopper mit einer effizienteren Architektur führend zu sein, um die Generation nach der RTX 4080 aufzubauen. Es ist möglich, dass wir bis dahin zu einem kleineren Prozess übergehen, aber es scheint, dass die Consumer-Karten immer noch hinter den Daten zurückbleiben werden mittlere.
Der Herstellungsprozess ist die größte Entwicklung, aber Hopper hält auch ein paar andere Hinweise bereit.
NVLink-Verbindung
Nvidia konzentrierte sich bei der vierten Generation von NVLink auf die Skalierbarkeit. Dies ist eine Verbindung, die heute nur im Rechenzentrum von Nvidia relevant ist, aber Huang kündigte an, dass sie zu Kunden und Partnern kommt.
Da NVLink offen ist, sagt Nvidia, dass das Ziel darin besteht, dass andere Unternehmen semi-kundenspezifische Chips entwickeln, die mit den Produkten von Nvidia funktionieren. Dies könnte für die kommenden Consumer-Grafikkarten von Nvidia relevant sein. Gerüchte deuten darauf hin, dass AMD mit einem Multichip-Modul (MCM)-Design für RX 7000-Grafikkarten arbeitet, das im Wesentlichen mehrere separate Rechencluster auf einem einzigen Chip kombiniert.
Das Öffnen von NVLink könnte den Grundstein für Nvidia legen, etwas Ähnliches zu tun. Gerüchte besagen, dass AMD Nvidia mit seinen RX 7000-Grafikkarten zum ersten Mal überholen wird, und das könnte am MCM-Design liegen. Es ist nicht klar, ob der RTX 4080 ein MCM-Design verwenden wird, aber die Einführung von Hopper deutet darauf hin, dass dies nicht der Fall sein wird.
Der letzte Hinweis kommt vom H100 CNX, einer Version der H100-GPU, die mit einer Nvidia ConnectX-7 SmartNIC gekoppelt ist. Dies dient dazu, die Latenz zu reduzieren und den Durchsatz zur GPU zu verbessern, wodurch CPU-Engpässe in Servern beseitigt werden.
Das ist für eine Desktop-GPU nicht relevant, aber wir sehen möglicherweise einen ähnlichen Ansatz bei der RTX 4080. Nvidia und IBM haben sich zusammengetan , um die Speicherbandbreite und den Durchsatz zu verbessern, indem eine SSD direkt an die GPU angeschlossen wird. Wir gingen davon aus, dass dies ein weit entferntes Stück Technik ist, aber GTC schlägt vor, dass es eher früher als später auftauchen könnte.
Letztendlich ist die RTX 4080 aber noch ein großes Fragezeichen. Wir haben Lecks zu Leistung und Effizienz sowie ein paar Hinweise von Hopper, aber wir müssen warten, bis die Karte auf den Markt kommt, um alles darüber zu erfahren. Es wird derzeit gemunkelt, dass es diesen Herbst starten soll, obwohl Nvidia diesen Zeitplan nicht bestätigt hat.