GPUs der Nvidia RTX 50-Serie: alles, was wir bisher wissen
Wir nähern uns der Ziellinie. Die RTX 50-Serie von Nvidia ist fast da und einige dieser GPUs werden bald in jeder Rangliste der besten Grafikkarten ganz oben stehen, was die Lage auf dem GPU-Markt im Jahr 2025 völlig verändern wird.
Nvidia kündigt derzeit auf der CES seine nächste Grafikkartengeneration an und Sie können die Keynote von Nvidia jetzt live verfolgen . Nvidia hat bereits die RTX 5090, RTX 5080, RTX 5070 Ti und RTX 5070 vorgestellt , und die Flaggschiff-Karte kostet 2.000 US-Dollar pro Jahr.
RTX 50-Serie: Preise und Erscheinungsdatum
Nach vielen langen Monaten des Wartens ist es offiziell: Nvidia hat bestätigt, dass es die RTX 50-Serie während der CES 2025 am 6. Januar 2025 ankündigen wird . Neben der Ankündigung kündigte Nvidia auch eine laufende Kampagne an, bei der Gamer in den sozialen Medien mit ihr interagieren können Gewinne verschiedene Belohnungen. Nvidia wird außerdem eine 50-stündige LAN-Party im Vorfeld der CES-Keynote veranstalten, die von CEO Jensen Huang gehalten wird.
Nachdem wir nun wissen, wann die Ankündigung erfolgen wird, bleibt die Frage: Welche GPUs kommen zuerst und wann werden sie auf den Markt kommen?
Hier betreten wir erneut spekulatives Terrain, da Nvidia nichts anderes gesagt hat, als im Wesentlichen eine Ankündigung anzukündigen.
Zum jetzigen Zeitpunkt wird es immer wahrscheinlicher, dass die ersten paar GPUs im Januar 2025 verfügbar sein werden. Einige sehr vorsichtige Gerüchte sprechen sogar von einer möglichen RTX 50-Aktualisierung im Jahr 2026, aber das liegt viel zu weit in der Zukunft, um sich darüber Gedanken zu machen .
Laut der neuesten Meldung von Wccftech ist die RTX 5090 möglicherweise nicht die erste GPU, die auf den Markt kommt – was eine Abkehr von der RTX 40-Serie bedeuten würde. Dieses Mal soll Nvidia zunächst die RTX 5080 auf den Markt bringen, und dieses Modell soll kurz nach der CES 2025-Keynote folgen; die Erwartung ist Mitte Januar. Ein weiterer Bericht von kopite7kimi deutet darauf hin, dass der RTX 5080 zuerst auf den Markt kommen wird , was die Vorhersagen von Wccftech bestätigt.
Glaubt man diesen Leaks, wird die RTX 5090 erst etwas später auf den Markt kommen, aber nicht viel. Wccftech sagt, dass Nvidia versuchen wird, es vor Ende Januar auf den Markt zu bringen, und dass es spätestens Mitte Februar passieren könnte. Allerdings gibt es einige widersprüchliche Informationen, denn Ctee behauptet, dass AMD und Nvidia versuchen werden, ihre neuesten GPUs so schnell wie möglich auf den Markt zu bringen, also vor dem 20. Januar, wenn die vom designierten Präsidenten Donald Trump vorgeschlagenen neuen Tarife in Kraft treten könnten.
Die meisten Leaks, die wir bisher gesehen haben, drehten sich um die Flaggschiffe RTX 5090 und RTX 5080 sowie deren mögliche Veröffentlichungstermine. Jetzt stimmte Board Channels mit der Vorhersage zu, dass die RTX 5090 und RTX 5080 im Januar 2025 auf den Markt kommen werden – was mit anderen Leaks übereinstimmt. Diese Quelle behauptet aber auch, dass die RTX 5070 und die RTX 5070 Ti im Februar 2025 in Rekordzeit folgen werden . Das ist ein viel schnellerer Startplan als bei der RTX 40-Serie.
Die gängigsten GPUs von Nvidia werden jedoch möglicherweise erst viel später folgen. Benchlife gab kürzlich bekannt, dass Karten von der RTX 5090 bis zur RTX 5070 im ersten Quartal des Jahres erscheinen werden und die RTX 5060 und RTX 5060 Ti erst im zweiten Quartal folgen werden . Das könnte April sein, also wird die Verzögerung vielleicht nicht lange dauern, aber wir müssen abwarten und sehen. Moore's Law Is Dead sagte unterdessen, dass die RTX 5060 möglicherweise erst eine Weile später auf den Markt kommt, damit Nvidia sie mit mehr VRAM ausstatten kann.
Insgesamt erwarten wir, dass die Modelle RTX 5090, RTX 5090D (eine abgespeckte Version für den chinesischen Markt), RTX 5080, RTX 5070 Ti und RTX 5070 innerhalb der ersten Jahreshälfte auf den Markt kommen. Zotac hat diese fünf Modelle kürzlich gelistet und damit frühere Gerüchte vorzeitig bestätigt.
Natürlich entsprach das Jahr 2025 nicht immer den Erwartungen, da alle Leaker zu Beginn des Jahres 2024 sagten, dass wir die RTX 50-Serie in der zweiten Jahreshälfte sehen würden. Nun wissen wir mit Sicherheit, dass es nicht geklappt hat, obwohl einige Leaker noch im November letzten Jahres etwas anderes angedeutet haben. Die Anzeichen für einen bevorstehenden Start gibt es allerdings schon seit einiger Zeit.
Wir werden bald GeForce of Blackwell treffen.
– kopite7kimi (@kopite7kimi) 5. November 2024
Nvidia soll die Produktion vieler seiner Karten der RTX-40-Serie eingestellt haben. Aktuellen Berichten zufolge sind mittlerweile alle RTX 40-Grafikkarten abgekündigt, mit Ausnahme des AD107-Chips, der die RTX 4050 und die RTX 4060 (einschließlich der mobilen GPUs) antreibt. Dies deutet darauf hin, dass wir zuvor gehört haben, dass Nvidia die RTX 4090 eingestellt hat, und nun scheint es, dass der Großteil der Produktion auf die RTX 50-Serie verlagert wurde. Einige GPUs, wie die RTX 4080, sind jetzt schwerer zu bekommen und es kommt zu Preiserhöhungen.
Board Channels berichtete kürzlich, dass Nvidia nicht nur mit der Produktion der meisten GPUs der RTX 40-Serie fertig ist, sondern auch mit der Auslieferung an Einzelhändler und Hersteller. Auch dies bedeutet eine schlechte Nachricht für die Möglichkeit, die RTX 40-Serie zum empfohlenen Listenpreis zu kaufen, und die Lagerbestände könnten in den nächsten Monaten sinken – aber das funktioniert für Nvidia gut, wenn die RTX 50-Serie bereits verfügbar sein wird um die Regale zu füllen.
Was steckt hinter der RTX 50-Serie? Wir wissen nicht viel, aber kürzlich haben wir einen kleinen Hinweis auf die RTX 60-Serie erhalten. Die Namen aller möglichen GPUs in den Produktreihen, einschließlich Karten wie der RTX 5090 und sogar der RTX 6090 Ti, tauchten in einem Markenregistrierungsantrag einer Firma namens Sinotex International Industrial Ltd. auf. Das bedeutet natürlich nicht, dass wir Ich bekomme alle diese Karten – es sind viel zu viele, um sie aufzulisten –, aber der Zeitpunkt ist interessant.
Der Preis dieser GPUs ist derzeit reine Spekulation. In dieser Generation verfolgte Nvidia eine Preisstrategie , die man nur als „teuer“ bezeichnen kann. Es könnte diesem Weg folgen und die Preise noch weiter in die Höhe treiben, insbesondere wenn die Nachfrage nach KI-GPUs so hoch bleibt wie derzeit (was höchstwahrscheinlich der Fall sein wird). Immerhin hat die aktuelle Nachfrage die RTX 4090 weit über 2.000 US-Dollar getrieben , obwohl sie zu einem bereits sehr hohen Preis von 1.600 US-Dollar auf den Markt kam. Dies macht die RTX 5090 sicherlich zu einer besorgniserregenden Aussicht , aber Nvidias Preissenkung beim Super Refresh der RTX 40-Serie gab vielen Enthusiasten etwas Hoffnung .
Bisher haben die Vorbestellungen für die RTX 5090 begonnen … sozusagen. Der Rechenzentrumshersteller Comino hat Vorbestellungen für seinen Grando Server der nächsten Generation eröffnet, und dieser Server ist entweder mit acht oder sechs RTX 5090-GPUs ausgestattet. Die Top-Konfiguration kostet etwa 52.000 US-Dollar, was bedeuten würde, dass jede GPU bis zu 5.000 US-Dollar kosten könnte. Glücklicherweise müssen wir uns da keine Sorgen machen – die Kosten für die eigentliche Grafikkarte müssen deutlich niedriger sein.
Ein australischer Einzelhändler meldete sich und teilte Vex, einem YouTuber, die Preise der RTX 5080 mit. Diesem Leak zufolge könnte die RTX 5080 für satte 2.799 australische Dollar verkauft werden , was etwa 1.740 US-Dollar entspricht. Allerdings handelt es sich hierbei um ein übertaktetes Asus-Modell, und im Preis ist die Umsatzsteuer enthalten, sodass der Preis in den USA für eine Nvidia Founders Edition-Karte hoffentlich deutlich niedriger ausfallen dürfte.
Außerdem haben wir einen ersten Blick auf die RTX 5090 und die RTX 5080 in einem vorgefertigten System geworfen. Die GPUs tauchten in geleakten Acer Predator Orion-Desktops auf, und die RTX 5090-basierte Konfiguration kostete über 6.200 US-Dollar, während die mit der RTX 5080 für rund 3.600 US-Dollar gelistet war. Das sind einige wirklich hohe Preise, aber es ist schwer zu sagen, wie viel jede GPU außerhalb einer vorgefertigten GPU kosten wird.
Er behauptet, der Preis sei 24.999 Yuan? (~3.300 USD)
Oder nur ein Scherz? pic.twitter.com/iGChccv3e9
– 포채포채 (@harukaze5719) 26. Dezember 2024
Moore's Law Is Dead teilte kürzlich mit, dass die Vorstandspartner von Nvidia derzeit mit Kosten für die RTX 5090 zwischen 2.000 und 2.500 US-Dollar rechnen , gefolgt von der RTX 5080 mit 1.200 bis 1.500 US-Dollar und der RTX 5070 mit 600 bis 700 US-Dollar. Unterdessen behauptet ein Baidu-Lecker, dass die RTX 5090 bis zu 3.300 US-Dollar kosten wird – aber das sind wahrscheinlich Schwarzmarktpreise, da es unwahrscheinlich ist, dass die RTX 5090 überhaupt in China verkauft wird. An seine Stelle tritt der RTX 5090D, eine abgespeckte Version.
Hoffen wir, dass sich diese Preise nicht als wahr erweisen. Persönlich glaube ich nicht, dass Nvidia mit der RTX 5090 über 2.000 US-Dollar hinausgehen wird, aber die Zeit wird es zeigen.
RTX 50-Serie: Spezifikationen
Nvidia RTX 50-Serie | |
Prozessknoten | TSMC 3 nm oder TSMC 5 nm (N4P) |
Architektur | Blackwell |
Chip | GB202, GB203, GB205, GB206, GB207 |
Speichertyp | GDDR7 |
Maximale Busbreite | 512-Bit |
Display-Anschlüsse | DisplayPort 2.1, HDMI 2.1 |
Nvidia hat für keine der Karten Spezifikationen bestätigt. Tatsächlich sind wir uns nicht einmal sicher, welche Modelle kommen werden. Die Zusammenstellung der Spekulationen verschiedener Hardware-Leaks gibt uns jedoch eine Vorstellung davon, was uns erwarten kann. Denken Sie daran, das Folgende mit einer gesunden Portion Skepsis zu betrachten, bis Nvidia selbst die Wahrheit sagt.
Prozessknoten, PCB und GPU
TSMC3
– kopite7kimi (@kopite7kimi) 15. November 2023
Wir wissen mit Sicherheit, dass der Nachfolger von Ada Lovelace „Blackwell“ heißen wird, zu Ehren des amerikanischen Mathematikers David Blackwell. Gerüchten zufolge wird es von TSMC auf Basis eines 3-nm-Prozesses hergestellt, es ist jedoch unklar, ob Nvidia einen der vorhandenen 3-nm-Knoten von TSMC oder einen benutzerdefinierten Knoten verwenden wird.
Die Veröffentlichung der Blackwell B200-GPU hat dem 3-nm-Gerücht einen Strich durch die Rechnung gemacht. Der B200 ist für High-Performance-Computing (HPC) und Rechenzentrumsanwendungen konzipiert und basiert auf einem TSMC 4NP-Knoten (4 nm Nvidia Performance). Wenn der B200 einen 4NP-Knoten verwendet, kann man sich leicht vorstellen, dass die Consumer-Reihe dasselbe tun könnte. Dies ist jedoch nicht selbstverständlich – Nvidia könnte stattdessen den 3-nm-Knoten für seine RTX-50-Reihe verwenden.
Das Sortiment soll Chips umfassen, die vom High-End- RTX 4090 -Äquivalent GB202 über die Modelle GB203, GB205, GB206 bis hin zum Einstiegsmodell GB207 reichen. Wenn sich herausstellt, dass dies wahr ist, wird dies eine interessante, vielleicht besorgniserregende Änderung sein. Dies würde bedeuten, dass die AD104-GPU, die die RTX 4070 antreibt, in der nächsten Generation keinen Nachfolger haben würde. Die RTX 5070 und RTX 5070 Ti könnten daher den GB205-Chip verwenden.
Eine der gesprächigsten Informationsquellen zur RTX 50-Serie war kopite7kimi auf X (ehemals Twitter). Der Leaker enthüllte, dass wir davon ausgehen können, dass die neuen GPUs DisplayPort 2.1 unterstützen, was die Lovelace-Reihe nicht bietet, und auch HDMI 2.1.
Wir haben kürzlich einen Blick auf die GB202-300-GPU geworfen, die angeblich die RTX 5090 antreibt. Sie wurde auf Baidu von jemandem durchgesickert, der höchstwahrscheinlich ein frühes technisches Muster erhalten hat; Der Befund wurde später von harukaze5719 auf X geteilt. Dieselbe Person hatte auch einen Tag zuvor die Platine durchgesickert, entdeckt von VideoCardz und HXL auf Twitter. Schauen wir uns die beiden genauer an, da sie uns beide einen Einblick in die Spezifikationen der neuesten Halo-Karte von Nvidia geben.
Das erste, was uns auffällt, ist die enorme Chipgröße der GB202-300-GPU, die voraussichtlich über 21.760 CUDA-Kerne verfügen wird. Laut der Quelle misst die Packungsgröße etwa 63 x 56 mm und der Chip selbst 24 x 21 mm. Insgesamt ergibt sich eine Chipfläche von 744 mm²; Dies ist eine enorme Steigerung gegenüber dem AD102 von Ada, der 608 mm² maß.
Die Chipgröße könnte jedoch größer sein als die, die wir in der Founders Edition von Nvidia finden, sodass dieser Abstand möglicherweise kleiner ist. VideoCardz vermutet, dass es sich hierbei um eine PNY-GPU handelt, obwohl diese das PG145-Board nutzt, das zum Referenzdesign von Nvidia gehört. Wenn es sich um eine Karte eines Drittanbieters handelt, könnte das die große Leiterplatte (PCB) erklären.
Neben der GB202-300-GPU ist dies auch unser erster Blick auf den VRAM, den Nvidia in dieser Generation verwendet: Samsungs GDDR7. Gerüchten zufolge wird die RTX 5090 über 28-Gbit/s-Speichermodule verfügen und jedes Modul über 2 GB VRAM verfügen. Da es insgesamt 16 Module gibt, bestätigt dies einmal mehr, dass das Flaggschiff über 32 GB VRAM verfügen wird, was einen Rekord für Nvidias Consumer-GPUs darstellt.
Die Platine selbst verfügt nur über einen Stromanschluss, was höchstwahrscheinlich den 12V-6ˣ2 bedeutet. Die GPU nutzt die PCIe 5.0-Schnittstelle, was auch mit vielen früheren Leaks übereinstimmt.
Speicherschnittstelle
VRAM war während der RTX-40-Serie ein heißes Thema und alles deutet darauf hin, dass dies auch bei der nächsten Generation so bleiben wird. Spiele wie „Indiana Jones“ und „The Great Circle“ beweisen, dass mehr Speicher eine Notwendigkeit wird , aber Nvidia könnte bei fast jeder einzelnen seiner GPUs, bis auf eine, an der gleichen Speicherkapazität festhalten.
Wie oben erwähnt, haben viele Quellen – einschließlich der durchgesickerten Platine – inzwischen bestätigt, dass die RTX 5090 satte 32 GB VRAM erhält. Der Rest der Produktpalette soll jedoch unverändert bleiben : Die RTX 5080 und die RTX 5070 Ti erhalten jeweils 16 GB, die RTX 5070 12 GB und die RTX 5060 lediglich 8 GB. Bei der RTX 5060 Ti könnten die gleichen Probleme auftreten wie bei der RTX 4060 Ti, da sie angeblich 16 GB VRAM über einen sehr schmalen 128-Bit-Bus erhält.
Die maximale Busbreite von Blackwell war unter populären Leakern ein sehr umstrittenes Thema, daher ist es schwer zu wissen, was wahr ist. Einig sind sich jedoch alle darin, dass Nvidia den neuen GDDR7-Speicherstandard verwenden wird, den AMD in seiner kommenden RDNA-4 -Reihe angeblich nicht verwenden wird.
Trotz früherer Gerüchte, dass wir von Anfang an 32-Gbit/s-Module sehen könnten,sagt kopite7kimi, dass Nvidia für diese Generation 28 Gbit/s verwenden wird. Dies stellt immer noch ein solides Upgrade gegenüber Ada dar und liefert bis zu 1,8 TB/s Speicherbandbreite auf der gemunkelten RTX 5090 – vorausgesetzt, der 512-Bit-Speicherbus funktioniert.
Allerdings gab es, wie bei den meisten Leaks zur RTX 50-Serie, einige Meinungsverschiedenheiten bezüglich der oben genannten Theorie. Tatsächlich heißt es in einem aktuellen Bericht, dass es eine GPU geben wird, die von Anfang an mit den 32Gb/s-Speichermodulen ausgestattet sein wird, und dabei wird es nicht einmal die RTX 5090 sein. Laut Wccftech, das sich auf eigene Quellen beruft, handelt es sich um die RTX 5080 erhält 32 Gbit/s Speicher und erreicht dadurch eine Bandbreite von über 1 TB/s. Eine andere Quelle bestätigte kürzlich dieses Gerücht , behauptete jedoch stattdessen 30 Gbit/s. Die RTX 5090 soll vorerst bei 28 Gbit/s bleiben, aber sie wird über viel mehr VRAM und einen breiteren Speicherbus verfügen.
Unabhängig von der Busbreite wissen wir, dass GDDR7 ein Upgrade sein wird. Der Speicherhersteller Micron hat kürzlich einige Leistungszahlen für seinen neuen VRAM veröffentlicht und behauptet, dass dies eine Leistungssteigerung von bis zu 30 % in Gaming-Szenarien bedeuten wird, einschließlich reiner Rasterung und Raytracing. GDDR7-Speicher beginnt bei 28 Gbit/s und bietet möglicherweise eine Systembandbreite von über 1,5 TB/s.
Gerüchte über Spezifikationen
GPU | Streaming-Multiprozessoren (SM) | CUDA-Kerne | Speicherschnittstelle | Speichergeschwindigkeit | Speicherbandbreite | TBP | |
RTX 5090 | GB202 | 170 | 21.760 | GDDR7 32 GB 512-Bit | 28 Gbit/s | 1,8 TB/s | 550W-600W |
RTX 5080 | GB203 | 84 | 10.752 | GDDR7 16 GB 256-Bit | 28 Gbit/s-32 Gbit/s | 896 GB/s – 1 TB/s | 300W-400W |
RTX 5070 Ti | GB203 | 70 | 8.960 | GDDR7 16 GB 256-Bit | 28 Gbit/s | 896 GB/s – 1 TB/s | 300W |
RTX 5070 | GB205 | 48 | 6.144 | GDDR7 12 GB 192-Bit | 28 Gbit/s | 672 GB/s | 250W |
RTX 5060 | GB206 | 36 | 4.608 | GDDR7 8 GB (?) 128-Bit | 28 Gbit/s | 448 GB/s | ? |
RTX 5050 (?) | GB207 | 20 | 2.560 | GDDR7 8 GB (?) 128-Bit | 28 Gbit/s | ? | ? |
Was können wir also von der RTX 50-Serie in Bezug auf die tatsächlichen Spezifikationen erwarten? Was Sie in der Tabelle oben sehen, wird oft als gemunkelte Spezifikation bezeichnet, aber das ist es, woran wir arbeiten – Gerüchte. Bitte nehmen Sie alle folgenden Punkte mit einer gesunden Portion Skepsis ein.
Wie so oft war kopite7kimi eine gute Informationsquelle zum Thema Spezifikationen der RTX 50-Serie. Der Leaker teilte die (vermutete) Anzahl der Streaming-Multiprozessoren (SMs) für jede GPU mit. Das lässt uns vermuten, dass die RTX 5090 über 192 SMs verfügen könnte, was eine beeindruckende Steigerung von 33 % im Vergleich zur RTX 4090 bedeutet; In der Zwischenzeit würde die RTX 5080 nur über eine Steigerung von 5 % verfügen, und die RTX 5070 verfügt möglicherweise tatsächlich über weniger SMs als ihr Vorgänger. Allerdings ist es noch zu früh, um in Panik zu geraten.
Zum einen wissen wir nicht, ob diese Angaben wahr sind oder nicht. Selbst wenn dies der Fall ist, teilte Kopite tatsächlich die Anzahl der SMs in der GPU mit, was nicht unbedingt bedeutet, dass Nvidia alle davon in der Grafikkarte verwenden wird. Tatsächlich nutzt die RTX 4090 nicht die volle Leistung des AD102-Chips, und das kann auch beim GB202 der Fall sein.
GB202 12*8 512-bit GDDR7
GB203 7*6 256-bit GDDR7
GB205 5*5 192-bit GDDR7
GB206 3*6 128-bit GDDR7
GB207 2*5 128-bit GDDR6– kopite7kimi (@kopite7kimi) 11. Juni 2024
Zum jetzigen Zeitpunkt sind sich die meisten Leaker einig, dass die RTX 5090 nicht den gesamten GB202-Chip nutzen wird, weshalb die Anzahl der CUDA-Kerne in der obigen Tabelle geringer ist als die, die die GPU bieten kann – 21.760 gegenüber 24.576. Auch die RTX 5080 ist mit einer angeblichen CUDA-Kernzahl von 10.752 Kernen ziemlich etabliert. Allerdings wurden die GPUs, die sich weiter unten im Stapel befinden, bis vor Kurzem kaum abgedeckt.
Dank eines aktuellen Leaks von kopite7kimi und eines weiteren von Benchlife haben wir jetzt einige Spezifikationen für die RTX 5070 Ti. Die GPU soll mit der gleichen Speicherschnittstelle wie die RTX 5080 ausgestattet sein, also 16 GB GDDR7-VRAM über einen 256-Bit-Speicherbus. Es heißt auch, dass er über weniger Kerne verfügt als der RTX 4080 der letzten Generation , aber Architektur-Upgrades könnten ihm dennoch einen deutlichen Schub verleihen. Mittlerweile ist die RTX 5070 mit 6.400 CUDA-Kernen und 12 GB VRAM an der Spitze, aber kopite7kimihat diese Spezifikationen kürzlich überarbeitet und sagt nun, dass die 5070 über 6.144 Kerne (oder 48 SMs) verfügen wird.
Abgesehen von all der vorsichtigen Skepsis könnten sich zumindest einige dieser Gerüchte bewahrheiten, da sie schon seit einiger Zeit aus verschiedenen Quellen kursieren. YouTuber RedGamingTech hat zuvor auch gesagt, dass der Flaggschiff-Chip möglicherweise mit 192 Streaming-Multiprozessoren (SMs) ausgestattet ist. Allerdings hat RedGamingTech auch vorhergesagt, dass der GB203 (RTX 5080) über 108 SMs verfügen würde, was immer noch besser ist als das, was kopite7kimi nun als Realität angibt. Auf die eine oder andere Weise sehen wir einen großen Leistungsunterschied zwischen der RTX 5080 und der RTX 5090.
Weitere von kopite7kimi geteilte Spekulationen bestätigen dies. Laut dem Leaker wird der GB203-Chip „die Hälfte von GB202“ sein, was einen ähnlichen Leistungsabfall bedeutet, wie wir ihn beim RTX 4090 im Vergleich zum RTX 4080 gesehen haben.
Ich denke, GB203 ist die Hälfte von GB202, genau wie GB102 und GB100. Aber ich weiß nicht, ob GB202 ein Multi-Chip-Paket hat.
– kopite7kimi (@kopite7kimi) 11. März 2024
Wenn die RTX 5090 wirklich so scheußlich wird, wie sie scheint, würden viele eine gigantische Karte erwarten, aber Gerüchten zufolge wird die RTX 5090 nur in der Founders Edition über ein Dual-Slot-Design verfügen . Das wäre eine schockierende Veränderung gegenüber der aktuellen Generation, bei der die RTX 4090 bis zu vier Steckplätze belegen kann. Zum jetzigen Zeitpunkt bezweifle ich die Gültigkeit dieses Gerüchts, da wir das PCB gesehen haben und es definitiv viel zu groß ist – aber vielleicht wird Nvidias Version deutlich dünner sein.
Wir haben sogar Gerüchte über eine GPU namens Titan AI gehört. Genau wie in der Lovelace-Generation hat Nvidia letztendlich nicht den gesamten AD102-Chip verwendet – die RTX 4090 verfügt über etwas mehr Saft, wurde aber nie verwendet – und Nvidia könnte etwas Ähnliches mit dem GB202-Chip tun. Infolgedessen soll es sich bei der RTX 5090 um eine abgespeckte Version der GB202-GPU handeln, die eine Steigerung von 48 % gegenüber der RTX 4090 bieten wird. In der Zwischenzeit würde die Titan AI-Grafikkarte voraussichtlich alles freischalten, was der GB202-Chip zu bieten hat mit einer Leistungssteigerung von 63 %.
Die RTX 5090 ist nicht die einzige Version der Karte, die voraussichtlich bald erhältlich sein wird. Der für den chinesischen Markt hergestellte RTX 5090D soll ebenfalls im Januar erscheinen, und sein Verpackungsdesign wurde kürzlich vom X-Benutzer MEGAsizeGPU durchgesickert. Darüber hinaus sagen Leaker, dass Nvidia die Karte nicht reduzieren wird, um den von der US-Regierung auferlegten Vorschriften für den Export von Grafikkarten nach China zu entsprechen, und stattdessen unveränderte RTX 5090-GPUs mit Firmware-Sperren ausliefern wird, die ihre Leistung verringern.
Es ist wahrscheinlich, dass Nvidia Modelle von der RTX 5060 bis zur RTX 5090 herausbringen wird, mit einigen Ti-Optionen und vielleicht sogar der gemunkelten Titan AI-Grafikkarte. Hoffen wir, dass die technischen Daten ausgewogen bleiben, um sowohl Enthusiasten als auch Einsteigern eine gute Auswahl an Karten zu bieten. andernfalls müsste DLSS 4 in dieser Generation möglicherweise die Rettung sein .
RTX 50-Serie: Laptops
Während die Desktop-Versionen der RTX 50-Serie ein Rätsel darstellen, sind ihre Laptop-Pendants noch stärker in den Schatten gerückt, da von Leakern so gut wie keine Informationen über sie geteilt wurden. Laptop-Gamer können sich jedoch freuen, denn kürzlich haben wir einige große Neuigkeiten über die RTX 50-Serie für Laptops erhalten. Das Beste daran ist, dass es sich nicht um ein weiteres spekulatives Gerücht handelt, sondern um ein tatsächliches Leak von Clevo, einem taiwanesischen Laptop-Hersteller.
Leider wurde das Unternehmen kürzlich von einem Ransomware-Angriff heimgesucht, der dazu führte, dass einige vertrauliche Folien online geteilt wurden. Den Folien zufolge wird Nvidia sechs mobile GPUs auf den Markt bringen. Es wird auch angedeutet, dass Nvidia seine älteren Low-End-GPUs nicht aus dem Verkehr ziehen wird. Die RTX 4050, RTX 3050 und sogar die RTX 2050 werden weiterhin in Laptops auftauchen.
Den Grafikkarten der RTX 50-Serie wurden in der Folie Codenamen gegeben, aber es ist leicht herauszufinden, welche welche sind, da sie mit ihren Gegenstücken der 40er-Serie verglichen werden. Es scheint, dass die Laptop-Version der RTX 5080 ein dringend benötigtes Speicher-Upgrade erhalten könnte, da sie jetzt über die gleichen 16 GB GDDR7-Speicher wie die RTX 5090 verfügt. Die beiden Karten sollen sich außerdem die gleiche GB203-GPU teilen , sodass der GB202-Chip fehlt von Laptops vorerst.
Es gibt noch mehr. Wie Wccftech mitteilt, sind Spezifikationen für kommende Asus-Laptops durchgesickert, und das verrät uns viel darüber, was wir von jeder GPU im Stapel erwarten können. Dank des Leaks wissen wir nun, dass die RTX 5090 und die RTX 5080 beide über 16 GB Speicher verfügen werden, gefolgt von 12 GB für die RTX 5070 Ti und 8 GB für die RTX 5070, RTX 5060 und RTX 5050.
SKUs für ROG pic.twitter.com/NhoU40WvHk
– Huang514613 (@94G8LA) 19. Dezember 2024
Wie so oft haben die Karten unterschiedliche maximale TBPs, die ihre tatsächliche Leistung bestimmen. Die RTX 5090 erreicht mit 175 Watt ihren Spitzenwert, direkt neben der 5080, die RTX 5070 Ti bleibt jedoch bei 140 W.
Da es kein solides Datenblatt gibt, ist es schwer, über die Leistung dieser GPUs zu sprechen, aber der Weibo-Leaker Golden Pig Upgrade Pack neckte, dass die Laptop-Version der RTX 5060 mit der mobilen RTX 4070 konkurrieren wird. Es gibt jedoch keine substanziellen Beweise, also ist es schwierig um zu sagen, was real ist.
Wann genau werden diese schicken neuen Laptops auf den Markt kommen? Es könnte eine Weile dauern, da Moore's Law Is Dead behauptet , dass Nvidia derzeit die mobilen Versionen der RTX 5080 und der RTX 5070/Ti optimiert. Eine Anekdote von RedGamingTech besagt, dass der GB207, also der leistungsschwächste Chip im Sortiment, zunächst wahrscheinlich nur in Laptops auftauchen wird. Dies deckt sich mit dem, was wir bei der RTX-40-Serie gesehen haben, wo die RTX 4050 bisher nur in Laptops aufgetaucht ist.
„Moore's Law Is Dead“ lieferte uns ein neues Update zum VRAM in Nvidias Laptop-GPUs, und es wäre eine gute Nachricht, wenn es wahr wäre. Die Laptop-Version der RTX 5090 kommt möglicherweise später als erwartet, soll aber dank eines Wechsels zu neueren 3-GB-GDDR7-Speichermodulen statt 2 GB über mehr VRAM verfügen . Dadurch soll die Speicherkapazität dieser GPU in der Laptop-Version von 16 GB auf 24 GB erhöht werden. Der Rest der Produktpalette soll stattdessen die 2-GB-Module verwenden.
RTX 50-Serie: Architektur
Über die Architektur der Blackwell-Chips hält Nvidia Stillschweigen, aber das wird nicht mehr lange so bleiben. Da die GPUs weniger als einen Monat entfernt sind, werden wir mehr erfahren, je näher der Veröffentlichungstermin rückt. Vorerst hat Nvidia über die Architektur seiner Blackwell-GPUs für sein Rechenzentrum gesprochen, was vielleicht nicht sehr aufschlussreich ist, was in der Verbraucherpalette passieren könnte – aber es gibt immer noch einige interessante Leckerbissen.
Der erste merkwürdige Teil ist, dass die Enterprise-Version von Blackwell auf dem 4NP-Knoten von TSMC basiert, bei dem es sich eigentlich um einen 5-nm-Prozess handelt. Frühere Gerüchte deuteten darauf hin, dass die RTX 50-Serie auf einem 3-nm-Prozess basieren könnte, aber angesichts der jüngsten Ankündigung erscheint dies nun recht unwahrscheinlich. Darüber hinaus verfügt die B200-GPU über eine dedizierte Dekomprimierungs-Engine. Es ist zwar nicht abzusehen, ob dies auch bei Consumer-GPUs der Fall sein wird, es könnte aber den Grafikkarten einen deutlichen Schub verleihen.
Obwohl Nvidia die Blackwell-Architektur in Bezug auf Unternehmen diskutierte, blieb es zu seiner Produktpalette für Privatkunden schweigsam. Daher liegen uns lediglich weitere Spekulationen aus verschiedenen Quellen vor, deren Informationen jedoch oft etwas widersprüchlich sind.
RedGamingTech hat kürzlich in einem Video ausführlich über die Blackwell-Architektur gesprochen. Der YouTuber bezeichnete sie als „eine der einflussreichsten Grafikarchitekturen“ und prognostizierte, dass die RTX 50-Serie erhebliche Verbesserungen bei Dingen wie Path Tracing und Raytracing einführen wird, was sowohl für Enthusiasten- als auch für Midrange-Karten Vorteile bringen wird.
Zu diesem Zweck sagte der YouTuber, dass wir möglicherweise erhebliche architektonische Änderungen erleben werden, einschließlich einer umfassenden Neugestaltung der SMs von Nvidia. Er erwähnte auch die Hinzufügung eines Rauschunterdrückungsbeschleunigers, entweder als Teil des Chips oder als Funktion der Tensor-Kerne von Nvidia. Noch wichtiger ist, dass RedGamingTech zunächst angedeutet hat, dass Nvidia möglicherweise ein Multi-Chip-Modul-Design (MCM) verwendet. Dies bedeutet einen Designansatz, bei dem mehrere kleinere Chips zu einem einzigen, größeren und leistungsstärkeren Prozessor zusammengefasst werden.
Der Wechsel zu einem MCM-Design gegenüber einem monolithischen könnte Nvidia einen großen Vorteil verschaffen, einschließlich Skalierbarkeit, höherer Erträge und mehr Designflexibilität. Bisher hat kein anderer Leaker diesen beiden Theorien zugestimmt.
Leider hat ein aktuelles Update desselben YouTubers ergeben, dass Nvidia in Blackwell kein MCM-Design verwenden wird. Berichten zufolge hatte Nvidia ursprünglich geplant, zwei zusammengeklebte GB202-Chips zu verwenden, möglicherweise mit einigen ausgeschnittenen SMs, entschied sich aber letztlich dagegen. Der YouTuber bemerkte, dass Probleme wie hohe Preise, die Latenz zwischen den beiden Chips und verschiedene Schwierigkeiten bei der Inbetriebnahme dazu führten, dass Nvidia an seiner bisherigen Architektur festhielt.
Nehmen Sie dies mit einer gesunden Portion Skepsis. Es ist möglich, dass Nvidia plant, in Zukunft auf MCM umzusteigen, aber solche Architekturänderungen werden nie in letzter Minute vorgenommen, sodass dieser Plan für Blackwell möglicherweise nie existiert hat. Es ist jedoch auch möglich, dass Nvidia architektonische Änderungen einführt, anstatt auf Spitzenleistung zu drängen, damit die neue Technologie ausgereift werden kann, bevor in einigen Jahren die Leistung der Grafikkarten der RTX 6000-Serie gesteigert wird.
Einen kleinen Hinweis darauf, was uns erwartet, gibt wiederum die B200-Rechenzentrums-GPU. Nvidia hat seine Tensor-Kerne in dieser Grafikkarte überarbeitet. Daher unterstützen sie jetzt nativ die numerischen Formate FP4 und FP6 für die KI-Inferenz. Wir könnten dies auch bei Consumer-GPUs sehen, aber zum jetzigen Zeitpunkt handelt es sich dabei nur um Spekulationen.
Obwohl Blackwell noch so neu ist, hat es bereits einige Probleme erlebt. Einem aktuellen Bericht von The Information zufolge haben die Rechenzentrums-GPUs von Nvidia Probleme mit Überhitzung, was zu Verzögerungen bei der Bereitstellung von Server-Racks für das KI-Training geführt hat. Da sich Blackwell aufgrund von „Designfehlern“ bereits verzögert hat , ist dies ein holpriger Anfang, aber es ist möglich, dass diese Probleme bei Consumer-Grafikkarten nie auftreten werden, da beide unterschiedlich gebaut sind.
RTX 50-Serie: Leistung
Bis die RTX 50-Serie endlich auf den Markt kommt, ist es schwierig, genaue Vorhersagen über ihre Leistung zu treffen. Viele haben es jedoch versucht, weshalb wir uns mit einigen interessanten Gerüchten befassen müssen, während wir auf offizielle Benchmarks warten.
Die neueste leistungsbezogene Vorhersage stammt von OneRaichu auf X (Twitter) . Der Leaker sagt, dass die „Flaggschiff-Produkte“ 60 bis 70 % schneller sein werden als die Vorgängergeneration, was einen massiven Aufschwung für die RTX 5090 bedeutet. Angeblich handelt es sich um sogenannte „High-Level“-Produkte, womit wohl die RTX 5080 gemeint ist um 30–40 % schneller zu sein. Mittlerweile könnten Produkte der Mittelklasse – auch hier handelt es sich wahrscheinlich um die RTX 5070 Ti und RTX 5070 – etwa 20 bis 30 % schneller sein.
Es überrascht nicht, dass viele Leaks nicht mit den Vorhersagen von OneRaichu übereinstimmen. Laut „Moore's Law Is Dead“ dürfte die Leistungssteigerung zwischen Ada und Blackwell nicht groß sein. Die Quelle des YouTubers erwähnte, dass „Blackwells Rasterisierungssteigerung gegenüber Ada nicht so beeindruckend sein wird wie [von] Ampere zu Ada.“ Die Quelle sagte jedoch auch, dass Nvidia dem RTX 5090 das Gefühl geben könnte, ein ähnlicher Aufschwung zu sein, „wenn er sich bedroht fühlt“. Das scheint unwahrscheinlich, da AMD Berichten zufolge in der nächsten Generation von der Herstellung von High-End-GPUs zurücktritt und Nvidia möglicherweise für die nächsten Jahre der einzige Lieferant von High-End-Grafikkarten bleibt.
Basierend auf dem oben Gesagten könnten wir für das Flaggschiff mit Leistungssteigerungen in der Größenordnung von 30 bis 50 % rechnen. Mittelklasse- und Einsteigerkarten verzeichnen in der Regel von Generation zu Generation eine geringere Leistungssteigerung, sodass diese möglicherweise weniger beeindruckend sind.
Am anderen Ende des Spektrums stehen jedoch Spekulationen von Quellen wie RedGamingTech. Der YouTuber behauptet in seinem Video , dass wir eine bis zu zweifache Leistungssteigerung zwischen Lovelace und Blackwell erwarten. Er erwähnte, dass die RTX 50-Serie die Raytracing-Leistung im Vergleich zur RTX 40-Serie verdoppeln und eine bis zu zweifache Leistungssteigerung bieten soll. RedGamingTech ist sich jedoch nicht sicher, ob dies eine Rasterisierung bedeutet, daher ist es schwierig, die Metrik zu kennen, anhand derer diese Gewinne gemessen werden können. Er prognostiziert jedoch Taktraten von über 3 GHz, was eine deutliche Steigerung gegenüber Ada bedeuten würde, sagt aber auch, dass dies nur für übertaktete Modelle gilt.
In einem späteren Video fügte RedGamingTech hinzu , dass wir von einem Flaggschiff zum nächsten einen Anstieg von bis zu 60 % erleben könnten. Später stellte er dann klar, dass wir mit folgenden Leistungssteigerungen rechnen können, die mit einiger Skepsis betrachtet werden sollten:
- RTX 4090 zu RTX Titan AI: 63 % schneller
- RTX 4090 bis RTX 5090: 48 % schneller
- RTX 4080 Super zu RTX 5080: 29 % schneller
- RTX 4070 Super zu RTX 5070: 26 % schneller
Der YouTuber betonte außerdem, dass Nvidias Fokus stark auf Raytracing und Pathtracing liege und diese Arbeitslasten um das bis zu 2,5-fache gesteigert werden könne. Auch hier sollten Sie alle diese Informationen mit einer gewissen Vorsicht betrachten. AMD soll auch auf besseres Raytracing drängen – was einer der Gründe dafür ist, dass sich die RX 9070 XT als interessante Karte herausstellen könnte –, aber Nvidia bleibt hier fast garantiert der König.
Der einzige wirkliche Hinweis auf die Leistungszahlen, die wir derzeit haben, stammt von einer Folie von Nvidia, aber leider geht es auf der Folie um die High-Performance-Computing-Grafikkarte (HPC) der nächsten Generation, die in Rechenzentren verwendet wird. Die Grafik, die die GPU-Leistung in der GPT-3 175B-Inferenz misst, zeigt, dass die H200-GPU bis zu 18-mal schneller sein wird als die A100 – aber das ist noch keine Blackwell-Architektur. B100, die erste Blackwell-Grafikkarte auf der Liste, bietet eine deutlich höhere Leistung, obwohl Nvidia keine Zahl angegeben hat. Es scheint etwa doppelt so schnell zu sein wie das H200.
Während das für diejenigen, die eine HPC-GPU benötigen, spannend ist, müssen Gamer und andere Verbraucher warten, um die Realität über die Fähigkeiten der GPUs der RTX 50-Serie zu erfahren.
RTX 50-Serie: Stromverbrauch
Vor der Veröffentlichung der RTX 40-Serie war das Flaggschiff RTX 4090 Gegenstand vieler Gerüchte, und seine Machtabnahme war ein besonders heißes Thema. Einige Quellen behaupteten, dass die GPU einen wirklich monströsen Stromverbrauch und sogar bis zu 900 Watt erreichen würde. Wir wissen jetzt, dass diese Behauptungen falsch waren, da der RTX 4090 450 Watt verbraucht und sein Anschluss bis zu 600 W unterstützt, während er gelegentlich schmilzt . Es ist schwer vorstellbar, dass Nvidia diese Zahlen in der nächsten Generation von GPUs noch höher drücken wird.
Einige Leckagen sagten, dass der RTX 5090 möglicherweise zwei 16-polige Stromverbinder aufweisen. Dies ist eine Konfiguration, die wir in einigen aktuellen High-End-Netzteilen gesehen haben, und sie würde die GPU möglicherweise mit insgesamt 1.200 Watt Strom versorgen. Glücklicherweise war es unwahrscheinlich, dass dies mit einem chinesischen PSU -Hersteller kürzlich einen besorgten Nvidia -Fan tröstete. Die Marke sagte in ihren sozialen Medien: " Es gibt keine solche Möglichkeit ."
Die RTX 50-Serie war jedoch nicht in der Lage, einige strombedingte Kontroversen zu vermeiden. Moore's Law ist kürzlich tot bekannt, dass Nvidia plant, einen völlig neuen Stecker zu verwenden, der die vierte solche Veränderung in nur drei Jahren markieren würde. Der YouTuber zitiert anonyme Quellen und behauptet, dass Nvidia zu einem 16-poligen Stecker wechselt, der alle der 12-V-Stromversorgung gewidmet ist. Viele andere Quellen weisen jedoch darauf hin, dass dies unwahrscheinlich ist.
Hardware Busters wandten sich an seine eigenen Quellen und bestätigte, dass „niemand einen neuen Anschluss bewusst ist“. Nvidia müsste mit großen PSU -Marken zusammenarbeiten, insbesondere nach den Problemen mit dem 12VHPWR -Connector. Wenn diese Marken nichts darüber wissen, nimmt Nvidia diese Änderungen in dieser Generation oder überhaupt nicht vor.
Tatsächlich kann Nvidia die Wahl für die Verwendung des 12VHPWR -Anschlusses tatsächlich verdoppeln. Laut TechRadar könnte NVIDIA den 12VHPWR-Anschluss für jede GPU für die gesamte RTX 50-Serie-Stack für jede GPU machen, sogar für die Einstiegs-RTX 5060.
Angenommen, Nvidia bleibt an dem (etwas umstrittenen) 12 -VHPWR -Anschluss, den er derzeit verwendet, der maximale Stromverbrauch bleibt bei 600 W. Das Flaggschiff RTX 5090 könnte eine Zunahme der Stromauslosung verzeichnen, wenn es eine wesentlich mehr Leistung bietet, aber es muss noch etwas Platz für potenzielle Übertakte lassen, sodass maximal 500 W angemessen zu sein scheint. Eine neue Quelle glaubt jedoch immer noch, dass wir auf dem RTX 5090 einen 600 -W -TGP sehen werden .
Für den Rest der Aufstellung ist es möglich, dass Nvidia versucht, die Dinge konservativer zu halten, anstatt auf einen höheren Stromverbrauch zu drängen. Wie von NotookCheck hervorgeht, ist der derzeitige Trend von NVIDIA zur Erhöhung der Gesamtzahl der Board Power (TBP) immer noch ziemlich neu – insbesondere bei Karten wie dem RTX 4080 . Historisch gesehen blieben XX80 -Karten unter 300 W gut und fielen manchmal sogar unter 200 W. In den letzten Generationen haben die RTX 3080 und der RTX 4080 den TBP auf neue Höhen gedrückt, wobei jeweils bis zu 320 W erforderlich war.
Mit so hocher Stromverbrauch ist es für Nvidia nicht viel Sinn, weiter auf noch höhere Wattages zu drängen, insbesondere wenn AMD in rDNA konservativer hält. Wenn Nvidia es ein wenig zurückweist, Wir könnten den RTX 5080 mit einem TBP von rund 250 W bis 280 W sehen. Wenn Nvidia jedoch an seinem aktuellen Schema bleibt, kann es in die andere Richtung gehen und bis zu 350 W. oder höher treffen, wenn das neueste Leck zu glauben ist.