Nowy artykuł: Recenzja karty NVIDIA GeForce RTX 5090: Dlaczego flagowe karty do gier już nie istnieją

Redaktor NetMaster
Redaktor NetMaster
48 min. czytania

Kiedy narzekaliśmy na niską wydajność większości modeli GeForce 40 i rosnący koszt kart graficznych, nikt nie mógł sobie wyobrazić skali wszystkich tych problemów w kolejnej generacji. Rodzina procesorów graficznych Blackwell charakteryzuje się wieloma udoskonaleniami architektonicznymi, które połączono z nowymi narzędziami programowymi NVIDIA. Jednakże długotrwała dominacja na rynku logiki GPU ma też swoje minusy. Podczas gdy AMD i Intel czynią wielkie postępy w usuwaniu błędów, zielone układy scalone są ściśle związane z normą fotolitograficzną, ale tym razem to się nie zmieniło. W efekcie niemal wszystkie akceleratory linii 50 okazały się, z praktycznego punktu widzenia, wznowieniami urządzeń, które NVIDIA wypuściła przed rokiem, tyle że z możliwością generowania wielu klatek.

Ale GeForce RTX 5090 to zupełnie inna bestia, ponieważ GPU flagowej karty graficznej jest prawie dwa razy większe niż w RTX 5080. Ale żeby wycisnąć taki produkt z technologii procesu TSMC 4N, musieli bardzo mocno naciskać. Stąd sugerowana cena detaliczna wynosząca 1999 dolarów, niedobory i wadliwe kryształy, nie wspominając o astronomicznym zużyciu energii.

⇡#Procesor graficzny GB202

W naszej niedawnej recenzji GeForce RTX 5080 szczegółowo przeanalizowaliśmy architekturę procesorów graficznych stanowiących podstawę „zielonych” akceleratorów serii 50. Tym razem skupimy się na kwestiach praktycznych. W logice układów Blackwell zastosowano więcej podstawowych innowacji niż w przypadku układów Ada Lovelace poprzedniej generacji, ale na pierwszy plan ponownie wysunęły się funkcje śledzenia promieni i skalowania DLSS. W szczególności MFG polega na generowaniu kilku klatek na raz (maksymalnie trzech) za pomocą sieci neuronowej w odstępach między „rzeczywistymi” klatkami, które przeszły przez cały proces renderowania.

Tradycyjnie marketing serii GeForce 50 opiera się na MFG, jednak flagowy model, w przeciwieństwie do wszystkich innych, potrafi sam się wykazać pod względem wydajności. Kryształ GB202 zawiera 92,2 miliarda tranzystorów, a jego powierzchnia (750 mm2) jest zbliżona do rozmiaru fotomaski TSMC. Nawiasem mówiąc, budżet tranzystorów układu GB100 (układ HPC linii Blackwell) jest tylko nieznacznie większy – 104 miliardy – i to wiele wyjaśnia w kontekście wydarzeń związanych z kartą GeForce RTX 5090.

Silnik obliczeniowy GPU obejmuje 24 576 jednostek ALU obsługujących architekturę FP32, co stanowi wzrost o 33% w porównaniu z poprzednim procesorem AD102. Układ zawiera również 128 MB pamięci podręcznej ostatniego poziomu i 512-bitowy interfejs VRAM, czego nie widziano w konsumenckich procesorach graficznych od czasów „czerwonych” układów Hawaii/Grenada (seria Radeon R 200/300). Różnica między GB202 a kolejnym najstarszym chipem w serii, GB203, jest większa niż kiedykolwiek. Dzięki dwukrotnej różnicy w powierzchni rdzenia i budżecie tranzystorów, flagowy procesor graficzny przewyższa GB203 nawet o 129% pod względem liczby rdzeni CUDA.

ProducentNVIDIANazwa103 r. n.e.102 r. n.e.GB203GB202Gdzie się go stosuje?

RTX 4070 Ti SUPER;

Karta graficzna RTX 4080;

RTX 4080 SUPER

Karta graficzna RTX 4090 D;

Karta graficzna RTX 4090

Karta graficzna RTX 5070 Ti;

Karta graficzna RTX 5080

RTX 5090ArchitekturaAda LovelaceCzarna studniaProces technologiczny, nmTSMC 4NTSMC 4NPLiczba tranzystorów, miliardy45,976,345,692,2Powierzchnia układu scalonego, mm2378,6608,6378750Numer SM/TPC/GPCMultiprocesory strumieniowe (SM)8014484192Klastry przetwarzania wątków (TPC)40724296Klastry przetwarzania grafiki (GPC)712712Konfiguracja procesora strumieniowego (SM)Jednostki ALU wektorowe (FP32/INT32)4×16 (FP32) + 4×16 (FP32/INT32)8 x 16Jednostki ALU wektorowe (FP64)2Skalarne jednostki ALU4Jednostka specjalnego przeznaczenia (SFU) ALU4x4Rdzenie tensorowe4x1Rdzenie RT1Jednostki mapowania tekstur (TMU)4Zarejestruj rozmiar pliku, KB256Rozmiar pamięci podręcznej/pamięci współdzielonej L1, KB128Jednostki obliczeniowe GPUJednostki ALU wektorowe (FP32)10 24018 43210 75224 576Rdzenie tensorowe320576336768Rdzenie RT8014484192Jednostki mapowania tekstur (TMU)320576336768Bloki operacyjne rastrowe (ROP)112192192192Konfiguracja pamięciRozmiar pamięci podręcznej L2, MB649664128Szerokość magistrali VRAM, bity256384256512Typ układu VRAMPamięć SRAM GDDR6XPamięć GDDR7 SDRAMMagistrala PCI Express4,0x165,0x16

Układy scalone Blackwell są produkowane w zakładach TSMC z wykorzystaniem procesu technologicznego 4NP, który jest drugą wersją 5-nanometrowej fotolitografii dostosowaną do potrzeb firmy NVIDIA. Opóźnienie migracji do normy 3 nm miało wyraźnie widoczne konsekwencje. Poprzednie przejście z architektury Ampere na Ada Lovelace, w połączeniu z udoskonaleniem procesu technologicznego, charakteryzowało się wzrostem mocy obliczeniowej flagowego procesora graficznego o 72% bez konieczności zmiany częstotliwości taktowania i co najważniejsze – w ramach dotychczasowych rezerw mocy. Z kolei GeForce RTX 5090 charakteryzuje się ekstremalnie wysokim poborem energii, mimo że karta ta nie jest wyposażona w w pełni odblokowany procesor graficzny. W przypadku monolitycznej konstrukcji i powierzchni takiej jak GB202, wydajność pracy kryształów nieuchronnie spada, co ma bezpośredni wpływ na cenę finalnych urządzeń. A w przypadku kart graficznych serii 50, z jakiegoś powodu wadliwe GPU (z niekompletnym zestawem ROP) nawet trafiły do ​​nabywców.

Ale mimo wszystko GB202 robi wrażenie na żywo – wystarczy spojrzeć na tę ogromną obudowę otoczoną 16 modułami VRAM!

⇡#Dane techniczne, ceny

Do testów karty GeForce RTX 5090 wybraliśmy kartę Palit GameRock bez oznaczenia OC, co oznacza, że ​​karta działa z referencyjną częstotliwością taktowania. Bazowe taktowanie procesora graficznego wynosi 2107 MHz, a taktowanie Game Clock (taktowanie projektowe podczas grania, które NVIDIA szacuje ostrożnie) wynosi 2407 MHz. Macierz jednostek obliczeniowych GB202 karty GeForce RTX 5090 została zredukowana do 22 procesorów strumieniowych, które zawierają łącznie 2816 jednostek ALU shaderów z obsługą FP32.

Biorąc pod uwagę częstotliwości taktowania i zablokowane SM, różnica w teoretycznej wydajności między GeForce RTX 4090 i RTX 5090 wynosi nie 33, a 27%. Jeśli jednak za punkt wyjścia przyjmiemy GeForce RTX 5080, to możemy mówić o 86-procentowym wzroście wydajności. Ponadto GeForce RTX 5090 oferuje 32 GB pamięci VRAM GDDR7 o przepustowości 28 Gb/s, podczas gdy RTX 5080 ma tylko 16 GB pamięci VRAM. Do niedawna wydawało się, że tylko programy robocze są w stanie obsłużyć tak dużą liczbę gier, ale zainteresowanie nimi rośnie w przyspieszonym tempie. Tak więc w filmie Indiana Jones and the Great Circle karta graficzna z 16 GB pamięci po prostu nie pozwoli na połączenie maksymalnych ustawień graficznych z rozdzielczością 4K, niezależnie od skalowania klatek.

ProducentNVIDIAModelGeForce RTX 4080GeForce RTX 4080 SUPERGeForce RTX 4090GeForce RTX 5080GeForce RTX 5090Procesor graficznyNazwa103 r. n.e.103 r. n.e.102 r. n.e.GB203GB202ArchitekturaAda LovelaceCzarna studniaProces technologicznyTSMC 4NTSMC 4NPLiczba tranzystorów, miliardy45,945,976,345,692,2Częstotliwość zegara (taktowanie bazowe/taktowanie przyspieszone), MHz2 210/2 5052 205/2 5502 230/2 5202 295/2 6172 017/2 407Jednostki ALU shaderów (FP32)9 72810 24016 38410 75221 760Jednostki mapowania tekstur (TMU)304320512336680Bloki operacyjne rastrowe (ROP)112112176168340Rdzenie tensorowe304320512336680Rdzenie RT768012884170Rozmiar pamięci podręcznej L2, MB6464966488BARANSzerokość magistrali, bity256256384256512Rodzaj mikroukładówPamięć SRAM GDDR6XPamięć GDDR7 SDRAMPrzepustowość na kontakt, Gbps22.423213028Całkowita przepustowość, Gbps7177361 0089601 792Objętość, GB1616241632WydajnośćMaksymalna wydajność FP32, TFLOPS49528356105Wydajność FP64/FP321/64Wydajność FP16/FP321/1InnyMagistrala PCI ExpressPCI Express 4.0 x16PCI Express 5.0 x16Interfejsy wyjściowe obrazuZłącze DisplayPort 1.4aDisplayPort 2.1b, HDMI 2.1bTDP/TBP, W320320450360575Cena detaliczna (USA), $1199 (zalecane w momencie premiery)999 (zalecane w momencie wydania)1599 (zalecane w momencie premiery)999 (zalecane w momencie wydania)1999 (zalecane w momencie premiery)

Referencyjny pobór mocy karty GeForce RTX 5090 wynosi 575 W. W ten sposób akcelerator niemal całkowicie wyczerpuje 600-watowy zapas mocy projektowej kabla 12V-2×6. Nic dziwnego, że niektóre modele kart graficznych oferowane przez producentów są wyposażone w dwa złącza tego typu jednocześnie. W części empirycznej recenzji omówimy problemy, na jakie mogą natrafić użytkownicy, gdy linia zasilania karty graficznej pracuje na granicy swoich możliwości.

W końcu NVIDIA wypuściła GeForce RTX 5090 z sugerowaną ceną detaliczną 1999 USD — o 25% wyższą niż sugerowana cena detaliczna poprzedniego flagowca, RTX 4090. Okazuje się, że kurs wymiany NVIDIA na zwiększoną wydajność jest mniej więcej taki sam, jak kurs wymiany dolara w ZSRR: jeden do jednego. Lub, jeśli wolisz, cena nowego produktu po prostu ustaliła rzeczywiste kwoty, za jakie RTX 4090 był sprzedawany przez większość swojego cyklu życia, podczas gdy RTX 5090 cierpi na ten sam niedobór w trzecim miesiącu po rozpoczęciu sprzedaży.

W Rosji sytuację pogarszają czynniki lokalne. GeForce RTX 5090 nie jest dostępny za mniej niż 349 999 rubli. — tyle kosztuje modyfikacja Palit GameRock bez fabrycznego podkręcania, o czym pomyślimy w recenzji.

⇡#Palit GeForce RTX 5090 GameRock: budowa

Styl i ogólny design GeForce RTX 5090 pod marką Palit GameRock sprawiają, że karta graficzna jest podobna do GeForce RTX 5080 o tej samej nazwie. Ogólne wymiary urządzenia wynoszą 331,9 × 150 × 70,4 mm, co oznacza, że ​​potrzebuje czterech gniazd rozszerzeń w obudowie komputera.

Przedni panel obudowy układu chłodzenia ma lustrzaną powierzchnię i schodkową rzeźbę, która odbija światło paska LED otaczającego wentylatory. Podświetleniem można sterować osobno lub zsynchronizować je z płytą główną poprzez złącze ARGB, które znajduje się obok wejścia zasilania 12V-2×6.

Boczne krawędzie obudowy układu chłodzenia utworzone są przez monolityczną ramę aluminiową z poprzecznymi otworami wentylacyjnymi. Metalowa płytka z tyłu płytki drukowanej posiada duże okienko w obszarze projekcji jednego z wentylatorów. Same wentylatory, których średnica wirnika wynosi 94 mm, zaczynają się obracać dopiero przy dużym obciążeniu procesora graficznego. W stanie warunkowego bezczynności akcelerator jest chłodzony pasywnie.

Grzejnik Palit GeForce RTX 5090 GameRock został zaprojektowany tak samo jak RTX 5080. Kryształ GPU i chipy GDDR7 są przykryte wspólną komorą parowania. Z kolei zespoły tranzystorów i dławiki VRM są wyposażone w własne radiatory płytowe. Jednak komora parowania w starszym modelu jest znacznie większa, a bloki lamelowe mają inne wymiary. Tutaj znajduje się osiem rurek cieplnych o średnicy 8 mm.

Mimo że tylna płyta Palit GameRock jest metalowa, nie ma pod nią żadnych podkładek termicznych, co oznacza, że ​​płytka nie przyczynia się do chłodzenia płytki PCB.

W pudełku z kartą graficzną znaleźliśmy przejściówkę z czterech starych wtyczek ośmiopinowych na standard 12V-2×6, kabel synchronizacyjny ARGB, gotowy wspornik do montażu karty graficznej i materiałową podkładkę pod mysz.

⇡#Palit GeForce RTX 5090 GameRock: płytka drukowana

Mimo że Palit nie stosuje tak miniaturowej płytki PCB jak w akceleratorach Founders Edition, gęstość komponentów na płytce PCB jest nadal bardzo duża. Masywna struktura GPU otoczona jest 16 układami GDDR7 (wszystkie na froncie) i 31 fazami VRM. 22 fazy należą do regulatora napięcia GPU, pozostałe 7 zasila układy pamięci wideo. Oba regulatory wyposażone są w stopnie mocy MPS MP87993 firmy Monolithic Power Systems o szacowanym prądzie znamionowym 90 A i są sterowane przez wspólny sterownik PWM MP29816.

Chipy GDDR7 firmy Samsung noszą oznaczenie K4VAF325ZC-SC28, co wskazuje na przepustowość 28 Gb/s. Karta graficzna ma dwa układy BIOS – z oprogramowaniem układowym „cichym” i „produktywnym”.

⇡#Stanowisko testowe, metodologia testowania

Stanowisko testoweProcesorAMD Ryzen 9 7950X3D (PBO +150 MHz, CU -20)Płyta głównaASUS ROG Crosshair X670E BohaterBARANG.Skill Trident Z5 Neo RGB (F5-6000J3040G32GX2-TZ5NR), 2 x 32 GB (6200 MT/s, CL30)ROMSolidigm P44 Pro, 2TBjednostka napędowaCorsair AX1600i, 1600WUkład chłodzenia procesoraNiestandardowy system chłodzenia cieczą (EK-Quantum Velocity² DDC 4.2 PWM D-RGB + EK-Quantum Surface X280M)RamaOtwarte stoiskosystem operacyjnyWindows 11 ProOprogramowanie dla procesorów graficznych AMDWszystkie karty graficzneOprogramowanie AMD Adrenalin Edition 25.2.1Oprogramowanie GPU NVIDIAWszystkie karty graficzneSterownik NVIDIA GeForce Game Ready 572.60Gry bez śledzenia promieniGraAPIMetoda testowaniaUstawienia grafikiAlan Wake 2DirectX 12OCAT, lokalizacja Bright FallsMaks. jakość grafikiCzarny Mit: WukongDirectX 12Wbudowany test porównawczyMaks. jakość grafikiCyberpunk 2077DirectX 12Wbudowany test porównawczyMaks. jakość grafikiF1 24DirectX 12Wbudowany benchmark, trasa Monako (deszcz)Maks. jakość grafikiDziedzictwo HogwartuDirectX 12OCAT, przejażdżka tramwajem w drodze do HogwartuMaks. jakość grafikiHorizon Zero Dawn RemasteredDirectX 12Wbudowany test porównawczyMaks. jakość grafikiMetro ExodusDirectX 12Wbudowany test porównawczyMaks. jakość grafiki; Współczynnik zacienienia: 100%Red Dead Redemption 2WulkanWbudowany test porównawczyMaks. jakość grafikiZwrotnyDirectX 12Wbudowany test porównawczyMaks. jakość grafikiTotal War: WARHAMMER IIIDirectX 11Wbudowany test porównawczy (Mirrors of Madness Benchmark)Maks. jakość grafikiGry z Ray TracingiemGraAPIMetoda testowaniaUstawienia grafikiSkalowanie ramekAMDIntelNvidiaAlan Wake 2DirectX 12OCAT, lokalizacja Bright FallsMaks. jakość grafiki, wysokiej jakości śledzenie promieniFSR ZrównoważonyFSR ZrównoważonyDLSS Balanced + Ray Reconstruction (+ Generowanie Klatek)Czarny Mit: WukongWbudowany test porównawczyMaks. jakość grafiki i śledzenie promieni (Path Tracing)FSR Balanced (+ generowanie ramek)XeSS Balanced/FSR Balanced + Generowanie RamekDLSS zrównoważony (+ generowanie klatek)Cyberpunk 2077Wbudowany test porównawczy (OCAT do generowania ramek)Maks. jakość grafiki i śledzenie promieni (Path Tracing)FSR Balanced (+ generowanie ramek)XeSS Balanced/FSR Balanced + Generowanie RamekDLSS Balanced (model transformatora) + rekonstrukcja promieni (+ generowanie klatek)F1 24Wbudowany benchmark, trasa Monako (deszcz)Maks. jakość grafiki i śledzenie promieniFSR Balanced (+ generowanie ramek)XeSS Balanced/FSR Balanced + Generowanie RamekDLSS zrównoważony (+ generowanie klatek)Dziedzictwo HogwartuOCAT, przejażdżka tramwajem w drodze do HogwartuMaks. jakość grafiki i śledzenie promieniFSR ZrównoważonyZbalansowany XeSSDLSS Balanced + Ray Reconstruction (+ Generowanie Klatek)Indiana Jones i Wielkie KołoOCAT, lokalizacja SukhothaiMaks. jakość grafiki, wysokiej jakości śledzenie promieni (Path Tracing); Cienie śledzone promieniami: Tylko światło słoneczneFSR Balanced (+ generowanie ramek)XeSS Balanced/FSR Balanced + Generowanie RamekDLSS Balanced (model transformatora) + rekonstrukcja promieni (+ generowanie klatek)Metro Exodus Edycja RozszerzonaWbudowany test porównawczyMaks. jakość grafiki i śledzenie promieniBrakBrakZrównoważony DLSSZwrotnyWbudowany test porównawczy (OCAT do generowania ramek)Maks. jakość grafiki i śledzenie promieniFSR Balanced (+ generowanie ramek)XeSS Balanced/FSR Balanced + Generowanie RamekDLSS zrównoważony (+ generowanie klatek)

W większości gier średnia i minimalna (podajemy 1. percentyl rozkładu) liczba klatek na sekundę jest wyznaczana na podstawie tablicy czasów renderowania poszczególnych klatek lub z chwilowej liczby klatek na sekundę uzyskanej za pomocą wbudowanego testu porównawczego. Wyjątkiem są gry, które nie mają wbudowanego testu porównawczego oraz testy wykorzystujące generowanie klatek: w takich przypadkach do przechwytywania odstępów międzyklatkowych wykorzystujemy program OCAT.

Aplikacje o pracęAplikacjaReperUstawieniaAdobe Premiere Pro 25.xPugetBench dla Premiere Pro 1.1.1 (lista testów pod linkiem)Standardowy (4K)Blender 4.xDemonstracja Agent 327 Barbershop z BlenderaRenderer cykliProjekt Blackmagic DaVinci Resolve Studio 19.xPugetBench dla DaVinci Resolve 1.1.1 (testy pod linkiem)Standardowy (4K); Tryb kodowania H.264/HEVC: automatycznyAplikacje CADSPECviewperf 2020 w wersji 3.1Rozdzielczość ekranu: 3840 × 2160Dekodowanie wideo (ffmpeg 5.x)FormatPozwolenieParametry kodowaniaAPIH.264 (YUV 4:2:0, 8 bitów/kanał)1920×1080Wysoki profil, L4.1D3D11VA3840×2160Wysoki profil, L5.1HEVC (YUV 4:2:0, 8 bitów/kanał)1920×1080Profil główny, L4.03840×2160Profil główny, L5.07680×4320Profil główny, L6.0VP9 (YUV 4:2:0, 8 bitów/kanał)1920×1080Brak3840×21607680×4320AV1 (YUV 4:2:0, 8 bitów/kanał)1920×1080Profil główny, L4.03840×2160Profil główny, L5.07680×4320Profil główny, L6.0Kodowanie wideo (ffmpeg 5.x)FormatPozwolenieParametry kodowaniaAPIAMDIntelNvidiaAMDIntelNvidiaH.264 (YUV 4:2:0, 8 bitów/kanał)1920×1080-c:v h264_amf -jakość prędkość -coder cabac -refs 1 -b:v 3M-c:v h264_qsv -preset veryfast -profile:v main -level 4.1 -b:v 3M-c:v h264_nvenc -preset fast -coder cabac -refs 1 -b:v 3MAMFjedenVPLNWEN3840×2160-c:v h264_amf -jakość prędkość -koder cabac -refs 1 -b:v 7,5M-c:v h264_qsv -preset veryfast -profile:v main -level 5.1 -b:v 7.5M-c:v h264_nvenc -preset fast -coder cabac -refs 1 -b:v 7,5MHEVC (YUV 4:2:0, 8 bitów/kanał)1920×1080-c:v hevc_amf -jakość prędkość -b:v 3M-c:v hevc_qsv -preset veryfast -tier main -b:v 3M-c:v hevc_nvenc -preset szybki -b:v 3M3840×2160-c:v hevc_amf -jakość prędkość -b:v 7,5M-c:v hevc_qsv -preset veryfast -tier main -b:v 7,5M-c:v hevc_nvenc -preset fast -b:v 7,5M7680×4320-c:v hevc_amf -jakość prędkość -b:v 20M-c:v hevc_qsv -preset veryfast -tier main -b:v 20M-c:v hevc_nvenc -preset szybki -b:v 20MAV1 (YUV 4:2:0, 8 bitów/kanał)1920×1080-c:v hevc_amf -jakość prędkość -b:v 3M-c:v av1_qsv -preset veryfast -profile main -b:v 3M-c:v hevc_nvenc -preset szybki -b:v 3M3840×2160-c:v hevc_amf -jakość prędkość -b:v 7,5M-c:v av1_qsv -preset veryfast -profile main -b:v 7,5M-c:v hevc_nvenc -preset fast -b:v 7,5M7680×4320-c:v hevc_amf -jakość prędkość -b:v 20M-c:v av1_qsv -preset veryfast -profile main -b:v 20M-c:v hevc_nvenc -preset szybki -b:v 20M

Moc karty graficznej jest rejestrowana oddzielnie od mocy procesora i innych podzespołów komputera za pomocą urządzenia NVIDIA PCAT. Obciążeniem dla testów poboru mocy i hałasu jest gra Cyberpunk 2077 w rozdzielczości 3840 × 2160 i maksymalnych ustawieniach jakości grafiki (bez ray tracingu), a także test obciążeniowy FurMark z najbardziej agresywnymi ustawieniami (rozdzielczość 3840 × 2160, MSAA 8x). Pomiary wszystkich parametrów należy wykonywać po rozgrzaniu karty graficznej, gdy temperatura procesora graficznego i częstotliwość taktowania ustabilizują się.

⇡#Uczestnicy testu

W testach wydajnościowych wzięły udział następujące karty graficzne:

Palit GeForce RTX 5090 GameRock (2017/2407 MHz, 28 Gb/s, 32 GB);NVIDIA GeForce RTX 5080 (2295/2617 MHz, 30 Gb/s, 16 GB);NVIDIA GeForce RTX 4090 (2235/2535 MHz, 21 Gb/s, 24 GB);NVIDIA GeForce RTX 4080 SUPER (2295/2580 MHz, 23 Gb/s, 16 GB);NVIDIA GeForce RTX 4080 (2205/2505 MHz, 22,4 Gb/s, 16 GB);NVIDIA GeForce RTX 3090 (1395/1695 MHz, 19,5 Gb/s, 24 GB);AMD Radeon RX 7900 XTX (1720/2499 MHz, 20 Gb/s, 24 GB).

Notatka: Częstotliwości bazowe i wzmocnienia procesora graficznego podano w nawiasach.

⇡#Częstotliwości zegara, pobór mocy, temperatura, poziom hałasu i podkręcanie

Mimo dwukrotnej różnicy w liczbie tranzystorów i powierzchni między starszymi układami scalonymi z linii Blackwell, taktowanie procesora graficznego GB202 podczas gier utrzymuje mniej więcej tę samą częstotliwość co GB203 – około 2,8 GHz.

Wydajność pod obciążeniem (Cyberpunk 2077)Karta graficznaUstawieniaPrędkość zegara GPU, MHz (domena shaderów)Prędkość zegara GPU, MHz (front-end)Napięcie zasilania GPU, VPrędkość wentylatora, obr./min (% maks.)Prędkość wentylatora 2, obr./min (% maks.)Śred.Maks.Śred.Maks.Śred.Maks.Śred.Śred.Palit GeForce RTX 5090 GameRock (2017/2407 MHz, 28 Gb/s, 32 GB)Cichy BIOS27782782BrakBrak1.051.052102 (57%)2102 (57%)Palit GeForce RTX 5090 GameRock (2017/2407 MHz, 28 Gb/s, 32 GB)BIOS wydajnościowy27822782BrakBrak1.051.052192 (60%)2192 (60%)Palit GeForce RTX 5090 GameRock (+200 MHz, 32 Gb/s, 32 GB)BIOS wydajnościowy29582977BrakBrak1.041.042197 (60%)2198 (60%)NVIDIA GeForce RTX 3090 FE (1395/1695 MHz, 19,5 Gb/s, 24 GB)18171830BrakBrak0,900,911141 (43%)1141 (43%)NVIDIA GeForce RTX 4080 FE (2205/2505 MHz, 22,4 Gb/s, 16 GB)27752775BrakBrak1.081.081383 (43%)1299 (39%)Palit GeForce RTX 4080 SUPER JetStream OC (2295/2580 MHz, 23 Gb/s, 16 GB)27222745BrakBrak1.041.071473 (39%)1473 (39%)GIGABYTE GeForce RTX 4090 Gaming OC (2235/2535 MHz, 21 Gb/s, 24 GB)Cichy BIOS27302730BrakBrak1.051.051610 (75%)1481 (82%)Palit GeForce RTX 5080 GameRock (2295/2617 MHz, 30 Gb/s, 16 GB)Cichy BIOS27902790BrakBrak1.041.041490 (40%)1490 (40%)SAPPHIRE NITRO+ Radeon RX 7900 XTX (1720/2499 MHz, 20 Gb/s, 24 GB)BIOS pomocniczy25452585275327850,910,931412 (34%)Brak

Czynniki te przyczyniają się również do ogromnego zużycia energii przez GeForce RTX 5090. Nawet w grach bez ray tracingu karta graficzna wykorzystuje niemal cały swój rzeczywisty zapas mocy, który wynosi 626 W. Warto zwrócić uwagę na wysoką moc bez obciążenia – 49 W.

Sterowniki kart GeForce z serii 50 nie przesyłają do programów innych firm danych dotyczących lokalnego nagrzewania się procesora graficznego – przekazują jedynie dane o ogólnej temperaturze (na podstawie danych z jednego czujnika lub uśrednionych wartości z kilku). Zmiana oprogramowania układowego za pomocą przełącznika na karcie graficznej nie ma znaczącego wpływu na wydajność chłodzenia: temperatura kryształu oscyluje wokół 80 °C, a kości pamięci nagrzewają się do 84–86 °C.

GeForce RTX 5090 (przynajmniej w modyfikacji Palit GameRock) jest głośną kartą graficzną: zarówno w grach, jak i w teście obciążeniowym ciśnienie akustyczne w odległości 30 cm od chłodnicy osiąga 46 dBA, a „cichy” BIOS jest w stanie je obniżyć jedynie o 1 dBA.

Wersja GameRock bez OC nie pozwala na zwiększenie znamionowego poboru mocy ponad domyślne 575 W. Udało nam się jednak dodać 200 MHz do docelowej częstotliwości taktowania procesora graficznego, a rzeczywista częstotliwość taktowania pod obciążeniem wzrosła o 176 MHz. Z kolei pamięć wideo pracuje stabilnie z prędkością 32 Gbps zamiast standardowych 28 Gbps. Niestandardowe podkręcanie nie miało znaczącego wpływu na zużycie energii przez urządzenie ani na temperaturę podzespołów, a tym samym na poziom hałasu.

W przypadku, gdy karta graficzna pobiera więcej niż 600 W mocy (a zatem wykracza już poza obliczeniowy zakres kabli 12V-2×6!), należy zwrócić szczególną uwagę nie tylko na zasilanie, ale także na jakość połączeń elektrycznych. Nawet na otwartym stanowisku testowym obie części złącza 12V-2×6 nagrzewają się do 65 °C przy maksymalnym obciążeniu procesora graficznego, co jest całkowicie akceptowalne, biorąc pod uwagę znamionową temperaturę pracy złącza (do 105 °C). Jednakże sytuacja ulegnie natychmiastowej zmianie, jeżeli żyły kabla będą miały różną rezystancję. Oto przykład.

Do pomiaru zużycia energii wykorzystaliśmy płytkę PCAT firmy NVIDIA, która jest wyposażona w trzy boczniki wykrywające prąd i nie posiada złączy 12V-2×6 ani 12VHPWR. W związku z tym kartę GeForce RTX 5090 należało podłączyć do PCAT za pomocą dołączonego adaptera ze złączy ośmiopinowych na 12 V-2×6. W tym przypadku, jeśli jeden kabel ma większy przekrój rdzenia niż pozostałe dwa (16 w porównaniu do 18 AWG), przez niego przepływa około połowa prądu obciążenia! Zaobserwowane przekoszenie pokrywa się z ogólną różnicą w przekroju poprzecznym przewodników, co oznacza, że ​​karta graficzna nie wykonuje żadnego wyrównywania prądu na stykach 12V-2×6. Możliwe wady złącza, kabla lub zespołu mogą łatwo doprowadzić do lokalnego przegrzania ze wszystkimi tego konsekwencjami.

Ryzyko błędu zwiększa się po przejściu zasilacza z kabla 8-żyłowego na 12V-2×6. Nie nagrzewa się on jednak bardziej niż „rodzimy” kabel 12V-2×6 w miejscu styku z kartą graficzną i w pewnych warunkach jest jeszcze bardziej niezawodnym rozwiązaniem. Jeśli zasilacz jest „cyfrowy” i pozwala na ustawienie ograniczenia prądu na poszczególnych złączach ośmiopinowych, nie zastąpi to wyrównywania, ale jeśli wystąpi krytyczna różnica w prądach, to przynajmniej zadziała zabezpieczenie, a użytkownik zostanie poinformowany o usterce.

⇡#Testy gry (1920 × 1080)

Wydajność karty GeForce RTX 5090 nie jest szczególnie godna uwagi w grach bez obsługi ray tracingu, a tym bardziej w rozdzielczości 1080p, nawet w połączeniu z podkręconym procesorem Ryzen 9 7950X3D. W porównaniu do GeForce RTX 4090 średnia liczba klatek na sekundę wzrosła zaledwie o 10%, a przewaga flagowca nad GeForce RTX 5080 wynosi 16% FPS. Jeśli jednak za punkt wyjścia przyjmiemy akceleratory wyższej klasy – GeForce RTX 4080, RTX 4080 SUPER i Radeon RX 7900 XTX – możemy mówić o wzroście FPS rzędu 20-28%. Wreszcie, zmiana GeForce RTX 3090 na RTX 5090 zwiększa liczbę klatek na sekundę półtora raza.

1920 × 1080NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 2179 / 188100 / 104122 / 128123 / 129155 / 161135 / 146143 / 148Czarny Mit: Wukong91 / 10145 / 5258 / 6860 / 6973 / 8567 / 7653 / 64Cyberpunk 2077134 / 183100 / 115118 / 139115 / 138131 / 166128 / 167138 / 166F1 24220 / 343146 / 212171 / 251175 / 253197 / 298187 / 275167 / 263Dziedzictwo Hogwartu211 / 235162 / 182173 / 193181 / 197218 / 240193 / 218196 / 216Horizon Zero Dawn Remastered137 / 183125 / 154142 / 182145 / 185134 / 184141 / 186146 / 187Metro Exodus87 / 19064 / 11579 / 14681 / 14894 / 17588 / 16781 / 140Red Dead Redemption 2161 / 18089 / 97119 / 126119 / 127143 / 153125 / 132122 / 128Zwrotny132 / 24091 / 142100 / 17991 / 178116 / 208105 / 199134 / 211Total War: WARHAMMER III83 / 10773 / 9286 / 10388 / 10583 / 10583 / 10585 / 107Maks.−14%−1%+1%+2%+2%+2%Średni.−35%−22%−21%−9%−14%−16%Min.−49%−33%−32%−16%−27%−37%

W liczbach bezwzględnych GeForce RTX 5090 gwarantuje liczbę klatek na sekundę wynoszącą co najmniej 100 FPS nawet w najbardziej wymagających tytułach, a w prostszych grach liczba ta sięga setek.

⇡#Testy gry (2560 × 1440)

W rozdzielczości 1440p karta GeForce RTX 5090 przekracza 100 FPS w większości testów wydajnościowych gier, i to ze znaczną przewagą (wyjątkiem jest tu Black Myth: Wukong).

2560 × 1440NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 2145 / 15170 / 7690 / 9592 / 97117 / 123104 / 109103 / 107Czarny Mit: Wukong76 / 8535 / 4046 / 5247 / 5460 / 6854 / 6143 / 50Cyberpunk 2077124 / 14758 / 6967 / 8067 / 8080 / 9789 / 10290 / 103F1 24205 / 309124 / 176148 / 211154 / 218180 / 263161 / 231162 / 228Dziedzictwo Hogwartu205 / 226109 / 128124 / 139125 / 142166 / 185141 / 165141 / 160Horizon Zero Dawn Remastered130 / 173104 / 126128 / 156127 / 158122 / 169124 / 163130 / 160Metro Exodus83 / 17955 / 9769 / 12475 / 12685 / 15885 / 14572 / 120Red Dead Redemption 2156 / 16781 / 84104 / 109106 / 111128 / 137109 / 115106 / 111Zwrotny117 / 20572 / 11292 / 13885 / 139102 / 16782 / 154110 / 162Total War: WARHAMMER III80 / 10354 / 7170 / 8870 / 9082 / 10183 / 9779 / 97Maks.−27%−10%−9%−2%−6%−6%Średni.−44%−31%−30%−16%−23%−26%Min.−53%−46%−46%−34%−31%−41%

Różnica w wydajności między omawianym bohaterem a innymi kartami graficznymi drastycznie wzrosła, ale nadal nie odzwierciedla różnicy w poborze mocy i sugerowanej cenie detalicznej. Karta GeForce RTX 5090 jest tylko o 19% szybsza od karty GeForce RTX 4090, natomiast różnica między dwoma najnowocześniejszymi modelami z serii 50 sięgnęła 29%. W porównaniu do grupy akceleratorów o jeden stopień niższych (GeForce RTX 4080, RTX 4080 SUPER i Radeon RX 7900 XTX) średnia liczba klatek na sekundę wzrosła o 34–46% FPS. Jednak nowy produkt dzieli od GeForce RTX 3090 79% liczby klatek na sekundę.

⇡#Testy gry (3840 × 2160)

Podczas grania na wyświetlaczu 4K bez funkcji śledzenia promieni karta GeForce RTX 5090 nie potrzebuje skalowania klatek, aby zagwarantować 60 FPS lub więcej. Średnia liczba klatek na sekundę spadła poniżej komfortowego poziomu tylko w Black Myth: Wukong.

3840 × 2160NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 287 / 9240 / 4351 / 5450 / 5468 / 7258 / 6257 / 59Czarny Mit: Wukong51 / 5621 / 2428 / 3128 / 3238 / 4333 / 3627 / 31Cyberpunk 207756 / 6826 / 3229 / 3528 / 3634 / 4439 / 4638 / 44F1 24167 / 22193 / 118111 / 145114 / 146143 / 192127 / 167118 / 155Dziedzictwo Hogwartu137 / 15967 / 7770 / 8175 / 83101 / 11390 / 10281 / 95Horizon Zero Dawn Remastered110 / 14368 / 8083 / 9885 / 100103 / 12786 / 10387 / 102Metro Exodus80 / 14344 / 6755 / 8556 / 8673 / 11567 / 10352 / 86Red Dead Redemption 2122 / 12754 / 5970 / 7668 / 7694 / 10078 / 8378 / 81Zwrotny93 / 13649 / 7262 / 8657 / 8677 / 11168 / 9968 / 98Total War: WARHAMMER III70 / 9132 / 4339 / 5240 / 5356 / 7247 / 6342 / 59Maks.−44%−31%−30%−11%−24%−28%Średni.−51%−41%−40%−21%−31%−35%Min.−57%−49%−48%−35%−36%−45%

Odległość między porównywanymi kartami graficznymi osiągnęła w przybliżeniu wartości, jakich można oczekiwać w warunkach pracy odpowiednich dla kart graficznych najwyższej klasy. Nowy flagowiec okazał się o 27% szybszy od GeForce RTX 4090 i prawie półtora raza szybszy od GeForce RTX 5080. Przewaga karty RTX 5090 nad grupą kart GeForce RTX 4080, RTX 4080 SUPER i Radeon RX 7900 XTX wynosi 55-69%. Wreszcie, od czasu GeForce RTX 3090, wydajność najwyższego modelu konsumenckiej linii NVIDIA wzrosła dwukrotnie.

⇡#Testy gier z wykorzystaniem śledzenia promieni

W grach z hybrydowym renderowaniem i przy natywnej rozdzielczości ekranu liczba klatek na sekundę na karcie GeForce RTX 5090 wynosi co najmniej 96 FPS, a wszystkie w pełni śledzone testy wydajności gier wykazały co najmniej 59 FPS w trybie 1440p. Jednocześnie 32 GB pamięci wideo pozwala karcie GeForce RTX 5090 łączyć rozdzielczość 4K z maksymalnymi ustawieniami graficznymi w filmie Indiana Jones i Wielkie Koło, co nie jest dostępne dla akceleratorów z 16 GB pamięci VRAM.

1920 × 1080NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 2115 / 12050 / 5567 / 7166 / 7088 / 9576 / 8247 / 50Czarny Mit: Wukong71 / 8321 / 2540 / 4841 / 5056 / 6549 / 5711 / 14Cyberpunk 207782 / 9633 / 4447 / 5947 / 5965 / 7750 / 6528 / 33F1 24142 / 22796 / 125104 / 154110 / 157114 / 197110 / 16970 / 130Dziedzictwo Hogwartu154 / 17898 / 120117 / 140120 / 142152 / 175134 / 16094 / 109Indiana Jones i Wielkie Koło77 / 8227 / 2946 / 4846 / 4964 / 6751 / 5416 / 17Metro Exodus Edycja rozszerzona76 / 15656 / 8871 / 11469 / 11773 / 14071 / 12568 / 104Zwrotny132 / 20983 / 12091 / 15492 / 151115 / 178101 / 16989 / 132Maks.−33%−21%−20%−2%−10%−33%Średni.−51%−34%−33%−15%−26%−55%Min.−70%−42%−42%−22%−34%−83%2560 × 1440NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 282 / 8632 / 3646 / 4845 / 4863 / 6654 / 5630 / 33Czarny Mit: Wukong50 / 5913 / 1626 / 3227 / 3336 / 4432 / 376 / 9Cyberpunk 207757 / 6523 / 2730 / 3531 / 3643 / 4935 / 4217 / 20F1 24114 / 19874 / 8990 / 11292 / 114107 / 15199 / 12761 / 91Dziedzictwo Hogwartu142 / 17268 / 8782 / 10083 / 101108 / 13397 / 11663 / 78Indiana Jones i Wielkie Koło60 / 6418 / 2030 / 3334 / 3648 / 5038 / 4010 / 11Metro Exodus Edycja rozszerzona74 / 14348 / 6761 / 8962 / 9175 / 12069 / 9957 / 80Zwrotny98 / 17465 / 9278 / 11667 / 11593 / 14187 / 13174 / 100Maks.−47%−33%−34%−16%−25%−43%Średni.−58%−43%−41%−22%−34%−62%Min.−73%−48%−45%−25%−38%−85%3840 × 2160NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 244 / 4615 / 1822 / 2422 / 2432 / 3427 / 2914 / 16Czarny Mit: Wukong27 / 316 / 813 / 1613 / 1619 / 2316 / 193 / 4Cyberpunk 207728 / 3211 / 1314 / 1614 / 1721 / 2416 / 208 / 9F1 2497 / 11943 / 4955 / 6156 / 6274 / 8863 / 7235 / 48Dziedzictwo Hogwartu79 / 10337 / 4945 / 5846 / 5961 / 7953 / 6734 / 44Indiana Jones i Wielkie Koło36 / 3810 / 11Н/ДН/Д28 / 29Н/Д5 / 6Metro Exodus Edycja rozszerzona69 / 9629 / 4141 / 5334 / 5556 / 7445 / 6035 / 46Zwrotny73 / 11037 / 5348 / 6647 / 6763 / 8851 / 7644 / 59Maks.−52%−40%−39%−20%−31%−46%Średni.−61%−46%−45%−24%−37%−65%Min.−74%−50%−48%−26%−39%−87%

Różnica w wydajności między konkurującymi urządzeniami różni się w zależności od rozdzielczości ekranu. Biorąc za punkt odniesienia kartę GeForce RTX 4090, nowa generacja procesorów graficznych zapewniła wzrost liczby klatek na sekundę o 18–32%. W porównaniu do GeForce RTX 5080 średnia liczba klatek na sekundę jest wyższa o 34–58%, a w porównaniu do GeForce RTX 4080 lub RTX 4080 SUPER wynosi ona 49–86%. GeForce RTX 3090 wyprzedził nowy produkt o 103–155% FPS. Wreszcie, GeForce RTX 5090 był dwa do trzech razy szybszy niż Radeon RX 7900 XT – co nie jest zaskakujące, biorąc pod uwagę fakt, że połowa testowanych gier w trybie RT korzystała z bezkompromisowej technologii path tracingu zamiast hybrydowego renderowania.

⇡#Testy gier z wykorzystaniem ray tracingu i skalowania klatek

Porównując wyniki testów wydajnościowych karty GeForce RTX 5090 przy rozdzielczości natywnej i DLSS, można zauważyć, że nie w każdej grze liczba klatek na sekundę reaguje na skalowanie klatek. W połowie testów w trybie 1080p i 1440p wzrost wydajności był albo prawie nieznaczny, albo wręcz bliski zeru. Mimo wszystko, dzięki upscalingowi z wykorzystaniem parametru jakości Balanced, nowy produkt osiągnął komfortową liczbę klatek na sekundę wynoszącą co najmniej 60 FPS na ekranie 4K w grach z pełnym śledzeniem.

1920 × 1080NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 2151 / 16477 / 85114 / 122114 / 123121 / 148134 / 14181 / 85Czarny Mit: Wukong110 / 12842 / 5173 / 9074 / 9090 / 10983 / 9824 / 31Cyberpunk 2077111 / 14064 / 78104 / 116105 / 117107 / 138110 / 12661 / 70F1 24124 / 256109 / 167114 / 200116 / 203122 / 234121 / 21892 / 190Dziedzictwo Hogwartu167 / 181107 / 122171 / 183171 / 182175 / 184173 / 183161 / 189Indiana Jones i Wielkie Koło77 / 8240 / 4262 / 6765 / 6880 / 8473 / 7527 / 29Metro Exodus Edycja rozszerzona78 / 15767 / 11379 / 13981 / 14279 / 15880 / 148Н/ДZwrotny120 / 216100 / 157110 / 197108 / 194107 / 21297 / 205123 / 175Maks.−27%+1%+1%+2%+1%+4%Średni.−41%−16%−16%−4%−10%−40%Min.−60%−30%−30%−15%−23%−76%2560 × 1440NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 2143 / 15156 / 6289 / 9590 / 96106 / 120104 / 10961 / 65Czarny Mit: Wukong90 / 10430 / 3556 / 6756 / 6871 / 8663 / 7517 / 22Cyberpunk 2077107 / 12548 / 5470 / 7971 / 8092 / 10376 / 8740 / 47F1 24126 / 236102 / 139100 / 162105 / 171116 / 212111 / 17782 / 151Dziedzictwo Hogwartu165 / 17873 / 82125 / 144126 / 146158 / 176144 / 163116 / 142Indiana Jones i Wielkie Koło75 / 8031 / 3254 / 5653 / 5672 / 7458 / 6019 / 22Metro Exodus Edycja rozszerzona77 / 15563 / 9877 / 12479 / 12877 / 14975 / 134Н/ДZwrotny126 / 21164 / 131110 / 165109 / 164113 / 18996 / 18293 / 151Maks.−37%−19%−17%−1%−8%−20%Średni.−51%−29%−28%−11%−21%−51%Min.−66%−37%−36%−21%−30%−79%3840 × 2160NVIDIA GeForce RTX 5090NVIDIA GeForce RTX 3090NVIDIA GeForce RTX 4080NVIDIA GeForce RTX 4080 SUPERNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 5080Karta graficzna AMD Radeon RX 7900 XTXAlan Wake 293 / 10032 / 3654 / 5854 / 5972 / 7862 / 6634 / 37Czarny Mit: Wukong59 / 6917 / 2033 / 3933 / 4044 / 5339 / 458 / 11Cyberpunk 207769 / 7625 / 2837 / 4337 / 4354 / 5941 / 4820 / 24F1 24113 / 18776 / 9190 / 11391 / 114105 / 15299 / 12863 / 95Dziedzictwo Hogwartu123 / 14139 / 4470 / 8271 / 8396 / 11382 / 9372 / 88Indiana Jones i Wielkie Koło60 / 6419 / 20Н/ДН/Д50 / 52Н/Д12 / 13Metro Exodus Edycja rozszerzona74 / 14250 / 6962 / 9163 / 9277 / 11972 / 102Н/ДZwrotny109 / 17366 / 8978 / 11276 / 11281 / 13793 / 12781 / 108Maks.−49%−35%−35%−16%−27%−38%Średni.−61%−40%−40%−20%−32%−60%Min.−71%−43%−43%−23%−37%−84%

Jednakże, mimo że DLSS zwiększa liczbę klatek na sekundę, procesor graficzny nie jest tak wydajny jak przy rozdzielczości natywnej, w związku z czym GeForce RTX 5090 traci część swojej przewagi nad słabszymi kartami graficznymi. Tak więc GeForce RTX 4090 i RTX 5090 dzielą się teraz wartością FPS na poziomie 4–25% w zależności od rozdzielczości (niektóre gry w trybie 1080p w ogóle nie zareagowały na aktualizację), a w przypadku GeForce RTX 5080 mówimy o 11–48%. Wymiana karty GeForce RTX 4080 lub RTX 4080 SUPER na GeForce RTX 5090 zapewnia wzrost liczby klatek na sekundę o 19–67%. Podobnie jak w poprzednich testach, GeForce RTX 5090 osiąga najlepsze wyniki w porównaniu z GeForce RTX 3090 i Radeon RX 7900 XTX: odpowiednio 68–156% i 66–150% więcej klatek na sekundę.

W grach obsługujących technologię DLSS 4 z możliwością generowania trzech klatek na każdą „uczciwą” klatkę, liczba klatek na sekundę mierzona jest w setkach FPS-ów, ale takie same wyniki można uzyskać również przy użyciu karty RTX 5080.

⇡#Testy gier w podkręcaniu

Niestandardowe podkręcanie karty GeForce RTX 5090 okazało się ćwiczeniem praktycznie bezużytecznym (przynajmniej jeśli chodzi o karty graficzne bez możliwości zwiększenia rezerwy mocy): nawet przy rozdzielczości 2160p średni wzrost liczby klatek na sekundę spadł do 5%.

⇡#Тесты в рабочих приложениях

GeForce RTX 5090 не знает равных в таких задачах, как 3D-рендеринг в Blender, особенно с аппаратным рейтрейсингом. Замена GeForce RTX 4090 на RTX 5090 обеспечивает примерно такой же рост быстродействия, как в трассированных играх без DLSS.

В тестах транскодирования видео с помощью Premiere Pro новый флагман ненамного превосходит GeForce RTX 5080, но скорость работы с H.264 и HEVC заметно выросла по сравнению с GeForce RTX 4090 и достигла уровня Radeon RX 7900 XTX. При этом надо заметить, что «зеленые» видеокарты двух последних поколений намного лучше справляются с RAW-форматами, чем продукты AMD.

Бенчмарк графических эффектов в Premiere Pro предсказуемо поместил GeForce RTX 5090 на первое место, пусть и с небольшим отрывом от GeForce RTX 4090.

Тесты транскодирования в DaVinci Resolve подтвердили прибавку скорости в аппаратном декодере H.264 и HEVC по сравнению с «зелеными» ускорителями прошлого поколения, но, если отталкиваться от результатов GeForce RTX 5080 и Radeon RX 7900 XTX, усредненное преимущество GeForce RTX 5090 невелико.

В бенчмарке GPU-эффектов, напротив, речь идет о громадной разнице между GeForce RTX 5090, с одной стороны, и GeForce RTX 4090 и RTX 5080, с другой. Ни один другой тест (среди как рабочих, так и игровых), не дал новому флагману такого преимущества.

Наконец, GeForce RTX 5090 уверенно превосходит RTX 4090 и в полтора раза опережает RTX 5080 по результатам SPECviewperf. Однако в ряде CAD-приложений Radeon RX 7900 XTX по-прежнему обладает недосягаемым быстродействием благодаря оптимизациям драйвера.

⇡#Кодирование/декодирование видео

Как показывают тесты, GeForce RTX 5080 и RTX 5090 эквивалентны по быстродействию аппаратного медиакодека. Главным нововведением архитектуры Blackwell в этой области является увеличенная более чем вдвое скорость декодирования H.264. Другие форматы (HEVC, VP9 и AV1) получили умеренную прибавку к пропускной способности. В результате чипы NVIDIA доминируют во всех бенчмарках декодирования за исключением отдельных случаев, когда на первом месте стоит интеловская видеокарта Arc B580.

В задаче кодирования видео силами аппаратного блока NVENC ощутимо возросла скорость работы с форматом AV1, что возвращает «зеленым» GPU безоговорочное лидерство.

⇡#Производительность на ватт

Избыточный объем VRAM, недостаточная загрузка GPU в большинстве игровых бенчмарков и нагрев кристалла — все эти факторы снижают быстродействие GeForce RTX 5090 на ватт потребляемой мощности. В результате обе модификации GeForce RTX 4080 продемонстрировали более высокую энергоэффективность по сравнению с новым флагманом, а GeForce RTX 5080 и Radeon RX 7900 XTX превосходят его в растеризованных играх. GeForce RTX 5090 выгодно смотрится лишь на фоне старшей модели позапрошлого поколения — GeForce RTX 3090.

ПроизводительNVIDIAAMDМодельGeForce RTX 5090GeForce RTX 3090GeForce RTX 4080GeForce RTX 4080 SUPERGeForce RTX 4090GeForce RTX 5080Radeon RX 7900 XTXГрафический процессорGB202GA102AD103AD103AD102GB203Navi 31 XTXМикроархитектураBlackwellAmpereAda LovelaceAda LovelaceAda LovelaceBlackwellRDNA 3Техпроцесс, нмTSMC 4NPSamsung 8NTSMC 4NTSMC 4NTSMC 4NTSMC 4NPTSMC N5/N6Средняя потребляемая мощность (FurMark), Вт626370332317454397372Производительность/Вт (без трассировки лучей)100%−17%+11%+18%+9%+9%+9%Производительность/Вт (с трассировкой лучей)100%−34%+2%+9%+5%−1%−41%

⇡#Сводные результаты игровых тестов без трассировки лучей

⇡#Сводные результаты игровых тестов с трассировкой лучей

⇡#Сводные результаты игровых тестов с трассировкой лучей и масштабированием кадров

⇡#Выводы

Приоритеты создателей GPU давно сместились на рынок HPC и рабочих устройств в целом, а потребительская графика имеет второстепенное значение. Дошло до того, что AMD попросту отказалась от выпуска высокопроизводительных десктопных видеокарт (по меньшей мере в текущем поколении), но если взглянуть под этим углом на продукцию NVIDIA, окажется, что и у «зеленых» больше нет игровой модели первого эшелона в привычном понимании — настолько велик разрыв в быстродействии между GeForce RTX 5080 и RTX 5090 и настолько экстремальны характеристики последнего. По большому счету, графический процессор GB202 является облегченным, более универсальным аналогом HPC-чипа GB100 и найдет широкое применение в составе ускорителей для серверов и рабочих станций. Все говорит о том, что релиз потребительской видеокарты на его основе — немногим более, чем статусный жест в подходящее время. Само по себе хорошо, что NVIDIA не вывела окончательно продукты такого уровня с игрового рынка. Настоящая проблема 50-й серии в том, что другие новинки представляют собой полупрограммный апгрейд за счет генерации трех кадров подряд.

По отношению к GeForce RTX 5080 флагман сулит прибавку в 58 % игрового быстродействия (в трассированных играх на 4К-экране без апксейлинга), но за непропорционально большую доплату, которую усугубляет продолжающийся дефицит. Напротив, если отталкиваться от GeForce RTX 4090, межпоколенческий рост фреймрейта лежит в пределах 32 %, и на то есть техническая причина. По правде говоря, мы избалованы ростом скорости GPU, которая, в отличие от скорости процессоров общего назначения, не сдерживается однопоточными задачами и превосходно масштабируется вместе с плотностью транзисторов. В этот раз норма фотолитографии не изменилась, поэтому резерв производительности исчерпан целиком — как и резерв мощности разъема питания 12V-2×6. Не удивительно, что видеокарта Palit GameRock, которая представляет GeForce RTX 5090 в обзоре, громко шумит и практически не поддается разгону.

    ⇣ Spis treści Procesor graficzny GB202 Specyfikacje, ceny Palit GeForce RTX 5090 GameRock: Projekt Palit GeForce RTX 5090 GameRock: PCB Stanowisko testowe, metodologia testowania Uczestnicy testu Prędkość zegara, pobór mocy, temperatura, poziom hałasu i podkręcanie Testy gier (1920×1080) Testy gry (2560×1440) Testy gry (3840 × 2160) Testy gier z wykorzystaniem Ray Tracingu Testy gier z wykorzystaniem śledzenia promieni i skalowania klatek Testy gier w podkręcaniu Testy w aplikacjach produkcyjnych Kodowanie/dekodowanie wideo Wydajność na wat Podsumowanie wyników testów wydajnościowych gier bez śledzenia promieni Podsumowanie testów porównawczych gier z wykorzystaniem Ray Tracingu Podsumowanie testów wydajności gier z wykorzystaniem śledzenia promieni i skalowania klatek Wnioski Komentarz ( ) Materiały na temat Kto ma swoje miejsce w przyszłości? Grupowe testy 48 kart graficznych w Black Myth: Wukong Recenzja karty graficznej NVIDIA GeForce RTX 4060: Ale jest tańsza Recenzja karty graficznej Intel Arc B580 Limited Edition: nieoczekiwany sukces Nanyli: recenzja karty graficznej NVIDIA GeForce RTX 4070 SUPER Recenzja NVIDIA GeForce RTX 5080 i architektury Blackwell Recenzja karty graficznej MSI GeForce RTX 4080 SUPER EXPERT: Dlaczego potrzebujesz RTX 4090?

Udostępnij ten artykuł