GDDR7 pamäť: Najväčší posun vo VRAM za poslednú dekádu

Vývoj grafických pamätí narazil pri štandarde GDDR6 na fyzikálne limity. Tradičné postupy zvyšovania priepustnosti už nedokázali držať krok s nárokmi moderných GPU architektúr, ako je NVIDIA Blackwell (séria GeForce RTX 50), bez neúmerného nárastu spotreby a chybovosti. Prechod na GDDR7 pamäť nie je len evolúciou v rýchlosti, ale zásadnou zmenou v signalizačnej vrstve, ktorá mení návrh radičov, PCB a spôsob správy integrity dát. V závere roka 2025 sa GDDR7 stáva dominantou high-endu (RTX 5090, 5080), zatiaľ čo AMD pri architektúre RDNA 4 nateraz zachováva efektívnejší prístup s využitím overených GDDR6 modulov a objemnej cache.

GDDR6 a GDDR6X: Posledná etapa pred zmenou paradigmy

GDDR6 ostáva v roku 2025 najrozšírenejším štandardom, pričom pri rýchlostiach 16–20 Gb/s na pin využíva spoľahlivé NRZ (Non-Return-to-Zero) signálovanie. Pri spracovaní masívnych dátových blokov a vysokých rozlíšení sa však nízka priepustnosť NRZ stala úzkym hrdlom.

Riešením bola GDDR6X, predstavená v generácii Ampere a využívaná v sérii Ada, ktorá nasadila moduláciu PAM4. Tá prenáša 2 bity na symbol, čím zdvojnásobila efektivitu prenosu na rovnakom takte. Daňou za tento výkon však bol nízky odstup signálu od šumu (SNR) a vysoká citlivosť na kvalitu PCB. Extrémne nároky na chladenie a zložitosť PHY vrstvy prinútili inžinierov hľadať pre novú generáciu Blackwell stabilnejšiu cestu, ktorou sa stala práve modulácia PAM3 v štandarde GDDR7.

GDDR7 pamäť – Technické východiska : PAM3, NRZ a nová signalizačná vrstva

GDDR7 pamäť zavádza moduláciu PAM3 (3-level Pulse Amplitude Modulation), ktorá predstavuje kľúčový evolučný krok medzi jednoduchosťou NRZ a vysokou hustotou PAM4. Zatiaľ čo NRZ prenáša 1 bit na symbol a PAM4 prenáša 2 bity, PAM3 prenáša 1,5 bitu na symbol (kóduje 3 bity do dvoch symbolov). Tento prístup umožňuje dosiahnuť vyššiu efektívnu priepustnosť než NRZ pri zachovaní výrazne lepšieho odstupu signálu od šumu (SNR) a nižšej citlivosti na rušenie než u PAM4. Výsledkom je stabilnejší prenos dát pri extrémne vysokých frekvenciách bez nutnosti neúmerne zložitej korekcie chýb.

GDDR7 pamäť zároveň podporuje dynamické prepínanie medzi režimami PAM3 a NRZ, čo umožňuje GPU optimalizovať spotrebu energie a integritu spojenia v reálnom čase podľa aktuálneho zaťaženia.

V závere roka 2025 dosahujú komerčne dostupné GDDR7 moduly rýchlosti v rozsahu 28–32 Gb/s na pin. Návrhové IP bloky radičov sú však už pripravené na rozšírenie do pásma 36–40 Gb/s v budúcich revíziách. Dosiahnutie týchto hodnôt si vyžiadalo nasadenie pokročilých ekvalizačných techník, presnejšieho tréningu fyzickej vrstvy (PHY) a optimalizovanej vrstvy FEC (Forward Error Correction). Tá je v porovnaní s riešením pri GDDR6X efektívnejšia, keďže PAM3 prirodzene generuje nižší bitový chybový pomer (BER).

  • SNR (Signal-to-Noise Ratio) vyjadruje pomer medzi užitočným signálom a šumom, pričom vyššie SNR znamená čistejší prenos dát a nižšiu chybovosť.
  • NRZ (Non-Return-to-Zero) je spôsob signálovania, pri ktorom sa dáta prenášajú pomocou dvoch napäťových úrovní, čo prináša jednoduchý, stabilný a energeticky efektívny prenos.
  • FEC (Forward Error Correction) je mechanizmus korekcie chýb, ktorý dokáže detegovať a opravovať chyby pri prenose dát bez nutnosti opätovného posielania informácií.

Implementácia v NVIDIA Blackwell a prístup RDNA 4

NVIDIA v architektúre Blackwell zvolila stratégiu synergie medzi vysokou priepustnosťou GDDR7 pamäte a masívnou L2 cache. Vlajková loď RTX 5090 využíva 512-bitovú zbernicu, čo pri rýchlosti 28 Gb/s prináša priepustnosť približne 1,8 TB/s. Model RTX 5080 využíva 256-bitové rozhranie, ktoré pri nasadení 32 Gb/s modulov dosahuje hranicu 1 024 GB/s. Tento prístup umožňuje Nvidii dosahovať rekordný bandwidth pri zachovaní efektívneho návrhu PCB a nižšej energetickej náročnosti pamäťového subsystému.

AMD pri generácii RDNA 4 (napr. Radeon RX 9070 XT) pokračuje s využitím overeného štandardu GDDR6 s rýchlosťou 20 Gb/s. Pri 256-bitovej zbernici rozhraní dosahuje priepustnosť 640 GB/s. AMD sa v roku 2025 nesústredí na surový nárast externého bandwidthu, ale na horizontálnu optimalizáciu hierarchie cache. Väčšia a efektívnejšia Infinity Cache tretej generácie slúži ako filter, ktorý znižuje frekvenciu prístupov do VRAM, čím AMD kompenzuje absenciu GDDR7 v strednej a vyššej strednej triede pri zachovaní nižších výrobných nákladov.

Hardvérové nároky GDDR7 pamäte: PCB, PHY a napájanie

Dosiahnutie prenosových rýchlostí v rozsahu 28–32 Gb/s si vyžiadalo radikálne prepracovanie fyzickej vrstvy (PHY) a návrhu dosiek plošných spojov (PCB). High-end karty v roku 2025 využívajú viacvrstvové PCB (často 12 a viac vrstiev) s extrémnymi nárokmi na impedančné prispôsobenie. Kritickým prvkom je milimetrová presnosť dĺžky pamäťových trás (trace length matching), aby sa eliminoval fázový posun signálu, a prísne oddelenie ciest pre minimalizáciu presluchov (crosstalk), ktoré by pri troch napäťových úrovniach PAM3 mohli spôsobiť chyby v interpretácii symbolov.

Radiče v GPU Blackwell boli navrhnuté s dôrazom na adaptívne ekvalizéry a pokročilý tréning rozhrania, ktorý v reálnom čase kompenzuje teplotné výkyvy. Napájacie obvody (VRM) musia vykazovať vysokú stabilitu pri dynamickom prepínaní medzi režimami PAM3 a NRZ. Prevádzkové napätie kleslo na hodnotu 1,2 V, čo v kombinácii s nižšími nárokmi na budenie signálu v PHY vrstve výrazne zlepšuje energetickú efektivitu v porovnaní s GDDR6X (1,35 V).

Integrita dát a mechanizmy RAS (Reliability, Availability, Serviceability)

S narastajúcimi rýchlosťami sa druhým pilierom štandardu GDDR7 stala bezpečnosť prenosu, ktorá je kľúčová najmä pre AI výpočty. GDDR7 integruje pokročilé mechanizmy, ktoré boli doteraz doménou serverových HBM pamätí:

  • On-die ECC: Detekcia a oprava chýb prebieha priamo v pamäťovom čipe, pričom systém dokáže reportovať počet a typ opravených bitov radiču v GPU.
  • Data Poisoning: Ak pamäť zachytí neopraviteľnú chybu, označí dáta ako „otrávené“. Tým zabráni ich použitiu vo výpočtovom jadre, čo predchádza pádu systému alebo znehodnoteniu trénovania AI modelov.
  • Background Scrubbing: Automatická kontrola integrity dát v bunkách prebieha na pozadí, čím sa eliminuje riziko náhodného prevrátenia bitu v čase (bit-rot).
  • Command/Address Parity: Ochrana sa už netýka len samotných dát, ale aj riadiacich príkazov a adries, čo zabraňuje zápisu informácií do nesprávnych pamäťových blokov.

Tieto mechanizmy robia z GDDR7 v decembri 2025 vysoko spoľahlivú a cenovo dostupnejšiu alternatívu k HBM3e pre edge AI akcelerátory a inferenčné servery, kde nie je kriticky vyžadovaná extrémna priepustnosť na pin.

GDDR6 vs GDDR6X vs GDDR7 pamäť – kľúčové rozdiely

Aby bolo možné jednoznačne porovnať rozdiely medzi jednotlivými generáciami pamätí, je vhodné pozrieť sa na ich základné technické parametre v ucelenej forme. Nasledujúci prehľad sumarizuje, ako sa líšia v spôsobe signálovania, dosiahnuteľných rýchlostiach, požiadavkách na napájanie, tepelnej záťaži a implementačnej náročnosti na úrovni radičov a PCB. Ide o kľúčové vlastnosti, ktoré priamo ovplyvňujú efektivitu pamäťového subsystému v moderných GPU.

ParameterGDDR6GDDR6xGDDR7
SignálovanieNRZPAM4PAM3 + NRZ
Typická rýchlosť16-20 Gb/s19-24 Gb/s28-32 Gb/s
Napájanie~1,35 V~1,35 V (1,8 V VPP)~1,2 V
SNRvysokénízkestredné až vysoké
Tepelné straty PHYnízkevysokénižšie než GDDR6X
RAS / ECCminimálnezávislé od GPUon-die ECC, parity, SCRUB
Náročnosť PCBstrednávysokávysoká, ale menej citlivá než PAM4

Priepustnosť pri rovnakých šírkach zbernice

Samotné porovnanie technických parametrov ešte nevystihuje praktický dopad jednotlivých štandardov na výkon grafických kariet. O tom rozhoduje až kombinácia efektívnej rýchlosti pamäte a šírky pamäťovej zbernice. Nasledujúca tabuľka ukazuje priepustnosť pri identických konfiguráciách rozhrania, čo umožňuje pochopiť, prečo GDDR7 zásadne mení konštrukčné možnosti GPU v roku 2025.

Šírka zberniceGDDR6 – 18 Gb/sGDDR6x – 23 Gb/sGDDR7 – 32 Gb/s
128-bit288 GB/s368 GB/s512 GB/s
192-bit432 GB/s552 GB/s768 GB/s
256-bit576 GB/s736 GB/s1 024 GB/s
320-bit720 GB/s920 GB/s1 280 GB/s
384-bit864 GB/s1 104 GB/s1 536 GB/s
512-bit1 152 GB/s1 472 GB/s2 048 GB/s

Poznámka k interpretácii: Hodnoty v tabuľke vychádzajú z maximálnej certifikovanej rýchlosti prvej vlny modulov (32 Gb/s). Zatiaľ čo pri kartách ako RTX 5080 (256-bit) je táto rýchlosť štandardom, pri extrémne širokých zberniciach, ako je 512-bit (RTX 5090), sa v decembri 2025 stretávame v základe s o niečo konzervatívnejším taktovaním (28 Gb/s) kvôli stabilite. Hodnota pre 512-bit tak predstavuje technologický strop a potenciál pre najvýkonnejšie pretaktované modely.

256-bit konfigurácia s GDDR7 pamäťou dosahuje priepustnosť na úrovni alebo nad úrovňou starších 384-bit GDDR6X riešení. Práve tento fakt umožnil inžinierom pri Blackwell generácii efektívnejší návrh PCB pri zachovaní rekordného bandwidthu.

Záver

Nástup generácie Blackwell v roku 2025 potvrdil, že GDDR7 pamäť nie je len o lámaní frekvenčných rekordov, ale predovšetkým o inteligentnejšom využívaní dostupného pásma. Prechod na moduláciu PAM3 umožnil výrobcom prelomiť bariéru 1 TB/s aj na 256-bitových zberniciach pri zachovaní akceptovateľnej spotreby a teploty. Vďaka integrovaným RAS funkciám sa táto technológia stáva univerzálnym riešením, ktoré definuje nielen budúcnosť herného high-endu, ale aj cenovo dostupnejších pracovných staníc pre umelú inteligenciu.

Pohľad na grafickú kartu MSI GeForce RTX 5070 Ti 16G VENTUS 3X OC spolu s jej balením

Najnovšie grafické karty

Sledujte grafické karty série GeForce RTX 50 series a AMD Radeon RX 9000 series a vychutnajte si najmodernejší výkon.