NVIDIA Rubin nie je len ďalší grafický čip ale Ide o celú komplexnú architektúru, ktorá posúva AI výpočty na inú úroveň. Po Blackwelli prichádza Rubin ako základ pre dátové centrá a prináša so sebou viacero špecializovaných čipov, ktoré spolupracujú ako jeden systém.
Do rodiny NVIDIA Rubin patria tri hlavné časti: Rubin GPU s HBM pamäťou určené na generovanie výstupov, Rubin CPX – akcelerátor pre spracovanie obrovského kontextu a Vera Rubin CPU, nový procesor, ktorý riadi úlohy a dopĺňa GPU aj CPX.
Najväčšiu pozornosť púta Rubin CPX. Tento čip dokáže spracovať až milión tokenov kontextu v jednom kroku. Token je základná jednotka vstupu, ktorú AI spracúva. Môže to byť kúsok textu (časť slova, znak), príkaz v kóde, alebo pri multimodálnych modeloch aj úsek zvuku či malý kúsok obrázku. Milión tokenov teda znamená, že model zvládne naraz spracovať obsah na úrovni stoviek tisíc slov, celých projektov alebo dlhých multimediálnych súborov bez delenia na časti.
V praxi to znamená, že umelá inteligencia dokáže naraz prečítať celú knihu, rozsiahly programátorský projekt alebo hodinový videozáznam bez delenia obsahu na časti. Ide o zásadný posun oproti klasickým GPU, ktoré museli dáta spracovávať postupne.
Ako funguje architektúra NVIDIA Rubin
Spracovanie dát v umelej inteligencii prebieha v dvoch krokoch. Najprv model načíta celý vstup (context phase – prefill), až potom vytvára výsledok (generation phase). Klasické GPU museli zvládnuť obidve fázy naraz, čo spôsobovalo zbytočné preťaženie a nižšiu efektivitu.
Architektúra Rubin prináša nový prístup nazývaný disaggregated inference. Úlohy sa rozdeľujú medzi špecializované čipy:
- Rubin CPX je optimalizovaný na načítanie a spracovanie kontextu. Vďaka veľkej pamäti dokáže pripraviť celý vstup naraz a uložiť ho do key-value cache, ktorú potom využívajú ďalšie čipy.
- Rubin GPU s HBM pamäťou sa sústredí primárne na fázu generovania výstupov – teda samotné vytváranie textu, obrázkov alebo videa. GPU technicky dokáže zvládnuť aj prefill, ale v Rubine je táto úloha presunutá na CPX, ktorý ju zvláda efektívnejšie.
- Vera Rubin CPU dopĺňa systém ako riadiaca jednotka. Zabezpečuje organizáciu menších logických úloh, koordinuje tok dát a spolupracuje so softvérovým orchestrátorom.
Tieto čipy nie sú spojené do jedného procesora. Nachádzajú sa oddelene v dátových centrách a navzájom komunikujú cez vysokorýchlostnú infraštruktúru, ako je NVLink a ConnectX-9 sieťové adaptéry. Koordináciu celého procesu riadi softvér (napríklad NVIDIA Dynamo), ktorý zabezpečuje, aby jednotky pracovali ako jeden celok.
Výsledkom je systém, kde každý čip robí to, v čom je najlepší. CPX spracúva obrovský kontext, GPU generujú výstupy bez úzkych miest a CPU Vera riadi ich spoluprácu. Tento prístup prináša vyšší výkon, lepšiu efektivitu a umožňuje AI pracovať s dátami v rozsahu, ktorý bol doteraz nedosiahnuteľný.ddelene v dátových centrách, prepojené vysokorýchlostnou infraštruktúrou a softvérom.

Technológia NVIDIA Rubin a rozdiel oproti Blackwellu
NVIDIA Rubin neprináša len vyšší výkon, ale úplne nový prístup k návrhu čipov. Každá súčasť je postavená na inej technológii pamäte a má vlastnú úlohu v systéme.
Rubin CPX
Využíva GDDR7 pamäť s vysokou kapacitou. Táto kombinácia mu umožňuje efektívne spracovávať obrovské vstupy a pracovať s mechanizmami, ktoré boli na predchádzajúcich GPU veľmi pomalé. Oproti generácii Blackwell dokáže vykonať attention výpočty až trikrát rýchlejšie. Zároveň má zabudované špecializované jednotky pre video, takže sa hodí aj na multimodálne aplikácie, kde sa kombinuje text, obraz a zvuk.
Rubin GPU
Dostali HBM pamäť, ktorá má extrémne širokú priepustnosť. To znamená, že pri generovaní výsledkov sa čip nebrzdí presunom dát a dokáže naplno využiť výpočtové jadrá. NVIDIA zatiaľ oficiálne predstavila len verzie určené pre dátové centrá a AI výpočty, no podľa únikov a analýz sa očakáva, že architektúra Rubin môže tvoriť základ aj budúcich herných kariet RTX.
Vera Rubin CPU
Je úplne nová procesorová architektúra. Jej úlohou nie je byť rýchlejšia než GPU, ale zabezpečiť plynulú spoluprácu medzi všetkými čipmi. V dátových centrách rieši koordináciu a logiku, čím odbremeňuje GPU a CPX od úloh, ktoré by ich brzdili.
Rozdiel oproti Blackwellu
Na rozdiel od Blackwellu, ktorý bol univerzálnejší a dal sa nasadiť od herných PC až po servery, NVIDIA Rubin je ako systém špecialistov. Každý čip robí len to, v čom je najefektívnejší. Výsledkom je vyšší výkon na watt, rýchlejšie spracovanie veľkých vstupov a lepšia škálovateľnosť v dátových centrách.
Podľa dostupných informácií má Rubin síce architektonické korene v čipe GB202 (z RTX 5090), no jeho usporiadanie je výrazne prepracované – od iných výpočtových blokov, cez viac ROP jednotiek (ROP jednotky = časti GPU, ktoré zapisujú hotové pixely do obrazu; dôležité pre hry, nie pre AI výpočty) až po nové pamäťové riešenia. Tieto detaily zatiaľ nie sú oficiálne, ide o informácie z únikov a analýz.
Najväčšia zmena však spočíva v tom, že NVIDIA Rubin dokáže spracovať dáta, ktoré by Blackwell musel deliť na menšie časti. To otvára nové možnosti – od tréningu multimodálnych modelov s extrémnym kontextom, až po generovanie konzistentného videa s dejom na dlhých hodinách záznamu.
Kedy príde NVIDIA Rubin
Podľa dostupných informácií by mala byť architektúra NVIDIA Rubin uvedená na trh koncom roka 2026. Spolu s hardvérom NVIDIA pripravuje aj kompletný softvérový balík, ktorý zahŕňa:
- platformu NVIDIA AI Enterprise,
- knižnice CUDA-X,
- a nový orchestrátor Dynamo, ktorý riadi inferencie v dátových centrách a zabezpečuje spoluprácu medzi Rubin CPX, Rubin GPU a procesormi Vera.
Hoci pôjde primárne o riešenie pre veľké firmy a dátové centrá, prínos tejto architektúry pocítia aj koncoví používatelia. Vývojári získajú výkonnejšie AI nástroje a bežní ľudia zas aplikácie schopné pracovať s celými dokumentmi, dlhými konverzáciami či hodinovými videami bez straty kontextu.
Vera Rubin NVL144 CPX – AI dátové centrum budúcnosti
Architektúra NVIDIA Rubin nie je len o jednotlivých čipoch, ale aj o veľkých serverových zostavách. Najväčšou z nich je Vera Rubin NVL144 CPX – racková konfigurácia, ktorá spája akcelerátory a procesory do jedného superpočítača.
Jej výkon dosahuje až 8 exaFLOPS v NVFP4 presnosti. Pre predstavu – 1 exaFLOPS znamená 10¹⁸ operácií za sekundu, teda miliardu miliárd výpočtov. Jedna operácia predstavuje základný matematický úkon, napríklad sčítanie alebo násobenie desatinných čísel. Celý rack má 100 TB rýchlej pamäte a dátovú priepustnosť 1,7 PB/s, čo predstavuje približne 7,5-násobné zrýchlenie oproti predošlej generácii GB300 NVL72.
Takýto systém dokáže naraz analyzovať obrovské softvérové kódy, trénovať modely s extrémne dlhým kontextom alebo generovať video, ktoré zostáva konzistentné aj na hodinách záznamu.

Čo môžeme vyčítať z obrázku
Na ilustrácii je zobrazený celý rack Vera Rubin NVL144 CPX a jeho základný stavebný blok – compute tray.
- Vľavo je celý rack, kde sú desiatky týchto modulov zasunuté nad sebou. Číslo „144“ znamená, že zostava obsahuje až 144 akcelerátorov Rubin CPX spolu s GPU a procesormi Vera.
- Vpravo je detail jednej zásuvky (compute tray). Tento modul je vlastne kompletný server, v ktorom spolupracujú všetky hlavné časti architektúry Rubin:
- Rubin GPU s HBM pamäťou – generujú výstupy umelej inteligencie,
- Vera CPU – koordinuje a riadi tok dát,
- Rubin CPX – spracúva obrovský kontext,
- ConnectX-9 adaptéry – zabezpečujú superrýchle prepojenie medzi jednotlivými modulmi aj rackmi.
Každý compute tray je teda samostatná výpočtová jednotka. Keď sa ich spojí viacero v jednom racku, vznikne systém, ktorý funguje ako jeden obrovský AI superpočítač s výkonom v exaFLOPS triede.
Záver
Architektúra NVIDIA Rubin nie je len ďalší krok vo vývoji grafických čipov, ale nová éra vo výpočtoch umelej inteligencie. Vďaka rozdeleniu úloh medzi špecializované čipy – CPX, GPU a CPU Vera – prináša riešenie, ktoré je výkonnejšie, úspornejšie a dokáže spracovať dáta v rozsahu, ktorý bol ešte nedávno nemožný.
Pre dátové centrá to znamená obrovský posun v škálovateľnosti a efektivite. Pre vývojárov nové možnosti, ako stavať modely s extrémne dlhým kontextom či multimodálnymi vstupmi. A pre bežných používateľov zas aplikácie, ktoré dokážu rozumieť celým dokumentom, dlhým konverzáciám alebo videám bez straty súvislostí.
NVIDIA Rubin tak nie je len technickou inováciou, ale aj základom pre budúce generácie umelej inteligencie – od priemyselných riešení až po každodenné nástroje, ktoré budeme používať všetci.