NVIDIA Vera Rubin Superchip – 88 CPU jadier pre budúcnosť AI

Koncom októbra na konferencii GTC 2025 – Washington, D.C. spoločnosť NVIDIA odhalila svoj doteraz najambicióznejší projekt – Vera Rubin Superchip. Nová platforma spája procesor Vera CPU a grafické jednotky Rubin GPU do jediného, extrémne kompaktného modulu, ktorý mení pohľad na AI a výpočty v dátových centrách.

Podujatie, ktoré sa konalo 27.–29. októbra 2025 v centre Washingtonu, prinieslo prvé verejné predstavenie funkčného prototypu novej generácie superčipov. CEO Jensen Huang na pódiu opísal Vera Rubin ako „platformu, kde CPU a GPU pracujú spolu ako jedno vedomie“ – inými slovami, ide o technológiu, ktorá má posunúť hranice umelej inteligencie a zmeniť budúcnosť výpočtov tak, ako ju poznáme dnes.

Kompaktný modul s dvojicou GPU a 88-jadrovým CPU

Počas konferencie GTC 2025 NVIDIA prvýkrát fyzicky ukázala Vera Rubin Superchip – extrémne kompaktný modul, ktorý spája všetky kľúčové komponenty do jedinej výpočtovej jednotky.
Na doske s rozmermi približne 30 × 20 centimetrov sú umiestnené dve grafické jednotky Rubin GPU, 88-jadrový procesor Vera CPU a osem SOCAMM pamäťových modulov, ktoré nahrádzajú klasickú systémovú RAM. Každý modul SOCAMM funguje ako samostatný pamäťový blok pripojený priamo k CPU a GPU, čím sa eliminuje potreba vzdialeného prístupu do RAM a získava sa extrémna rýchlosť spracovania dát.

NVIDIA Vera Rubin Superchip predstavený na GTC 2025 s dvojicou GPU, 88-jadrovým CPU a 2 TB pamäte. — *Jensen Huang predstavuje modul NVIDIA Vera Rubin Superchip počas konferencie GTC 2025 vo Washingtone – čip s 88 jadrami, 2 TB pamäte a 6 biliónmi tranzistorov. Zdroj – Nvidia*

Celá doska je navrhnutá bez klasického PCI Express rozhrania. NVIDIA použila úplne nový dizajn, ktorý využíva NVLink Gen6 a CXL rozhrania umiestnené na hornej a spodnej strane modulu. Tieto konektory zabezpečujú priamu komunikáciu medzi viacerými Superchip modulmi v serverových rackoch. Výsledkom je takmer nulová latencia medzi procesorovou a grafickou časťou, čo je zásadný rozdiel oproti tradičným GPU akcelerátorom.

Z konštrukčného hľadiska ide o viacvrstvovú dosku, kde Rubin GPU sú umiestnené po stranách a Vera CPU v strede, čo optimalizuje rozloženie tepla a zlepšuje efektivitu chladenia. Napájanie modulu je riešené trojicou napájacích konektorov na spodnej hrane, ktoré zásobujú celý Superchip jednotne – nie oddelene pre GPU a CPU, ako tomu bolo pri starších DGX platformách.

Z dizajnového hľadiska pôsobí Vera Rubin Superchip modul ako miniatúrna základná doska počítača – len s tým rozdielom, že všetko je tu prispôsobené pre AI výpočty na úrovni dátového centra. NVIDIA týmto ukázala smer, ktorým sa bude uberať jej budúca infraštruktúra: nie samostatné akcelerátory, ale integrované výpočtové moduly, v ktorých CPU a GPU pracujú ako jedno telo.

Rubin GPU – nástupca Blackwell pre AI superpočítače

Samotné Rubin GPU tvoria hlavný výpočtový základ modulu Vera Rubin Superchip. Každé GPU využíva čipletovú architektúru, v ktorej sú výpočtové čipletové bloky prepojené vysokorýchlostnou internou sieťou. Tento dizajn umožňuje efektívnejšie rozloženie výkonu a zníženie tepla pri extrémnej záťaži.

Každý čip obsahuje viacero výpočtových čipletov obklopených HBM4 pamäťovými stohmi, ktoré poskytujú dvojnásobnú priepustnosť oproti HBM3e. Pamäť je umiestnená priamo pri výpočtových jednotkách, čím sa minimalizuje latencia a energetické straty. Rubin GPU tak dokáže spracovávať obrovské dátové bloky bez závislosti na externých pamätiach – ideálne pre tréning veľkých jazykových modelov, simulácie či inferenciu generatívnej AI.

Jensen Huang drží modul NVIDIA Vera Rubin Superchip s dvomi GPU a jedným CPU počas prezentácie na GTC 2025. — *Detailnejší pohľad na modul NVIDIA Vera Rubin Superchip s dvomi GPU a jedným CPU*

Čipy sú vyrábané 3 nm procesom a optimalizované pre vysoký paralelizmus – súbežné spracovanie viacerých úloh naraz. Každé GPU komunikuje s procesorom Vera CPU cez NVLink Gen6 rozhranie, čo eliminuje potrebu PCIe komunikácie. Tento priamy prístup CPU-GPU poskytuje vyšší dátový tok a nižšiu odozvu pri AI výpočtoch.

Rubin GPU bude tvoriť základ nových dátacentrových systémov NVIDIA DGX a GB200 Rack, ktoré nahradia súčasné zostavy s architektúrou Blackwell. Výrobné testy prebiehajú od októbra 2025, pričom prvé produkčné verzie sa očakávajú v druhej polovici 2026.

Vera CPU – 88 jadier optimalizovaných pre AI a HPC

Vera CPU riadi chod celého Vera Rubin Superchip a aktívne sa zapája do výpočtov. Je vybavený 88 jadrami s vysokou úrovňou paralelizmu a integrovanými tensorovými aj vektorovými jednotkami, ktoré zrýchľujú spracovanie dát priamo v procesore. Tým odpadá nutnosť neustáleho presúvania úloh medzi CPU a GPU, čo výrazne znižuje latenciu.

Procesor je prepojený s dvojicou Rubin GPU prostredníctvom rozhrania NVLink Gen6, ktoré umožňuje obojsmerný prenos dát s minimálnou odozvou. Zároveň komunikuje aj s ostatnými Superchip modulmi v racku, čím vytvára jednotnú výpočtovú sieť, v ktorej sa výkon dynamicky prerozdeľuje podľa aktuálnej záťaže.

Vera CPU prináša citeľne vyššiu efektivitu a lepší pomer výkonu k spotrebe než predošlé generácie systémov Grace Hopper. V kombinácii s Rubin GPU tvorí dokonale integrovaný celok, ktorý spracúva dáta plynulo a bez tradičných hraníc medzi procesorom a grafickou jednotkou.

Záver – Vera Rubin Superchip

Vera Rubin Superchip nie je len ďalší produkt, ale nový základ, na ktorom NVIDIA stavia budúcnosť výpočtov. Je navrhnutý pre AI superpočítače, cloudové platformy a dátové centrá, kde CPU a GPU prvýkrát fungujú ako jeden organizmus – rýchlejší, úspornejší a inteligentnejší než kedykoľvek predtým.

Výroba sa začne v druhej polovici 2026 a nasadenie v dátových centrách sa očakáva v roku 2027. Týmto krokom NVIDIA otvára éru, v ktorej sa hranice medzi výpočtovým čipom a inteligenciou stierajú – presne ako povedal Jensen Huang: „Budujeme systémy, ktoré nebudú len počítať. Budú chápať.“