NVIDIA āđ€āļ›āļīāļ”āļ•āļąāļ§ “Rubin Platform” — āđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ AI āļ—āļĩāđˆāļ—āļĢāļ‡āļžāļĨāļąāļ‡āļ—āļĩāđˆāļŠāļļāļ”āđƒāļ™āđ‚āļĨāļ āļžāļĢāđ‰āļ­āļĄāļŠāļīāļ› 6 āļ•āļąāļ§ āđāļĨāļ°āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļāļ§āđˆāļē Blackwell āļ–āļķāļ‡ 5 āđ€āļ—āđˆāļē

NVIDIA āđ€āļ›āļīāļ”āļ•āļąāļ§āđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ Rubin āļ­āļĒāđˆāļēāļ‡āđ€āļ›āđ‡āļ™āļ—āļēāļ‡āļāļēāļĢ āļ‹āļķāđˆāļ‡āļ–āļđāļāļ­āļ­āļāđāļšāļšāđƒāļŦāđ‰āđ€āļ›āđ‡āļ™āļŦāļąāļ§āđƒāļˆāļ‚āļ­āļ‡āļĻāļđāļ™āļĒāđŒāļ‚āđ‰āļ­āļĄāļđāļĨ AI āļĢāļļāđˆāļ™āļ–āļąāļ”āđ„āļ› āđ‚āļ”āļĒ Rubin āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļāļ§āđˆāļē Blackwell āļ–āļķāļ‡ 5× āđƒāļ™āļ‡āļēāļ™ inference āđāļĨāļ° 3.5× āđƒāļ™āļ‡āļēāļ™ training āļžāļĢāđ‰āļ­āļĄāļŠāđ€āļ›āļāļ—āļĩāđˆāđ€āļĢāļĩāļĒāļāđ„āļ”āđ‰āļ§āđˆāļē “āļŠāļļāļ”āļ‚āļĩāļ”” āļ‚āļ­āļ‡āļ§āļ‡āļāļēāļĢ AI āđƒāļ™āļ›āļąāļˆāļˆāļļāļšāļąāļ™

āđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ Rubin āļ›āļĢāļ°āļāļ­āļšāļ”āđ‰āļ§āļĒ 6 āļŠāļīāļ›āļŦāļĨāļąāļ āđ„āļ”āđ‰āđāļāđˆ
Rubin GPU (336 āļžāļąāļ™āļĨāđ‰āļēāļ™āļ—āļĢāļēāļ™āļ‹āļīāļŠāđ€āļ•āļ­āļĢāđŒ)
Vera CPU (227 āļžāļąāļ™āļĨāđ‰āļēāļ™āļ—āļĢāļēāļ™āļ‹āļīāļŠāđ€āļ•āļ­āļĢāđŒ)
NVLink 6 Switch
ConnectX‑9 (CX9)
BlueField‑4 (BF4)
Spectrum‑X 102.4T CPO (silicon photonics)
āļ—āļąāđ‰āļ‡āļŦāļĄāļ”āļ–āļđāļāļ­āļ­āļāđāļšāļšāđƒāļŦāđ‰āļ—āļģāļ‡āļēāļ™āļĢāđˆāļ§āļĄāļāļąāļ™āđƒāļ™āļĢāļ°āļšāļš DGX / HGX / MGX āļĢāļļāđˆāļ™āđƒāļŦāļĄāđˆ āđ‚āļ”āļĒāļĄāļĩāļŦāļąāļ§āđƒāļˆāļ„āļ·āļ­ Vera Rubin Superchip āļ—āļĩāđˆāļĢāļ§āļĄ 2× Rubin GPU + 1× Vera CPU + HBM4 + LPDDR5X āđ„āļ§āđ‰āđƒāļ™āđāļžāđ‡āļāđ€āļāļˆāđ€āļ”āļĩāļĒāļ§

Rubin GPU āđƒāļŠāđ‰āļ”āļĩāđ„āļ‹āļ™āđŒāđāļšāļš dual‑reticle āļžāļĢāđ‰āļ­āļĄ Tensor/Compute cores āļˆāļģāļ™āļ§āļ™āļĄāļēāļ āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļŠāļļāļ” 50 PFLOPs (NVFP4 inference) āđāļĨāļ° 35 PFLOPs (training) āļžāļĢāđ‰āļ­āļĄ HBM4 āļ—āļĩāđˆāđƒāļŦāđ‰āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒāļŠāļđāļ‡āļŠāļļāļ” 22 TB/s āļ•āđˆāļ­āļŠāļīāļ› āļ‹āļķāđˆāļ‡āļĄāļēāļāļāļ§āđˆāļē Blackwell āļ–āļķāļ‡ 2.8×

āļ”āđ‰āļēāļ™ Vera CPU āđƒāļŠāđ‰āļŠāļ–āļēāļ›āļąāļ•āļĒāļāļĢāļĢāļĄ Arm āđāļšāļš custom “Olympus” āļˆāļģāļ™āļ§āļ™ 88 āļ„āļ­āļĢāđŒ / 176 āđ€āļ˜āļĢāļ” āļžāļĢāđ‰āļ­āļĄ NVLink‑C2C 1.8 TB/s āđāļĨāļ°āļĢāļ­āļ‡āļĢāļąāļšāļŦāļ™āđˆāļ§āļĒāļ„āļ§āļēāļĄāļˆāļģāļŠāļđāļ‡āļŠāļļāļ” 1.5 TB LPDDR5X āļ‹āļķāđˆāļ‡āļĄāļēāļāļāļ§āđˆāļē Grace āļ–āļķāļ‡ 3 āđ€āļ—āđˆāļē āđāļĨāļ°āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļ”āđ‰āļēāļ™ data processing / compression āļŠāļđāļ‡āļāļ§āđˆāļēāđ€āļ”āļīāļĄ 2×

āđ„āļŪāđ„āļĨāļ•āđŒāļŠāļģāļ„āļąāļāļˆāļēāļ Rubin Platform
āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āļŦāļĨāļąāļāļ‚āļ­āļ‡ Rubin
50 PFLOPs inference / 35 PFLOPs training āļ•āđˆāļ­ GPU
HBM4 āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒ 22 TB/s āļ•āđˆāļ­āļŠāļīāļ› (āļĄāļēāļāļāļ§āđˆāļē Blackwell 2.8×)
NVLink 6 āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒ 3.6 TB/s āļ•āđˆāļ­ CPU (āđ€āļžāļīāđˆāļĄāļ‚āļķāđ‰āļ™ 2×)
Vera CPU 88 āļ„āļ­āļĢāđŒ Olympus + 1.5 TB LPDDR5X
Confidential Computing āļĢāļļāđˆāļ™āļ—āļĩāđˆ 3 (Rack‑scale TEE)

āļˆāļļāļ”āđ€āļ”āđˆāļ™āļ”āđ‰āļēāļ™āļĢāļ°āļšāļšāđ€āļ„āļĢāļ·āļ­āļ‚āđˆāļēāļĒ
ConnectX‑9 SuperNIC āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒ 1.6 TB/s
BlueField‑4 DPU 800G āļžāļĢāđ‰āļ­āļĄ Grace 64 āļ„āļ­āļĢāđŒāđƒāļ™āļ•āļąāļ§
Spectrum‑X 102.4T CPO āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāđ€āļ„āļĢāļ·āļ­āļ‚āđˆāļēāļĒ 95% āļ—āļĩāđˆāļŠāđ€āļāļĨāļŠāļđāļ‡

āļĢāļ°āļšāļšāļĢāļ°āļ”āļąāļšāļĻāļđāļ™āļĒāđŒāļ‚āđ‰āļ­āļĄāļđāļĨ: NVL72 āđāļĨāļ° SuperPOD
NVIDIA āđ€āļ›āļīāļ”āļ•āļąāļ§ Vera Rubin NVL72 rack āļ‹āļķāđˆāļ‡āļĢāļ§āļĄ 72 GPUs + 36 CPUs āļžāļĢāđ‰āļ­āļĄāļŠāđ€āļ›āļāļ—āļĩāđˆāđ€āļŦāļ™āļ·āļ­āļāļ§āđˆāļē Blackwell āļ­āļĒāđˆāļēāļ‡āļĄāļēāļ:
5× inference throughput (3.6 EFLOPS)
3.5× training throughput (2.5 EFLOPS)
2.8× HBM4 bandwidth (1.6 PB/s)
2× scale‑up bandwidth (260 TB/s)

SuperPOD āļĢāļļāđˆāļ™āđƒāļŦāļĄāđˆāđƒāļŠāđ‰ 8× NVL72 racks āđāļĨāļ°āļĒāļąāļ‡āļĄāļĩāļĢāļļāđˆāļ™āđ€āļĨāđ‡āļāļāļ§āđˆāļēāļ­āļĒāđˆāļēāļ‡ DGX Rubin NVL8 āļŠāļģāļŦāļĢāļąāļšāļĻāļđāļ™āļĒāđŒāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļąāđˆāļ§āđ„āļ›

āļœāļĨāļĨāļąāļžāļ˜āđŒāļ—āļĩāđˆ NVIDIA āđ€āļ„āļĨāļĄ
āļĨāļ”āļ•āđ‰āļ™āļ—āļļāļ™ inference āļ•āđˆāļ­ token āļĨāļ‡ 10×
āļĨāļ”āļˆāļģāļ™āļ§āļ™ GPU āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āđƒāļŠāđ‰āđƒāļ™āļāļēāļĢāđ€āļ—āļĢāļ™ MoE āļĨāļ‡ 4×
Rubin ecosystem āļžāļĢāđ‰āļ­āļĄāļœāļĨāļīāļ•āđāļĨāļ°āļŠāđˆāļ‡āļĄāļ­āļšāļ āļēāļĒāđƒāļ™āļ›āļĩāļ™āļĩāđ‰

https://wccftech.com/nvidia-rubin-most-advanced-ai-platform-50-pflops-vera-cpu-5x-uplift-vs-blackwell/
ðŸĪ–⚥ NVIDIA āđ€āļ›āļīāļ”āļ•āļąāļ§ “Rubin Platform” — āđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ AI āļ—āļĩāđˆāļ—āļĢāļ‡āļžāļĨāļąāļ‡āļ—āļĩāđˆāļŠāļļāļ”āđƒāļ™āđ‚āļĨāļ āļžāļĢāđ‰āļ­āļĄāļŠāļīāļ› 6 āļ•āļąāļ§ āđāļĨāļ°āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļāļ§āđˆāļē Blackwell āļ–āļķāļ‡ 5 āđ€āļ—āđˆāļē NVIDIA āđ€āļ›āļīāļ”āļ•āļąāļ§āđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ Rubin āļ­āļĒāđˆāļēāļ‡āđ€āļ›āđ‡āļ™āļ—āļēāļ‡āļāļēāļĢ āļ‹āļķāđˆāļ‡āļ–āļđāļāļ­āļ­āļāđāļšāļšāđƒāļŦāđ‰āđ€āļ›āđ‡āļ™āļŦāļąāļ§āđƒāļˆāļ‚āļ­āļ‡āļĻāļđāļ™āļĒāđŒāļ‚āđ‰āļ­āļĄāļđāļĨ AI āļĢāļļāđˆāļ™āļ–āļąāļ”āđ„āļ› āđ‚āļ”āļĒ Rubin āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļāļ§āđˆāļē Blackwell āļ–āļķāļ‡ 5× āđƒāļ™āļ‡āļēāļ™ inference āđāļĨāļ° 3.5× āđƒāļ™āļ‡āļēāļ™ training āļžāļĢāđ‰āļ­āļĄāļŠāđ€āļ›āļāļ—āļĩāđˆāđ€āļĢāļĩāļĒāļāđ„āļ”āđ‰āļ§āđˆāļē “āļŠāļļāļ”āļ‚āļĩāļ”” āļ‚āļ­āļ‡āļ§āļ‡āļāļēāļĢ AI āđƒāļ™āļ›āļąāļˆāļˆāļļāļšāļąāļ™ āđāļžāļĨāļ•āļŸāļ­āļĢāđŒāļĄ Rubin āļ›āļĢāļ°āļāļ­āļšāļ”āđ‰āļ§āļĒ 6 āļŠāļīāļ›āļŦāļĨāļąāļ āđ„āļ”āđ‰āđāļāđˆ 💠 Rubin GPU (336 āļžāļąāļ™āļĨāđ‰āļēāļ™āļ—āļĢāļēāļ™āļ‹āļīāļŠāđ€āļ•āļ­āļĢāđŒ) 💠 Vera CPU (227 āļžāļąāļ™āļĨāđ‰āļēāļ™āļ—āļĢāļēāļ™āļ‹āļīāļŠāđ€āļ•āļ­āļĢāđŒ) 💠 NVLink 6 Switch 💠 ConnectX‑9 (CX9) 💠 BlueField‑4 (BF4) 💠 Spectrum‑X 102.4T CPO (silicon photonics) āļ—āļąāđ‰āļ‡āļŦāļĄāļ”āļ–āļđāļāļ­āļ­āļāđāļšāļšāđƒāļŦāđ‰āļ—āļģāļ‡āļēāļ™āļĢāđˆāļ§āļĄāļāļąāļ™āđƒāļ™āļĢāļ°āļšāļš DGX / HGX / MGX āļĢāļļāđˆāļ™āđƒāļŦāļĄāđˆ āđ‚āļ”āļĒāļĄāļĩāļŦāļąāļ§āđƒāļˆāļ„āļ·āļ­ Vera Rubin Superchip āļ—āļĩāđˆāļĢāļ§āļĄ 2× Rubin GPU + 1× Vera CPU + HBM4 + LPDDR5X āđ„āļ§āđ‰āđƒāļ™āđāļžāđ‡āļāđ€āļāļˆāđ€āļ”āļĩāļĒāļ§ Rubin GPU āđƒāļŠāđ‰āļ”āļĩāđ„āļ‹āļ™āđŒāđāļšāļš dual‑reticle āļžāļĢāđ‰āļ­āļĄ Tensor/Compute cores āļˆāļģāļ™āļ§āļ™āļĄāļēāļ āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļŠāļđāļ‡āļŠāļļāļ” 50 PFLOPs (NVFP4 inference) āđāļĨāļ° 35 PFLOPs (training) āļžāļĢāđ‰āļ­āļĄ HBM4 āļ—āļĩāđˆāđƒāļŦāđ‰āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒāļŠāļđāļ‡āļŠāļļāļ” 22 TB/s āļ•āđˆāļ­āļŠāļīāļ› āļ‹āļķāđˆāļ‡āļĄāļēāļāļāļ§āđˆāļē Blackwell āļ–āļķāļ‡ 2.8× āļ”āđ‰āļēāļ™ Vera CPU āđƒāļŠāđ‰āļŠāļ–āļēāļ›āļąāļ•āļĒāļāļĢāļĢāļĄ Arm āđāļšāļš custom “Olympus” āļˆāļģāļ™āļ§āļ™ 88 āļ„āļ­āļĢāđŒ / 176 āđ€āļ˜āļĢāļ” āļžāļĢāđ‰āļ­āļĄ NVLink‑C2C 1.8 TB/s āđāļĨāļ°āļĢāļ­āļ‡āļĢāļąāļšāļŦāļ™āđˆāļ§āļĒāļ„āļ§āļēāļĄāļˆāļģāļŠāļđāļ‡āļŠāļļāļ” 1.5 TB LPDDR5X āļ‹āļķāđˆāļ‡āļĄāļēāļāļāļ§āđˆāļē Grace āļ–āļķāļ‡ 3 āđ€āļ—āđˆāļē āđāļĨāļ°āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāļ”āđ‰āļēāļ™ data processing / compression āļŠāļđāļ‡āļāļ§āđˆāļēāđ€āļ”āļīāļĄ 2× ðŸ“Œ āđ„āļŪāđ„āļĨāļ•āđŒāļŠāļģāļ„āļąāļāļˆāļēāļ Rubin Platform ✅ āļ„āļ§āļēāļĄāļŠāļēāļĄāļēāļĢāļ–āļŦāļĨāļąāļāļ‚āļ­āļ‡ Rubin ➡ïļ 50 PFLOPs inference / 35 PFLOPs training āļ•āđˆāļ­ GPU ➡ïļ HBM4 āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒ 22 TB/s āļ•āđˆāļ­āļŠāļīāļ› (āļĄāļēāļāļāļ§āđˆāļē Blackwell 2.8×) ➡ïļ NVLink 6 āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒ 3.6 TB/s āļ•āđˆāļ­ CPU (āđ€āļžāļīāđˆāļĄāļ‚āļķāđ‰āļ™ 2×) ➡ïļ Vera CPU 88 āļ„āļ­āļĢāđŒ Olympus + 1.5 TB LPDDR5X ➡ïļ Confidential Computing āļĢāļļāđˆāļ™āļ—āļĩāđˆ 3 (Rack‑scale TEE) ‾ïļ āļˆāļļāļ”āđ€āļ”āđˆāļ™āļ”āđ‰āļēāļ™āļĢāļ°āļšāļšāđ€āļ„āļĢāļ·āļ­āļ‚āđˆāļēāļĒ â›” ConnectX‑9 SuperNIC āđāļšāļ™āļ”āđŒāļ§āļīāļ”āļ—āđŒ 1.6 TB/s ⛔ BlueField‑4 DPU 800G āļžāļĢāđ‰āļ­āļĄ Grace 64 āļ„āļ­āļĢāđŒāđƒāļ™āļ•āļąāļ§ â›” Spectrum‑X 102.4T CPO āđƒāļŦāđ‰āļ›āļĢāļ°āļŠāļīāļ—āļ˜āļīāļ āļēāļžāđ€āļ„āļĢāļ·āļ­āļ‚āđˆāļēāļĒ 95% āļ—āļĩāđˆāļŠāđ€āļāļĨāļŠāļđāļ‡ ðŸ§Đ āļĢāļ°āļšāļšāļĢāļ°āļ”āļąāļšāļĻāļđāļ™āļĒāđŒāļ‚āđ‰āļ­āļĄāļđāļĨ: NVL72 āđāļĨāļ° SuperPOD NVIDIA āđ€āļ›āļīāļ”āļ•āļąāļ§ Vera Rubin NVL72 rack āļ‹āļķāđˆāļ‡āļĢāļ§āļĄ 72 GPUs + 36 CPUs āļžāļĢāđ‰āļ­āļĄāļŠāđ€āļ›āļāļ—āļĩāđˆāđ€āļŦāļ™āļ·āļ­āļāļ§āđˆāļē Blackwell āļ­āļĒāđˆāļēāļ‡āļĄāļēāļ: 💠 5× inference throughput (3.6 EFLOPS) 💠 3.5× training throughput (2.5 EFLOPS) 💠 2.8× HBM4 bandwidth (1.6 PB/s) 💠 2× scale‑up bandwidth (260 TB/s) SuperPOD āļĢāļļāđˆāļ™āđƒāļŦāļĄāđˆāđƒāļŠāđ‰ 8× NVL72 racks āđāļĨāļ°āļĒāļąāļ‡āļĄāļĩāļĢāļļāđˆāļ™āđ€āļĨāđ‡āļāļāļ§āđˆāļēāļ­āļĒāđˆāļēāļ‡ DGX Rubin NVL8 āļŠāļģāļŦāļĢāļąāļšāļĻāļđāļ™āļĒāđŒāļ‚āđ‰āļ­āļĄāļđāļĨāļ—āļąāđˆāļ§āđ„āļ› ðŸ“Œ āļœāļĨāļĨāļąāļžāļ˜āđŒāļ—āļĩāđˆ NVIDIA āđ€āļ„āļĨāļĄ âžĄïļ āļĨāļ”āļ•āđ‰āļ™āļ—āļļāļ™ inference āļ•āđˆāļ­ token āļĨāļ‡ 10× âžĄïļ āļĨāļ”āļˆāļģāļ™āļ§āļ™ GPU āļ—āļĩāđˆāļ•āđ‰āļ­āļ‡āđƒāļŠāđ‰āđƒāļ™āļāļēāļĢāđ€āļ—āļĢāļ™ MoE āļĨāļ‡ 4× âžĄïļ Rubin ecosystem āļžāļĢāđ‰āļ­āļĄāļœāļĨāļīāļ•āđāļĨāļ°āļŠāđˆāļ‡āļĄāļ­āļšāļ āļēāļĒāđƒāļ™āļ›āļĩāļ™āļĩāđ‰ https://wccftech.com/nvidia-rubin-most-advanced-ai-platform-50-pflops-vera-cpu-5x-uplift-vs-blackwell/
WCCFTECH.COM
NVIDIA Rubin Is The Most Advanced AI Platform On The Planet: Up To 50 PFLOPs With HBM4, Vera CPU With 88 Olympus Cores, And Delivers 5x Uplift Vs Blackwell
NVIDIA is formally announcing its Rubin AI platform today which will be the heart of next-gen Data Centers, with a 5x upgrade over Blackwell.
0 āļ„āļ§āļēāļĄāļ„āļīāļ”āđ€āļŦāđ‡āļ™ 0 āļāļēāļĢāđāļšāđˆāļ‡āļ›āļąāļ™ 64 āļĄāļļāļĄāļĄāļ­āļ‡ 0 āļĢāļĩāļ§āļīāļ§