top of page

NVIDIA Rubin CPX: Rivoluzione nell'Infrastruttura per l'Intelligenza Artificiale

  • Immagine del redattore: 3DMultisystem
    3DMultisystem
  • 13 set 2025
  • Tempo di lettura: 2 min

Durante l'AI Infra Summit, NVIDIA ha svelato la nuova GPU Rubin CPX, un acceleratore specificamente concepito per gestire i complessi carichi di lavoro di inferenza contestuale massiva. Questo chip, parte della futura serie Rubin, è stato progettato per supportare modelli che possono elaborare enormi quantità di dati, da centinaia di migliaia a milioni di "token". Le sue applicazioni includono l'analisi di interi repository di codice e la creazione e ricerca di contenuti video di lunga durata.

A differenza delle architetture multi-GPU di Blackwell, la Rubin CPX si basa su un design monolitico. Integra 128 GB di memoria GDDR7 e offre prestazioni di calcolo di 30 PetaFLOPS (NVFP4). La sua architettura è ottimizzata per la fase iniziale dell'inferenza, dove i modelli analizzano grandi input prima di generare l'output.

Il chip include anche quattro unità NVENC e quattro NVDEC per la codifica e decodifica video, eliminando la necessità di componenti esterni per i flussi di lavoro multimediali. NVIDIA sostiene che la Rubin CPX è fino a tre volte più veloce dei sistemi basati su GB300 Blackwell Ultra.

La Rubin CPX sarà compatibile con i rack NVIDIA Vera Rubin NVL144, creando un sistema con una potenza di calcolo combinata di 8 ExaFLOPS, oltre a 100 TB di memoria e una banda passante di 1,7 PB/s. La connettività sarà gestita da ConnectX-9 SuperNICs e Spectrum-X Ethernet, integrati nel framework NVIDIA Dynamo.

NVIDIA prevede che la nuova piattaforma possa offrire un ritorno sull'investimento 30-50 volte superiore, proiettando ricavi di 5 miliardi di dollari per ogni 100 milioni investiti, grazie alla monetizzazione delle applicazioni che usano contesti lunghi.

La Rubin CPX sarà supportata dall'intero ecosistema software di NVIDIA, tra cui CUDA-X, le librerie AI enterprise e i microservizi NIM. Potrà anche eseguire i modelli multimodali Nemotron. Aziende come Cursor, Runway e Magic stanno già esplorando il potenziale di questa GPU per la generazione di codice, la creazione di video generativi e lo sviluppo di agenti software.

NVIDIA ha programmato il lancio della GPU Rubin CPX e della piattaforma Vera Rubin NVL144 CPX per la fine del 2026, dopo l'introduzione della serie standard Rubin all'inizio dello stesso anno.


 
 
  • Facebook
  • Twitter
  • Instagram
  • TikTok

3Dmultisystem 

Blog di informatica ed altro

© 2025 by 3DMultisystem

Contattaci

Contattaci sulle nostre pagine social oppure su:

3dmultisystem@gmail.com

bottom of page