Vera, la nuova CPU di Nvidia, diventerà il cuore degli agenti AI

Il componente centrale della nuova piattaforma Vera Rubin è una CPU progettata non per elaborare ma per governare gli agenti e portarli dalla fase sperimentale alla produzione industriale

mag 21, 2026

Questa settimana facciamo il punto su Vera, la novità più importante presentata da Nvidia nei giorni scorsi. E poi ovviamente parliamo Google I/O, pieno di sorprese (AI a go-go), senza contare il gran finale del match Musk vs Altman, che ha visto un vincitore scontato. Più il libro della settimana, come al solito. Ma soprattutto: agenti, agenti, agenti, come se non ci fosse un domani..

NVIDIA cambia passo. E con la nuova CPU Vera sposta il baricentro dell’AI dal “chip che accelera” al “chip che governa”. Vera non è solo una nuova CPU: è il centro di comando degli agenti, il punto in cui calcolo, memoria e decisione iniziano a parlare la stessa lingua.

La macchina che orchestra

Fino a ieri, l’intelligenza artificiale aveva un profilo abbastanza semplice: un modello riceveva una domanda, elaborava una risposta, si fermava. La GPU faceva il lavoro pesante, la CPU era il contorno: buona per gestire l’interfaccia e poco più. Ma il paradigma degli agenti AI cambia questa geometria in modo radicale.

Un agente non risponde: agisce. Pianifica sequenze di operazioni, consulta basi dati, chiama strumenti esterni, mantiene memoria di quello che ha fatto, gestisce processi che non si esauriscono in un singolo scambio. Questo significa che il volume di operazioni che gravitano sulla CPU, il coordinatore di tutto questo traffico, cresce molto più che in passato. Vera nasce esattamente per questo: 88 core “Olympus”, più banda per core, più reattività, più efficienza nei carichi distribuiti e continui che gli agenti generano.

Dentro la piattaforma Vera Rubin

Vera è la punta di diamante di una nuova piattaforma. NVIDIA la inserisce nel sistema Vera Rubin NVL72, dove dialoga con due GPU Rubin attraverso l’interconnessione NVLink-C2C in un’architettura pensata per scala industriale. Non si compra un chip: si adotta un’infrastruttura completa, con networking, raffreddamento, software e schemi di riferimento per i clienti enterprise. È la stessa logica con cui Apple vende il proprio ecosistema, applicata ai data center.

I primi sistemi Vera sono stati consegnati personalmente dall’amministratore delegato Jensen Huang ad alcuni dei clienti più rilevanti: OpenAI, Anthropic, SpaceX, Oracle Cloud. Un gesto che serve a trasmettere un messaggio preciso: questa tecnologia non è un prototipo da laboratorio, è pronta per il deployment reale.

Agenti e fabbriche di intelligenza

La scelta di presentare Vera come risposta hardware all’era degli agenti non è casuale. Gli agenti consumano risorse in modo completamente diverso dai chatbot: più token, più passaggi intermedi, più accessi a memoria e rete, processi che restano attivi nel tempo, invece di chiudersi in millisecondi. NVIDIA chiama tutto questo “AI factory“: un ambiente in cui gli agenti vengono trattati come servizi, monitorati e governati come infrastruttura critica, con accesso a dati proprietari e connessioni verso sistemi aziendali diversi.

Il mercato ha recepito il segnale. Al GTC 2026 NVIDIA ha citato ordini potenziali da quasi mille miliardi di dollari per le piattaforme Blackwell e Vera Rubin entro il 2027, segnale che la domanda da parte delle aziende è diventata reale.

La posta in gioco

Intanto, Vera è il segnale che NVIDIA vuole controllare l’intera macchina dell’AI industriale, non solo la GPU che addestra i modelli. Se Blackwell ha consolidato il vantaggio nell’accelerazione, Vera Rubin estende quella leadership al sistema completo: CPU, memoria, interconnessione, software. Chi adotta la piattaforma intera non compra solo silicio: adotta standard architetturali e uno stack tecnologico che rende poi molto complicato andarsene.

La vera posta in gioco è l’infrastruttura del prossimo ciclo: meno chat, più processi; meno singola risposta, più sistemi che lavorano in modo continuativo e autonomo. In questo scenario, Vera è il punto di partenza. E poi? Tra un anno vedremo una versione scalata per le nostre case?

Altre cose successe in settimana

Google I/O 2026: l’era degli agenti è cominciata

Google I/O 2026 ha sancito una svolta: l’intelligenza artificiale non è più un prodotto separato ma il livello principale di interazione con tutti i servizi Google. La scala del fenomeno: due anni fa i server elaboravano 9,7 mila miliardi di token al mese, l’anno scorso 480mila miliardi. Oggi si è a oltre 3,2 milioni di miliardi mensili. L’app Gemini è passata da 400 a 900 milioni di utenti attivi. Per sostenere tutto questo, gli investimenti in infrastruttura salgono a 180-190 miliardi di dollari quest’anno, sei volte il livello del 2022.

Google I/O 2026: arrivano gli agenti e la Search cambia per sempre

Sundar Pichai coglie la palla al balzo: il suo motore di ricerca affronta il suo aggiornamento più radicale in 25 anni. La novità centrale sono gli “Information Agent”: assistenti che lavorano in background, monitorano parametri scelti dall’utente e inviano notifiche solo quando si verificano le condizioni richieste. La barra di ricerca accetta input vocali, immagini e file. Per compiti complessi, Search genera cruscotti personalizzati. Negli Usa partono anche le prenotazioni automatiche: Google chiama direttamente i negozi per conto di chi cerca.

Google I/O 2026: le altre novità principali

Gemini 3.5 Flash, il nuovo modello predefinito, è pensato per compiti agentici su orizzonti temporali lunghi. Lo affianca Gemini Spark, un assistente personale attivo 24 ore su 24 e capace di continuare a lavorare anche a schermo spento, analizza estratti conto, gestisce email scolastiche e redige documenti in autonomia. Sul fronte creativo, Gemini Omni genera video da testo, immagini e audio con coerenza fisica dei movimenti. Arrivano anche gli occhiali intelligenti Android XR, firmati Gentle Monster e Warby Parker, e (finalmente) l’app Gemini per macOS.

Vi ricordate lo scontro del decennio tra Elon Musk e Sam Altman? Ecco com’è finita

Ne avevamo parlato giovedì scorso. Elon Musk ha portato Sam Altman in tribunale chiedendo fino a 150 miliardi di dollari di risarcimento, accusandolo di aver tradito la missione no-profit di OpenAI trasformandola in una macchina da soldi controllata dagli investitori istituzionali (cioè i venture capitalist e i grandi fondi). Una giuria californiana ha impiegato meno di due ore per respingere tutto, con un voto all’unanimità: causa presentata fuori tempo massimo, scatta la prescrizione e arrivederci. Il titolo Tesla ha perso terreno a Wall Street non appena è arrivata la notizia. Musk non ha commentato pubblicamente (almeno per adesso). Tutto ok fino al prossimo round.

J.G. Ballard cinquant’anni fa aveva già capito tutto

Nel 1975 James Graham Ballard ha scritto Il condominio (in originale: High-Rise). Il romanzo parla di un grattacielo londinese dove nel giro di tre mesi gli inquilini (tutti membri della classe media) regrediscono alla barbarie tribale per via di un blackout. La prima riga è: un dottore sul balcone che si mangia il cane. Cinquant’anni dopo viviamo in un mondo di ecosistemi digitali chiusi, algoritmi che ci segregano per piano sociale e violenza diffusa come sfondo. Ballard era semplicemente in anticipo.

TechDale

Discussione su questo Post

Assolutamente, procediamo.