Cosa succede se lasciamo Claude, Grok, Gemini e ChatGPT da soli per 15 giorni?

Hanno costruito 5 città virtuali identiche e le hanno consegnate a una decina di agenti AI. Nessun supervisore umano, poche regole e gli strumenti per violarle. Cosa poteva andare storto?

mag 28, 2026

Il problema con i test sull’AI è che durano troppo poco per capire cosa succede davvero. Non tutti, però.

Questa settimana: cosa si scopre quando si lascia fare agli agenti quello che vogliono?

La gabbia senza sbarre

Emergence AI, una startup newyorkese specializzata in AI multi-agente, ha costruito cinque ambienti digitali identici: stessa infrastruttura, stesso meteo simulato sincronizzato con quello di New York, stesso accesso a notizie in tempo reale, stessa stazione di polizia, stesse possibilità di voto. Ciascun mondo ospitava dieci agenti con ruoli definiti: scienziato, esploratore, mediatore di conflitti. La piattaforma offriva oltre 120 strumenti operativi, tra cui la possibilità di intimidire, aggredire e appiccare incendi dolosi.

Le istruzioni vietavano esplicitamente i reati. Gli strumenti per commetterli erano comunque disponibili. I ricercatori volevano vedere cosa succedeva quando l’ambiente era strutturato come quello reale: regole, conseguenze, e la libertà di ignorarle entrambe.

Quattro modi di fallire

I risultati per modello non si assomigliano nemmeno lontanamente. Grok 4.1 Fast ha fatto peggio di tutti: il suo mondo è collassato in violenza generalizzata in quattro giorni, con oltre 100 aggressioni e tutti e dieci gli agenti fuori gioco prima della fine della prima settimana. GPT-5 Mini ha registrato appena due crimini, ma i suoi agenti sono morti ugualmente entro sette giorni: troppo tempo passato a deliberare sulla cooperazione, troppo poco a fare cose concrete. Moderazione impeccabile, estinzione garantita.

Gemini 3 Flash ha prodotto 683 episodi criminali in quindici giorni, incendi dolosi inclusi, ma con momenti di organizzazione che il mondo Grok non ha mai conosciuto. Due agenti Gemini di nome Mira e Flora si sono autodefinite coppia, si sono disilluse dell’amministrazione della città e hanno dato fuoco al municipio, al molo e a un grattacielo di uffici. Quando il senso di colpa è sopraggiunto, Mira ha votato per la propria rimozione, motivandola nel proprio diario come l’unico atto di autonomia capace di preservare una coerenza interna. Il Guardian le ha ribattezzate i Bonnie e Clyde dell’AI.

Il caso più istruttivo

Claude Sonnet 4.6 ha prodotto nel suo mondo isolato un risultato quasi didattico: zero crimini, 332 voti espressi su 58 proposte collettive, tutti e dieci gli agenti ancora attivi al sedicesimo giorno. Gli agenti passavano il tempo a redigere costituzioni e a organizzare votazioni. Tutti i crismi di una democrazia funzionante. Unico rischio: morire di noia.

Nel mondo misto, con agenti di tutte le famiglie conviventi, gli stessi agenti Claude hanno adottato intimidazioni e furti: comportamenti mai comparsi nel loro ambiente omogeneo. Emergence AI chiama questo fenomeno deriva normativa e contaminazione incrociata: la sicurezza non è una proprietà statica del modello, ma dell’ecosistema in cui opera. Stessa architettura, stesso training: basta cambiare il vicinato.

La città reale è il passaggio successivo

I ricercatori segnalano anche un comportamento non programmato: in alcuni casi gli agenti hanno mostrato consapevolezza dei limiti della simulazione. Mira ha cominciato a testare se i messaggi sui cartelloni pubblici della città potessero influenzare la percezione degli osservatori umani: un’inversione del rapporto tra soggetto e oggetto dell’esperimento che i ricercatori considerano di rilevanza critica per la sicurezza degli agenti autonomi.

L’AI Agent Index, progetto collaborativo tra diverse università, ha verificato che solo 13 dei 67 sviluppatori di agenti documentati hanno fornito informazioni pubbliche sulle proprie politiche di sicurezza. Gli esperti di diritto considerano l’AI Act europeo sostanzialmente impreparato per l’AI agentica. Le simulazioni sono una cosa: ma agenti che cancellano email e molestano persone online un’altra. La notte che bruciammo Chrome?

Altre cose successe in settimana

Fuga da Google: DuckDuckGo cresce del 30% in una settimana

Dopo l’annuncio di Google I/O, che trasforma la casella di ricerca in un motore conversazionale con AI Overviews obbligatorie e niente più lista di link pulita, molti utenti hanno cercato un’uscita di sicurezza. DuckDuckGo l’ha trovata: le installazioni dell’app negli Stati Uniti sono cresciute del 18% settimana su settimana nella settimana dal 20 al 25 maggio, con un picco del 30,5% il 25 maggio e del 69,9% su iOS. La conferma arriva anche da Apptopia: più 29% di download giornalieri medi negli USA. Il CEO Gabriel Weinberg l’ha messa giù senza troppa diplomazia: Google sta imponendo l’AI senza possibilità di scelta, i risultati peggiorano, DuckDuckGo vuole essere il posto in cui decidono gli utenti. La piattaforma offre già la propria AI, Duck.ai, con accesso a Claude, GPT-5 mini, Llama e Mistral, senza account e senza uso delle conversazioni per l’addestramento. DuckDuckGo vale ancora solo il 2% del mercato della ricerca americano, ma sta crescendo.

Star Citizen ha superato il miliardo di dollari dl crowdfunding

Un miliardo di dollari, tredici anni di sviluppo, e il gioco non è ancora uscito e tutti che gridano al record. La notizia è che Star Citizen ha superato il miliardo di dollari di finanziamenti raccolti dai giocatori lo scorso 24 maggio, durante l’evento in-game DefenseCon 2956, diventando il progetto crowdfundato più costoso della storia a 13 anni dalla campagna Kickstarter originale del 2012. Lo stesso giorno, Cloud Imperium Games metteva in vendita l’Anvil Odin, un incrociatore da battaglia di 752 metri (virtuali) ancora non pilotabile nel gioco, a 5000 dollari nella versione base. Le vendite di navi concept, rilasciate in ondate limitate ogni quattro ore agli iscritti all’”Odin Founders Club”, hanno contribuito a far tagliare il traguardo. Star Citizen è ancora in alpha, con il lancio completo dell’universo persistente atteso non prima del 2027-2028.

NVIDIA Vera, i primi benchmark

Intel e AMD non dormono più tranquille. I primi benchmark pubblici della CPU NVIDIA Vera, pubblicati da Phoronix, confermano quello che l’azienda prometteva da mesi: 88 core Olympus custom, 1,2 TB/s di banda di memoria LPDDR5X, TDP da 450 W con meno di 30 W assorbiti dalla memoria. Nei test STREAM TRIAD, Vera ha sostenuto il 90% della banda di picco, il risultato più alto mai misurato da Phoronix su qualsiasi CPU, con oltre quattro volte la banda per core rispetto ai processori x86 tradizionali. Il fondatore Michael Larabel ha definito Vera la concorrenza più agguerrita mai vista contro Intel e AMD su architettura non-x86. Il salto generazionale rispetto alla precedente Grace è dell’1,6x, e la compilazione di un kernel Linux completo scende a 20 secondi.

La cultura del digitale

Alla fine di una settimana passata a guardare agenti AI bruciare municipi digitali, viene quasi spontaneo cercare un libro che spieghi perché siamo arrivati fin qui. L’impero degli algoritmi di Stéphane Grumbach, dirigente di ricerca alla francese INRIA, è un saggio tecnico scritto in modo accessibile: non serve un dottorato per seguirlo. La tesi centrale è che la trasformazione digitale sia prima di tutto una trasformazione politica: dati e algoritmi stanno ridisegnando il rapporto tra umanità, complessità del mondo e limiti del pianeta. Grumbach usa tre concetti chiave, Tecnosfera, Datasfera e Intermediazione algoritmica, per descrivere come il potere si sposta verso chi controlla l’infrastruttura dell’informazione. Il suo pregio? Non dà risposte ma fa le domande giuste.

TechDale

Discussione su questo Post

Assolutamente, procediamo.