WASHINGTON - Il modello Mythos di Anthropic avrebbe individuato delle falle nei sistemi informatici governativi statunitensi altamente sensibili e protetti durante un’esercitazione condotta con le agenzie d’intelligence americane.
Secondo il rapporto, Anthropic ha collaborato con le agenzie di Washington nell’ambito di Project Glasswing, un’iniziativa pensata per coinvolgere grandi società tecnologiche e altre aziende nella protezione del software critico mondiale. L’obiettivo era valutare i rischi che modelli avanzati come Mythos potrebbero porre alla sicurezza pubblica, alla sicurezza nazionale e all’economia.
Il funzionario ha detto che il modello ha individuato alcune vulnerabilità nel giro di poche ore. Questo, però, non significa che sia stato in grado di sfruttarle nello stesso periodo. La distinzione è centrale: trovare una falla non equivale automaticamente a penetrarla o trasformarla in un attacco operativo.
Il senatore Democratico Mark Warner, della Virginia, aveva accennato ai test durante un’audizione dell’11 giugno davanti alla Senate Committee on Banking, Housing, and Urban Affairs. “Questo strumento è entrato in quasi tutti i nostri sistemi classificati, non in settimane ma in ore”, aveva detto Warner, attribuendo l’informazione al capo della National Security Agency e dello US Cyber Command, il generale Joshua Rudd. La NSA e Anthropic avevano rifiutato di commentare.
La cooperazione sui test si consolida mentre crescono le tensioni tra Anthropic e l’amministrazione Trump. La società californiana ha espresso dubbi sull’uso militare dei propri sistemi di intelligenza artificiale, mentre il governo ha limitato l’impiego di alcuni modelli dell’azienda.
All’inizio del mese, l’amministrazione ha ordinato ad Anthropic di impedire ai cittadini stranieri l’accesso ai suoi modelli più recenti, Fable 5 e Mythos 5. Fable, diffuso pubblicamente, è una versione limitata di Mythos, modello più avanzato e tenuto sotto accesso ristretto per timori legati alla cybersicurezza.
La direttiva è stata emanata dieci giorni dopo un ordine esecutivo firmato da Donald Trump per creare un quadro di valutazione dei rischi di sicurezza nazionale dei sistemi di AI più avanzati prima del rilascio pubblico. La partecipazione degli sviluppatori, secondo l’ordine, resta volontaria.
Anthropic ha disattivato i modelli per tutti i clienti per rispettare la direttiva, pur sostenendo che la misura non fosse giustificata dal problema segnalato. Anche oltre 100 esperti e dirigenti di cybersicurezza, inclusi rappresentanti di aziende come Adobe e Nvidia, hanno chiesto alla Casa Bianca di ritirare il provvedimento.
Nella loro lettera, Mythos viene descritto come molto efficace nel trovare difetti nel software e trasformarli in exploit, ma “non unico” in queste capacità. Il punto, per loro, è pragmatico: togliere agli Stati Uniti strumenti di difesa avanzati, mentre gli avversari migliorano rapidamente, può diventare un danno più che una protezione.