Quanto dobbiamo preoccuparci di Mythos

La nuova intelligenza artificiale di Anthropic è velocissima a scoprire le falle di sicurezza nei sistemi che fanno funzionare il mondo, forse troppo

(Brendon Thorne/Bloomberg via Getty Images)

Caricamento player

La società statunitense Anthropic sta indagando su alcuni sospetti accessi non autorizzati a Mythos, il suo nuovo modello di intelligenza artificiale che da inizio aprile sta suscitando forti preoccupazioni tra gli esperti informatici. Mythos infatti ha mostrato di saper identificare con grande facilità le falle di sicurezza nei sistemi informatici, che potrebbero essere sfruttate per compiere attacchi a molti servizi online compresi quelli bancari e delle infrastrutture, da quelle energetiche a quelle dei trasporti. Proprio per questo motivo il modello non è stato reso disponibile a tutti e qualsiasi accesso non autorizzato potrebbe compromettere la sicurezza di diversi sistemi.

Anthropic non ha fornito altri dettagli sulle indagini, ma a inizio settimana Bloomberg aveva riferito di almeno un gruppo non autorizzato che aveva avuto accesso a Mythos. Per farlo non aveva violato i sistemi di sicurezza dell’azienda, ma aveva sfruttato un sistema secondario di accesso a disposizione di una delle società che forniscono servizi ad Anthropic. Il gruppo è riuscito a ricostruire i percorsi per raggiungere online il modello ed è riuscito a inviare alcune richieste. A Bloomberg uno dei partecipanti ha detto che Mythos è stato usato per provarne le potenzialità, ma senza sfruttarlo per attività malevole.

Le informazioni diffuse su Mythos sono ancora vaghe proprio per la pericolosità che Anthropic ha attribuito allo stesso sistema che ha sviluppato. Da settimane l’azienda sta lavorando con il governo degli Stati Uniti e alcune delle più grandi aziende tecnologiche – come Amazon, Apple e Microsoft – per mettere in sicurezza i loro sistemi nell’ambito dell’iniziativa Project Glasswing.

Le preoccupazioni riguardano in particolare la capacità del modello di generare automaticamente degli “exploit”, cioè trovare falle e creare codice per sfruttarle e causare danni.

I sistemi che usiamo ogni giorno, dai programmi per navigare online alle app per accedere al conto corrente, contengono quasi sempre errori di programmazione dovuti a disattenzioni di chi li ha realizzati o alla sottovalutazione di alcune implicazioni. A volte passano inosservati o vengono sistemati dopo molto tempo, cosa che può essere sfruttata da soggetti malintenzionati per avere accesso a dati che di solito sono protetti da quegli stessi programmi. In alcuni casi il furto si limita a un indirizzo email, in altri a dati personali e finanziari, in altri ancora alla possibilità di controllare interi sistemi che fanno funzionare un circuito di carte di credito o la rete elettrica di un intero paese.

Degli errori si accorgono a volte le aziende che sviluppano i software, che li vanno a cercare, oppure terzi che li segnalano chiedendo spesso in cambio una ricompensa. Capita che gli errori riguardino più aziende, visto che i loro software utilizzano parti di codice open source, cioè realizzato da comunità di sviluppatori e condiviso pubblicamente. Chi vuole approfittarne fa altrettante ricerche, naturalmente senza comunicarlo ai soggetti interessati. È un processo quasi sempre lungo e chi arriva per primo ha un vantaggio e obbliga gli altri a correre ai ripari. Mythos potrebbe cambiare tutto questo.

Il modello di Anthropic ha mostrato di sapere identificare in pochissimo tempo decine e a volte centinaia di falle di sicurezza, offrendo poi il modo migliore per sfruttarle per “bucare” i software. In molti casi, la velocità ha sorpreso non solo gli esperti di sicurezza, ma la comunità degli sviluppatori in generale.

Mozilla, la comunità che mantiene e realizza Firefox, storico browser tra i più usati al mondo, ha detto che grazie a Mythos ha identificato e sistemato 271 vulnerabilità nel proprio programma per navigare online. Il direttore tecnico (CTO) di Firefox, Bobby Holley, ha scritto in un post: «Per ora non abbiamo trovato alcuna categoria o complessità di vulnerabilità che questo modello non possa trovare rispetto agli umani. Questo può sembrare spaventoso nell’immediato, ma in definitiva è un’ottima notizia per chi si occupa di sicurezza».

Holley, e diversi altri del settore, ritengono che modelli come Mythos daranno la possibilità di controllare i codici informatici prima di diffonderli, azzerando il rischio di mettere online software e sistemi con falle che potrebbero essere sfruttate da utenti malintenzionati. Questo perché renderanno meno costoso scoprirne le vulnerabilità, rimuovendo il maggiore vantaggio che ha chi attacca i software, cioè il tempo che ha a disposizione per trovare una falla.

Non tutti sono però della stessa opinione. Modelli di intelligenza artificiale concorrenti potrebbero comunque identificare falle sfuggite a quel controllo, oppure elaborare nuove soluzioni per approfittare anche degli errori di programmazione più innocui. Il sistema potrebbe inoltre privilegiare le grandi aziende tecnologiche che si potranno permettere i modelli più potenti e costosi, a scapito di chi ha meno risorse e faticherà di più a competere, comprese le comunità dei software open source.

Le preoccupazioni espresse in queste settimane dagli esperti di sicurezza non riguardano tanto un futuro in cui modelli come Mythos potranno essere la normalità, ma l’attuale presente in cui potenzialmente migliaia di falle di sicurezza potrebbero essere identificate in breve tempo e sfruttate per violare interi sistemi.

Il CEO di Anthropic, Dario Amodei (Krisztian Bocsi/Bloomberg via Getty Images)

Venerdì 17 aprile il CEO di Anthropic, Dario Amodei, ha incontrato alcuni rappresentanti del governo degli Stati Uniti, nonostante i difficili rapporti in seguito alla decisione dell’azienda di non fornire alcuni dei propri sistemi al dipartimento della Difesa. Amodei ha confermato di avere limitato l’accesso a Mythos a circa 40 organizzazioni che gestiscono o usano tecnologie che in sostanza fanno funzionare pezzi importanti di mondo, dalle reti elettriche a Internet passando per i sistemi interbancari.

L’idea è che l’accesso privilegiato consenta di identificare e sistemare la maggior parte delle falle di sicurezza trovate da Mythos, prima che il modello – o modelli concorrenti – possano identificarle e fornire ad altri gli strumenti per sfruttarle. La Banca centrale europea si è attivata per capire la solidità informatica dei sistemi bancari nell’Unione Europea, mentre la Commissione Europea ha finora faticato a concordare con Anthropic le modalità per avere un accesso privilegiato al modello ed esplorarne le capacità. Il governatore della Banca centrale del Regno Unito ha detto che con Mythos si potrebbe essere davanti a un modo «per scardinare l’intero mondo che si occupa di rischi informatici».

Anthropic ha ricevuto critiche da parte della comunità open source per non avere condiviso sufficienti informazioni sul suo nuovo modello. La mancanza di dettagli tecnici e di accesso rende difficile una valutazione dei rischi e dei possibili usi impropri del modello stesso.

Altri hanno accusato Anthropic di avere causato il problema, sviluppando Mythos, e di volere ora vendere la soluzione sempre attraverso quel modello. È del resto già successo in più occasioni negli ultimi anni di rapida evoluzione dei sistemi di intelligenza artificiale. Soprattutto in ambito informatico, la loro diffusione sta cambiando il funzionamento di un intero settore, con grandi incognite sull’affidabilità stessa dei modelli che vengono proposti e spesso promossi come risolutivi nonostante i loro limiti ancora evidenti.

Modelli come Mythos non influenzano solamente prodotti o servizi digitali, ma possono incidere direttamente sulla sicurezza di interi paesi e dei loro sistemi economici. Le aziende che li producono si muovono in un’area grigia, ancora non normata, in cui le loro decisioni possono avere conseguenze globali e creare una dipendenza da parte degli stessi governi che utilizzano i loro servizi.

Tag: anthropic-Dario Amodei-intelligenza artificiale-mythos