Con un piccolo aiuto da parte di un tubo in PVC, i ricercatori del Wisconsin ingannano alcuni sistemi di identificazione vocale
2024-01-08 09:00
Shimaa Ahmed è una studentessa di dottorato presso la UW-Madison. Ha studiato se fosse possibile alterare la risonanza, o le vibrazioni di frequenza specifiche, di una voce, per sconfiggere i dispositivi automatici di identificazione di chi parla.
È possibile ingannare i sistemi informatici che utilizzano la voce di una persona come codice di accesso? Alcuni ingegneri del Wisconsin affermano che la risposta è sì e che lo hanno fatto in parte utilizzando tubi di plastica che puoi trovare in un negozio di ferramenta.
Alcuni sistemi bancari online utilizzano l'identificazione automatica dell'interlocutore, o in parole povere, la voce del titolare del conto come codice di accesso. Kassem Fawaz, professore di ingegneria elettrica e informatica della UW-Madison, afferma che anche gli utenti di iPhone di Apple probabilmente hanno familiarità con l'assistente virtuale Siri, che risponde solo al proprietario.
"Il motivo per cui Siri risponde solo a te è perché utilizzano questa tecnologia chiamata identificazione dell'oratore. Quindi, ottengono una sorta di impronta vocale, che è simile a un'impronta digitale, e possono accertare se proviene da te o da qualcun altro. Ed è così che Siri può assicurarsi che l'utente o il proprietario del telefono stia parlando con lui,"Fawaz dice.
Ma Fawaz e due Ph.D. della UW-Madison. gli studenti fanno parte di uno sforzo multiuniversitario per migliorare la sicurezza digitale. E così, hanno cercato modi per ingannare i sistemi informatici. Loro e altri hanno già lavorato per clonare la voce umana e far parlare un computer come quella persona.
Più recentemente, Fawaz afferma che gli ingegneri si sono resi conto che potevano fare marcia indietro dal digitale e passare all'analogico per ingannare molti sistemi di identificazione degli altoparlanti.
"Ed è così che ci è venuta l'idea di progettare una sorta di dispositivo analogico che non abbia alcun tipo di elettronica digitale che ti permetta di impersonare gli altri,"Fawaz dice.
Dottorato di ricerca La studentessa Shimaa Ahmed dice di aver provato per la prima volta a parlare attraverso il tubo di cartone trovato in molti rotoli di carta assorbente, imitando le celebrità.
"E ha funzionato. Quando ho fatto passare alcune delle voci delle celebrità attraverso questo tubo di carta assorbente da cucina, ho cambiato la previsione di quelle celebrità,"Ahmed dice.
Alla fine, Fawaz ha comprato della plasticatubi di pvcdal reparto dei ricambi idraulici di un negozio di ferramenta e il team ha iniziato a utilizzarlo.
Kassam Fawaz, assistente professore presso il Dipartimento di ingegneria elettrica e informatica presso la Facoltà di Ingegneria dell'Università del Wisconsin-Madison, è raffigurato in un ritratto in studio il 15 febbraio 2022. Fawaz è uno dei dodici destinatari del Distinguished Teaching Award del 2022 Premio (DTA). (Foto di Althea Dotzour / UW–Madison)
Fawaz dice che si sono resi conto che i tubi avevano dei difetti.
"I normali tubi idraulici hanno dimensioni fisse, giusto? Puoi controllare la lunghezza tagliandola. Ma non puoi controllare il diametro. Per alcuni esperimenti avevamo bisogno di tubi con un diametro speciale, che non puoi trovare da Ace Hardware. Quindi quello che dovevamo fare per fabbricare questi tubi, e il modo più semplice per fabbricarli è stamparli in 3D,"Fawaz dice.
Il team si è rivolto all'allora studente universitario, ora dottorato di ricerca. studente, Yash Wani, che ha stampato in 3D alcuni tubi. Wani dice che il lavoro ha cambiato il suo focus accademico.
"È stato molto bello, onestamente, che sia così che sono finito a fare un dottorato. È stato abbastanza bello per me continuare a farlo,"lui dice.
I ricercatori hanno sviluppato un algoritmo, o istruzioni rigorose, che hanno individuato le dimensioni del tubo necessarie per trasformare la risonanza – ovvero l’intensità e la qualità del tono – di quasi ogni voce per imitarne un’altra.
In una registrazione, Ahmed leggeva da un set di dati vocali convenzionali e sembrava un po' come l'attrice Lisa Kudrow - sai, Phoebe di Amici.
"Non c'era niente sulla roccia,"è andata la lettura. Ahmed ha anche provato a imitare l'attrice Kelly Reilly, che è nella serie TV Yellowstone.""Non ne ho idea", rispose Phillip,"Ahmed ha detto nella registrazione.
Non erano imitazioni esatte. Ma sono stati abbastanza bravi da superare i filtri di attacco digitale di un sistema di autenticazione vocale e ingannarlo. Utilizzando anche le voci di altri studenti nel loro esperimento, gli ingegneri dell'UW-Madison riferiscono di aver ingannato i sistemi di sicurezza il 60% delle volte in un test con 91 voci.
Abbastanza buono da scrivere un articolo e da consentire ad Ahmed di presentare i risultati a un simposio sulla sicurezza questo mese in California.
"Le persone erano curiose di sapere come realizzare dispositivi simili a tubi, ma più complicati, in modo da poter impersonare qualsiasi persona,"Ahmed dice.
Fawaz afferma che tutti i produttori di sistemi di identificazione degli oratori – Apple, Google, IBM, Microsoft e altri – sono consapevoli delle varie carenze della loro tecnologia e stanno cercando di risolverle.
I finanziatori della ricerca UW includono la National Science Foundation e la DARPA, il grande braccio di ricerca del Dipartimento della Difesa.