Descobrindo a Mensagem: Uma Investigação Profunda
Recentemente, pesquisadores da Universidade Ben Gurion do Negev, em Israel, divulgaram um estudo revelador intitulado “Descobrindo a Mensagem: Uma Investigação Sobre Ataques Remotos de Keylogging em Assistentes de IA“. Este estudo aborda um método sofisticado de ataque que visa interceptar e roubar textos trocados com assistentes de IA, como o GPT-4.
O processo de ataque descrito neste estudo é complexo e envolve várias etapas. Inicialmente, os pesquisadores interceptam comunicações de pacotes criptografados entre o usuário e o assistente de IA. Em seguida, eles localizam a mensagem de resposta gerada pelo assistente de IA a partir do tráfego interceptado.
Uma vez identificada a mensagem de resposta, os pesquisadores estimam o comprimento dos tokens contidos na resposta analisando as mudanças no tamanho de cada mensagem. Em seguida, eles segmentam a sequência de comprimento do token em pedaços significativos, como sentenças, e a passam por um modelo composto por dois LLMs (Modelos de Linguagem em Larga Escala) dedicados para inferir o texto da resposta.
Resultados Perturbadores
Os resultados dos experimentos realizados pelos pesquisadores são preocupantes. Eles testaram o método de ataque em serviços fornecidos por grandes empresas, como OpenAI, Microsoft e Google, e alcançaram uma taxa de sucesso de ataque de 54,5% para o primeiro segmento da resposta e uma média de 37,96% de sucesso de ataque entre todas as respostas testadas.
Além disso, os pesquisadores realizaram experimentos no ChatGPT (GPT-4) da OpenAI e no Copilot da Microsoft, dois dos assistentes de IA mais populares atualmente. Eles descobriram que o método de ataque também funcionou nessas plataformas, com taxas de sucesso variando de 30% a 53% para aplicativos de navegador e mercados, e 17,7% para APIs.
Esses resultados destacam a importância de garantir a segurança e a privacidade dos dados transmitidos para assistentes de IA e ressaltam a necessidade de desenvolver medidas de proteção mais robustas contra ataques desse tipo.