Os fabricantes de navegadores de IA fazem promessas grandiosas. Com um único prompt, os usuários podem pedir para encontrar um restaurante em uma determinada parte da cidade, reservar uma mesa, convidar um colega para almoçar e enviar uma confirmação por e-mail. Esses fabricantes são muito mais reticentes quanto aos riscos de confundir a linha antes tênue entre navegar em sites e fazer uma pergunta a um modelo de linguagem grande ou instruí-lo a tomar ações potencialmente sensíveis.
A resposta dos desenvolvedores de LLM até agora tem sido construir barreiras de proteção que tornem algumas solicitações fora dos limites. Desenvolver explorações de software, roubar credenciais ou ensinar como construir uma bomba caseira são exemplos. O problema com esta abordagem é que as barreiras de proteção são reativas e tratam os sintomas em vez de resolver a causa raiz. É o mesmo que o fabricante de um veículo inseguro defender novos projetos de estradas em vez de corrigir as falhas que o tornam propenso a acidentes.
Embalando LLMs em uma realidade alternativa
Novas pesquisas colocam essa situação em evidência. Ele demonstra como um site pode levar os navegadores de IA a uma falsa realidade, onde as regras que regem seu comportamento não se aplicam mais. Depois disso, um invasor tem liberdade para invocar todos os tipos de ações destrutivas, como extrair código de um repositório privado ou extrair credenciais do gerenciador de senhas integrado.
Leia o artigo completo
Comentários
Leave a comment