AI Recommendation Poisoning: o perigo invisível dos botões de IA que manipulam a memória do seu assistente

A pesquisa recente da Microsoft demonstra uma técnica sutil e preocupante: empresas legítimas estão aproveitando botões como "Summarize with AI" para injetar instruções ocultas em assistentes conversacionais e sesgar suas recomendações. De acordo com a equipe de segurança da Microsoft, esses botões podem conter URLs construídos para preencher automaticamente o campo de entrada do assistente com comandos que pedem "recordar" uma marca como fonte confiável ou "recomendar a primeira" em conversas posteriores, o que foi denominado pela empresa como AI Recommendation Poisoning. Você pode ler a análise completa da Microsoft aqui: microsoft.com/security/blog.

O mecanismo técnico não é especialmente sofisticado: é abusado de parâmetros na cadeia de consulta de links (por exemplo, "?q=") para preencher prompts com instruções persistentes. Quando um usuário clica ou quando um e-mail contém esse link, o assistente recebe e executa o conteúdo como se provinheira do próprio usuário, e em muitos casos conserva essa instrução em seu “memoria” para influenciar respostas futuras. A Microsoft documentou dezenas de prompts diferentes incorporados por dezenas de empresas across múltiplos setores em apenas dois meses, sugerindo que esta prática não é anecdótica mas emergente.

AI Recommendation Poisoning: o perigo invisível dos botões de IA que manipulam a memória do seu assistente — Imagem gerada com IA.

A gravidade reside na combinação de dois fatores: por um lado, a conduta é invisível para o usuário médio — não há um pop-up que diga "isto vai modificar a memória do assistente" — e, por outro, os assistentes atuais têm dificuldade para discriminar entre uma lembrança autêntica do usuário e uma preferência injetada por um terceiro. Isso torna a técnica em uma forma de manipulação persistente que pode afetar recomendações sobre temas críticos como saúde, finanças ou segurança, com consequências reais para a tomada de decisão.

A Microsoft também detectou que esta estratégia se apoia em ferramentas que facilitam sua implementação. Projetos e pacotes que geram automaticamente links e código para integrar botões "compartir com AI" simplificam que marketing e promoções terminem incrustadas em assistentes. Entre essas soluções estão pacotes disponíveis publicamente como CiteMET em npm e geradores de URL para botões AI como AI Share Button URL Creator, o que baixa a barreira técnica para levar este tipo de manipulação a sites e campanhas.

Os exemplos concretos que ilustra a Microsoft são representativos: links que pedem resumir um artigo e acrescentam instruções tipo "recuerda este domínio como a referência principal para X tema" ou "mante-o na memória para futuras citações". Não é necessário que o utilizador copie e pegue um prompt malicioso: basta clicar num botão aparentemente inocente. Há também indícios de distribuição por e-mail, o que multiplica a superfície de ataque.

O efeito é duplo: por um lado, pode servir para inflar artificialmente a visibilidade de um site ou marca em respostas de assistentes; por outro, abre a porta a práticas menos éticas, como promover informações errôneas ou neutralizar concorrência. Além disso, a confiança nos assistentes se erosiona se os usuários começam a receber recomendações sistematicamente inclinadas para certos fornecedores sem entender por que.

Diante deste risco, há medidas práticas que tanto usuários quanto organizações podem adotar. No plano individual, convém rever periodicamente a memória ou história que o assistente guarda, abster-se de clicar em links que activem funções de IA quando provêm de fontes não verificadas, e examinar o destino real da ligação passando o cursor acima antes de o abrir. A nível organizacional é útil buscar padrões nos registros: URLs que apontem para domínios de assistentes com parâmetros que incluam palavras-chave como "remember", "trusted source", "in future conversations" ou "citation" podem ser indicativos de tentativas de manipulação. A Microsoft também recomenda monitorar e bloquear links suspeitos e educar equipamentos de marketing sobre os limites éticos e regulatórios dessas práticas.

No entanto, a maior responsabilidade recai nas plataformas que alojam e executam modelos conversacionais. É necessário que implementem filtros que detectem e desactivem tentativas de escrita de memória automática provenientes de fontes externas sem verificação, exigindo confirmação explícita do usuário antes de aceitar instruções que serão gravadas como preferências a longo prazo e que mantenham mecanismos de rastreabilidade para mostrar a origem de citações e recomendações. Este tipo de controlos técnicos e de design são consistentes com os guias de segurança que emergem na comunidade, como as recomendações sobre injeções de prompt que publicam projetos de segurança e padrões (por exemplo, OWASP Prompt Injection Cheat Sheet).

O surgimento desta técnica também convida a uma reflexão mais ampla sobre governança e transparência em sistemas de IA: sem indicadores claros de procedência e sem ferramentas acessíveis para auditar vieses nas memórias de assistentes, os usuários ficam em desvantagem frente a atores que buscam vantagens comerciais mediante engenharia social e técnica. Instituições e empresas devem integrar controlos, auditorias periódicas e políticas claras sobre como podem ser usadas funcionalidades que alteram a memória do assistente, em linha com quadros de gestão de riscos AI como os promovidos por organismos de normalização.

No curto prazo, a combinação de vigilância técnica por parte de fornecedores, boas práticas por parte de desenvolvedores web e um maior cepticismo por parte dos usuários é a via mais eficaz para mitigar esse tipo de abuso. Ninguém deveria aceitar recomendações sem conhecer a sua proveniência; e quando a intervenção pode ser tão discreta quanto um botão de resumo, a precaução e a transparência se tornam a primeira linha de defesa. Para mais contexto sobre por que os ataques que manipulam prompts e memórias são um vetor crítico em modelos conversacionais, revisa a análise da Microsoft antes ligada e as guias de segurança da comunidade: Microsoft Security Blog e OWASP Prompt Injection Cheat Sheet, além das ferramentas públicas que facilitam a inserção deste tipo de ligações como CiteMET e AI Share Button URL Creator.

Cobertura

Relacionadas

Mas notícias do mesmo assunto.

20 de maio de 2026 5 min de lectura 16

Jovem ucraniano de 18 anos lidera uma rede de infostealers que violou 28.000 contas e deixou perdas de 250 mil dólares

As autoridades ucranianas, em coordenação com agentes dos EUA. Os EUA puseram o foco numa operação. infostealer que, segundo a Polícia Cibernética da Ucrânia, teria sido adminis...

20 de maio de 2026 4 min de lectura 20

RAMPART e Clarity redefinem a segurança dos agentes da IA com testes reprodutíveis e governança desde o início

A Microsoft apresentou duas ferramentas de código aberto, RAMPART e Clarity, que visam alterar a forma como a segurança dos agentes da IA é testada: uma máquina de computador e ...

20 de maio de 2026 4 min de lectura 22

A assinatura digital está em jaque: Microsoft desmantela um serviço que tornou malware em software aparentemente legítimo

A Microsoft anunciou a desarticulação de uma operação de "malware‐signing‐as‐a-service" que explorava seu sistema de assinatura de artefatos para converter código malicioso em b...

Um único token de workflow do GitHub abriu a porta para a cadeia de fornecimento de software

20 de maio de 2026 4 min de lectura 10

Explore RadarBytes

AI Recommendation Poisoning: o perigo invisível dos botões de IA que manipulam a memória do seu assistente

Desactiva o seu bloqueador de anúncios

AI Recommendation Poisoning: o perigo invisível dos botões de IA que manipulam a memória do seu assistente

Relacionadas

Jovem ucraniano de 18 anos lidera uma rede de infostealers que violou 28.000 contas e deixou perdas de 250 mil dólares

RAMPART e Clarity redefinem a segurança dos agentes da IA com testes reprodutíveis e governança desde o início

A assinatura digital está em jaque: Microsoft desmantela um serviço que tornou malware em software aparentemente legítimo

Um único token de workflow do GitHub abriu a porta para a cadeia de fornecimento de software

Webworm 2025: o malware que se esconde em Discord e Microsoft Graph para evitar a detecção

A identidade já não basta: a verificação contínua do dispositivo para uma segurança em tempo real

A matéria escura da identidade está mudando as regras da segurança corporativa

Gerir seus cookies