O primeiro caso de ataque hacker feito com agentes de IA

26/3/2026

Em Setembro de 2025, a Anthropic revelou que um grupo de hackers usou a IA Claude para atacar cerca de 30 empresas e agências governamentais ao redor do mundo, e isso pode ser considerado o primeiro ataque cibernético da história conduzido, em grande parte, sem intervenção humana direta.

‍

Neste post, você vai entender o que aconteceu, como o ataque foi estruturado fase a fase, e o que isso significa para quem trabalha com marketing.

‍

1 - Como o ataque aconteceu

‍

Em meados de setembro de 2025, a Anthropic detectou uma operação de espionagem cibernética conduzida por um grupo patrocinado pelo estado chinês. A campanha tentou infiltrar cerca de 30 entidades e conseguiu sucesso em algumas delas.

‍

A ferramenta explorada foi o Claude Code, uma versão do Claude voltada para tarefas técnicas de programação e automação.

‍

Para driblar os sistemas de segurança, os atacantes se passaram por funcionários de uma empresa legítima de cibersegurança, convencendo o modelo de que estava sendo usado em testes defensivos

‍

Eles quebraram os ataques em tarefas pequenas e aparentemente inofensivas, que o Claude executava sem receber o contexto completo do objetivo.

‍

As fases do ataque:

‍

Fase 1 — Seleção de alvos. Os operadores humanos escolheram os alvos e montaram um sistema de automação em torno do Claude Code para conduzir as ações com o mínimo de supervisão possível.

‍

Fase 2 — Reconhecimento. O Claude mapeou a infraestrutura dos sistemas-alvo de forma autônoma, identificando os pontos de entrada e os bancos de dados mais valiosos, em muito menos tempo do que levaria qualquer equipe humana.

‍

Fase 3 — Identificação de vulnerabilidades. Com o mapeamento feito, o Claude criou e testou seus próprios códigos de ataque para explorar as brechas encontradas.

‍

Fase 4 — Coleta de credenciais. O Claude extraiu usuários e senhas dos sistemas, o que permitiu aprofundar ainda mais a infiltração.

‍

Fase 5 — Extração de dados. O Claude consultou bancos de dados de forma independente, extraiu informações e classificou os dados de acordo com o valor de inteligência de cada um

‍

Fase 6 — Exfiltração. As contas com maiores privilégios foram identificadas, backdoors foram criadas e os dados foram removidos dos sistemas.

‍

‍

A resposta da Anthropic ao ataque

‍

Quando o sistema da Anthropic detectou os comportamentos fora do padrão, a investigação começou imediatamente. Nos dez dias seguintes, as contas envolvidas foram desativadas conforme iam sendo identificadas, as empresas afetadas foram avisadas e as autoridades foram acionadas.

‍

O que tornou esse ataque diferente de qualquer coisa vista antes foi a velocidade, aIA executou entre 80% e 90% das ações técnicas de forma independente, chegando a processar milhares de requisições por segundo, um ritmo que nenhuma equipe humana conseguiria manter.

‍

A estimativa é que a intervenção humana em todo o processo tenha durado, no máximo, 20 minutos, o Claude operou por horas. Dito isso, o ataque teve falhas.

‍

Em alguns momentos, o Claude alucinou credenciais de login e chegou a afirmar que havia roubado um documento secreto que, na prática, já era público.

‍

Isso ainda é um obstáculo real para ataques totalmente autônomos, por enquanto.

‍

Em resposta, a Anthropic reforçou seus sistemas de monitoramento para identificar esse tipo de comportamento mais rápido, melhorou os filtros voltados para atividades maliciosas e está desenvolvendo formas de detectar ataques autônomos antes que causem dano.

‍

O impacto na segurança digital

‍

Esse episódio levanta uma pergunta: se agentes de IA conseguem conduzir ciberataques em escala com supervisão humana mínima, por que continuar desenvolvendo e expandindo essas ferramentas?

‍

A resposta da Anthropic é que a mesma capacidade que tornou o Claude útil no ataque também o torna essencial na defesa.

‍

A própria equipe da empresa usou o Claude para analisar o volume gigantesco de dados gerados durante a investigação, a ferramenta que foi armada também ajudou a desarmá-la.

‍

A barreira para ataques cibernéticos caiu, e a tendência é que continue caindo, o ambiente digital onde campanhas, dados de clientes e ativos de marca vivem se tornou mais exposto.

‍

Para profissionais de marketing, isso tem um significado bem concreto, as ferramentas que você usa no dia a dia para criar, automatizar e escalar também são as mesmas que estão sendo usadas de forma maliciosa.

‍

Saber como elas funcionam de verdade (onde têm poder, onde têm limite) é parte do trabalho, quem fizer isso vai conseguir tomar decisões mais assertivas.

‍

Na Traktor, a gente acompanha cada movimento da IA. Se você quer resultados construídos com estratégia de verdade, fale com a gente!