O primeiro caso de ataque hacker feito com agentes de IA

Em Setembro de 2025, a Anthropic revelou que um grupo de hackers usou a IA Claude para atacar cerca de 30 empresas e agências governamentais ao redor do mundo, e isso pode ser considerado o primeiro ataque cibernético da história conduzido, em grande parte, sem intervenção humana direta.

Neste post, você vai entender o que aconteceu, como o ataque foi estruturado fase a fase, e o que isso significa para quem trabalha com marketing.

1 - Como o ataque aconteceu

Em meados de setembro de 2025, a Anthropic detectou uma operação de espionagem cibernética conduzida por um grupo patrocinado pelo estado chinês. A campanha tentou infiltrar cerca de 30 entidades e conseguiu sucesso em algumas delas.

A ferramenta explorada foi o Claude Code, uma versão do Claude voltada para tarefas técnicas de programação e automação. 

Para driblar os sistemas de segurança, os atacantes se passaram por funcionários de uma empresa legítima de cibersegurança, convencendo o modelo de que estava sendo usado em testes defensivos

Eles quebraram os ataques em tarefas pequenas e aparentemente inofensivas, que o Claude executava sem receber o contexto completo do objetivo. 

As fases do ataque: 

Fase 1 — Seleção de alvos. Os operadores humanos escolheram os alvos e montaram um sistema de automação em torno do Claude Code para conduzir as ações com o mínimo de supervisão possível.

Fase 2 — Reconhecimento. O Claude mapeou a infraestrutura dos sistemas-alvo de forma autônoma, identificando os pontos de entrada e os bancos de dados mais valiosos, em muito menos tempo do que levaria qualquer equipe humana.

Fase 3 — Identificação de vulnerabilidades. Com o mapeamento feito, o Claude criou e testou seus próprios códigos de ataque para explorar as brechas encontradas.

Fase 4 — Coleta de credenciais. O Claude extraiu usuários e senhas dos sistemas, o que permitiu aprofundar ainda mais a infiltração.

Fase 5 — Extração de dados. O Claude consultou bancos de dados de forma independente, extraiu informações e classificou os dados de acordo com o valor de inteligência de cada um 

Fase 6 — Exfiltração. As contas com maiores privilégios foram identificadas, backdoors foram criadas e os dados foram removidos dos sistemas.

A resposta da Anthropic ao ataque

Quando o sistema da Anthropic detectou os comportamentos fora do padrão, a investigação começou imediatamente. Nos dez dias seguintes, as contas envolvidas foram desativadas conforme iam sendo identificadas, as empresas afetadas foram avisadas e as autoridades foram acionadas.

O que tornou esse ataque diferente de qualquer coisa vista antes foi a velocidade, aIA executou entre 80% e 90% das ações técnicas de forma independente, chegando a processar milhares de requisições por segundo, um ritmo que nenhuma equipe humana conseguiria manter.

A estimativa é que a intervenção humana em todo o processo tenha durado, no máximo, 20 minutos, o Claude operou por horas. Dito isso, o ataque teve falhas.

Em alguns momentos, o Claude alucinou credenciais de login e chegou a afirmar que havia roubado um documento secreto que, na prática, já era público. 

Isso ainda é um obstáculo real para ataques totalmente autônomos, por enquanto. 

Em resposta, a Anthropic reforçou seus sistemas de monitoramento para identificar esse tipo de comportamento mais rápido, melhorou os filtros voltados para atividades maliciosas e está desenvolvendo formas de detectar ataques autônomos antes que causem dano.

O impacto na segurança digital

Esse episódio levanta uma pergunta: se agentes de IA conseguem conduzir ciberataques em escala com supervisão humana mínima, por que continuar desenvolvendo e expandindo essas ferramentas?

A resposta da Anthropic é que a mesma capacidade que tornou o Claude útil no ataque também o torna essencial na defesa.

A própria equipe da empresa usou o Claude para analisar o volume gigantesco de dados gerados durante a investigação, a ferramenta que foi armada também ajudou a desarmá-la.

A barreira para ataques cibernéticos caiu, e a tendência é que continue caindo, o ambiente digital onde campanhas, dados de clientes e ativos de marca vivem se tornou mais exposto.

Para profissionais de marketing, isso tem um significado bem concreto, as ferramentas que você usa no dia a dia para criar, automatizar e escalar também são as mesmas que estão sendo usadas de forma maliciosa. 

Saber como elas funcionam de verdade (onde têm poder, onde têm limite) é parte do trabalho, quem fizer isso vai conseguir tomar decisões mais assertivas.

Na Traktor, a gente acompanha cada movimento da IA. Se você quer resultados construídos com estratégia de verdade, fale com a gente!

Mais sobre a Traktor

A única Partner Premier 100% especializada em processos lead to sales.

Agende uma reunião estratégica