Pular para o conteúdo principal
Intermediário

A Escada da Confiança

"Quanto eu devo deixar a IA simplesmente fazer?" é a pergunta por trás de quase toda decisão sobre agentes — permissões do Claude Code, configurações de aprovação automática, deixar ou não um script rodar sem supervisão. As pessoas tendem a respondê-la como um único botão de liga/desliga: ou você fica vigiando tudo, ou você a solta por aí.

Aqui está uma lente que o AILmanac usa no lugar disso:

Autonomia não é um botão, é uma escada. Você a sobe um degrau de cada vez, e o degrau em que você fica deve ser definido por quão ruim seria um erro — não por quanto você confia no modelo.

A percepção-chave é que a quantidade certa de autonomia tem quase nada a ver com quão "inteligente" a IA é. Tem a ver com o raio de explosão (quanto dano uma ação errada causa) e a reversibilidade (com que facilidade você consegue desfazê-la). Um modelo brilhante fazendo algo irreversível sem supervisão é um arranjo pior do que um modelo medíocre fazendo algo reversível.

Os cinco degraus

Um modelo que achamos útil é pensar em cinco degraus distintos, do menor para o maior nível de autonomia:

DegrauO que a IA fazQuando é apropriadoO que o torna seguro
1. Apenas sugerirDiz o que faria; não toma nenhuma açãoTrabalho de alto risco ou irreversível; um domínio em que você ainda não confia nela; você ainda está aprendendo no que ela é boaVocê é o executor. Nada acontece sem você fazer à mão.
2. Rascunhar para revisãoProduz o artefato de verdade (código, e-mail, query), mas para antes de aplicá-loA saída é concreta e você consegue avaliá-la com os olhos mais rápido do que conseguiria escrevê-laUm humano de verdade leu antes de qualquer coisa entrar em vigor. Um diff que você realmente examina, não que passa o olho.
3. Agir sobre coisas reversíveisExecuta diretamente, mas apenas em ações de baixo risco e facilmente desfeitasA ação tem um desfazer limpo: edições sob controle de versão, gravações em um branch de rascunho, qualquer coisa que um único comando revertaA reversibilidade é a barreira de proteção. O custo de um erro é "desfazê-lo", não "explicá-lo ao jurídico".
4. Agir e depois relatarFaz o trabalho de forma autônoma e depois lhe mostra exatamente o que fezTarefas repetitivas e bem delimitadas em que revisar depois é mais barato do que controlar antesUma trilha de auditoria completa e honesta — um log, um diff, um resumo — que você realmente lê depois.
5. Agir de forma autônoma dentro de barreiras de proteçãoRoda sem supervisão dentro de limites rígidosLaços estreitos e bem compreendidos que você já viu ter sucesso muitas vezesAs barreiras de proteção fazem a supervisão. Fronteiras rígidas que a IA não pode atravessar, mais um botão de desligamento de emergência.

Como usar a escada

Três regras tornam isso prático:

Comece um degrau abaixo do que parece necessário. É barato subir um degrau depois de ter visto algo funcionar; é caro limpar a sujeira depois de conceder demais cedo demais. Na primeira vez que você apontar um agente para um novo tipo de tarefa, desça para Sugerir ou Rascunhar, mesmo que suspeite que ele consegue dar conta de mais.

Defina o degrau pelo pior caso, não pelo caso médio. Se uma tarefa é reversível 95% das vezes, mas os outros 5% tocam dados de produção, você define o degrau pelos 5%. O raio de explosão da pior ação plausível é o seu teto.

Suba por tarefa, não por ferramenta. A mesma IA pode estar no degrau 4 para "formatar meu código" e no degrau 1 para "excluir registros do banco de dados", na mesma sessão. A escada é sobre a ação, não sobre uma configuração de confiança global que você liga uma vez.

Mapeando para o Claude Code

O Claude Code é um lugar limpo para ver a escada em ação, porque seu sistema de permissões é essencialmente um conjunto de botões para escolher o seu degrau:

  • Degraus 1–2 são a postura cautelosa padrão: o Claude propõe edições e comandos, e você aprova cada um. Você está revisando cada diff antes de ele entrar em vigor.
  • O degrau 3 é permitir chamadas de ferramentas reversíveis específicas — edições de arquivo dentro de um repositório git em que você pode fazer git restore, execuções em um branch descartável — enquanto ainda controla qualquer coisa destrutiva.
  • O degrau 4 é colocar em lista de permissões categorias de ações seguras para que o Claude prossiga sem perguntar nelas, e depois ler a transcrição e os diffs.
  • O degrau 5 é autonomia mais plena para um laço estreito e comprovado — e ele é seguro quando há barreiras de proteção de verdade no lugar: permissões delimitadas, um diretório de trabalho restrito e a capacidade de pará-lo.

O mecanismo que permite você subir com segurança é o seu CLAUDE.md. Esse arquivo é onde você escreve as barreiras de proteção: o que sempre é permitido, o que nunca deve acontecer, quais caminhos estão fora dos limites, quando parar e perguntar. Barreiras de proteção que você só guarda na cabeça não restringem um agente — barreiras escritas no CLAUDE.md, sim. Se você não tem certeza de como formulá-las, o Gerador de CLAUDE.md lhe dá um ponto de partida estruturado.

O resumo honesto: não conceda autonomia porque a IA parece capaz. Conceda-a porque a ação é reversível, o raio de explosão é pequeno e as barreiras de proteção estão escritas. Depois suba um degrau de cada vez, conforme as evidências chegam.

Relacionados