Raciocínio Estendido e Esforço
Para problemas difíceis, o Claude pode gastar computação extra pensando antes de responder — melhorando a precisão em raciocínio de múltiplas etapas, código complicado e matemática. Você controla aproximadamente quanto esforço gastar.
A ideia
- Menos raciocínio = mais rápido e barato — adequado para tarefas simples e bem especificadas.
- Mais raciocínio = melhor em problemas genuinamente difíceis, ao custo de maior latência/custo.
Modelos mais novos expõem isso como um controle de esforço (e adaptam a profundidade do raciocínio automaticamente); neles, você escolhe um nível em vez de um orçamento bruto de tokens. Combine o nível com a tarefa.
Escolhendo a profundidade
| Tarefa | Esforço sugerido |
|---|---|
| Formatação, extração, Q&A simples | Baixo |
| Codificação do dia a dia, redação, análise | Médio |
| Depuração difícil, algoritmos complicados, provas cuidadosas | Alto |
Não use o máximo como padrão para tudo — você paga em latência e custo por um raciocínio que a tarefa não precisa. Comece no médio; aumente apenas onde a qualidade exigir.
Notas práticas
- O raciocínio estendido combina bem com o prompting de cadeia de pensamento — mas em modelos de raciocínio você muitas vezes não precisa pedir passo a passo; o raciocínio acontece internamente.
- O raciocínio consome tokens, o que afeta o custo — orce de acordo.
- Para agentes, mais esforço na etapa de planejamento e menos em chamadas de ferramentas rotineiras é uma boa divisão.