Escolhendo um Modelo Claude
A Anthropic oferece uma família de modelos em diferentes pontos de capacidade/custo/velocidade. Escolher bem é, em grande parte, uma questão de combinar o modelo à tarefa — e não pagar a mais por uma capacidade de que você não precisa.
Os modelos atuais
Last verified: 2026-06-20 · Official models & pricing
| Model | API model ID | Tier | Best for |
|---|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Opus — most capable | The hardest reasoning, long-horizon agents, and complex coding where quality matters more than cost. |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | Sonnet — balanced | The default workhorse: strong coding and reasoning at a fraction of Opus cost. Start here for most production work. |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | Haiku — fastest & cheapest | High-volume, latency-sensitive tasks: classification, extraction, routing, simple chat, and cheap sub-agents. |
| Fable 5 | claude-fable-5 | Latest generation | One of the newest Claude models. Capabilities and positioning evolve quickly — check the official page above before choosing it. |
Model IDs are exact; tiers and 'best for' are guidance. Pricing, context-window sizes and rate limits change frequently and are intentionally NOT listed here — always read them on the official page above. This file is the single source of truth: never hard-code model facts in prose, link to this table instead.
Experimente: qual modelo se encaixa?
Responda a três perguntas e obtenha uma recomendação inicial:
O padrão equilibrado — raciocínio e programação fortes por uma fração do custo do Opus. Comece por aqui e só suba de nível se atingir um teto real de qualidade.
Consulte o ID exato do modelo na tabela de modelos. Apenas uma regra geral — faça uma avaliação rápida com seus próprios dados para ter certeza.
O modelo mental: uma escada de capacidade
- Comece com o Sonnet. Ele é o cavalo de batalha padrão — forte em raciocínio e codificação a um custo sensato. A maioria das tarefas deve começar aqui.
- Suba para o Opus apenas quando o Sonnet tiver dificuldades e a qualidade importar mais que o custo (raciocínio difícil, agentes complicados, código intrincado).
- Desça para o Haiku em trabalhos de alto volume, sensíveis à latência ou simples (classificação, extração, roteamento, subagentes baratos).
Como escolher de verdade
- Use o Sonnet como padrão e coloque em produção.
- Atingindo um teto de qualidade? Experimente o Opus apenas no subconjunto difícil.
- Custo ou latência incomodando? Veja se o Haiku é bom o suficiente para aquela etapa.
- Misture modelos. Use o Haiku para pré/pós-processamento barato e o Sonnet/Opus para o núcleo difícil. Esse "escalonamento de modelos" é uma das maiores alavancas de custo — veja Custo e Latência.
:::tip Não escolha apenas por benchmarks Benchmarks públicos são um indício inicial, não um veredito para a sua tarefa. Rode uma pequena eval em um punhado das suas entradas reais entre dois modelos — leva minutos e supera adivinhar. :::
Consultando o ID exato do modelo
Sempre passe o ID atual do modelo na API (por exemplo, na sua chamada messages.create). Obtenha-o na tabela de modelos acima ou na página oficial de modelos — e prefira lê-lo a partir da configuração em vez de codificá-lo em vários lugares, para que atualizações de modelo sejam uma mudança de uma única linha.