Escolhendo um Modelo Claude

Iniciante

A Anthropic oferece uma família de modelos em diferentes pontos de capacidade/custo/velocidade. Escolher bem é, em grande parte, uma questão de combinar o modelo à tarefa — e não pagar a mais por uma capacidade de que você não precisa.

Os modelos atuais

Last verified: 2026-06-20 · Official models & pricing

Model	API model ID	Tier	Best for
Claude Opus 4.8	`claude-opus-4-8`	Opus — most capable	The hardest reasoning, long-horizon agents, and complex coding where quality matters more than cost.
Claude Sonnet 4.6	`claude-sonnet-4-6`	Sonnet — balanced	The default workhorse: strong coding and reasoning at a fraction of Opus cost. Start here for most production work.
Claude Haiku 4.5	`claude-haiku-4-5-20251001`	Haiku — fastest & cheapest	High-volume, latency-sensitive tasks: classification, extraction, routing, simple chat, and cheap sub-agents.
Fable 5	`claude-fable-5`	Latest generation	One of the newest Claude models. Capabilities and positioning evolve quickly — check the official page above before choosing it.

Model IDs are exact; tiers and 'best for' are guidance. Pricing, context-window sizes and rate limits change frequently and are intentionally NOT listed here — always read them on the official page above. This file is the single source of truth: never hard-code model facts in prose, link to this table instead.

Experimente: qual modelo se encaixa?

Responda a três perguntas e obtenha uma recomendação inicial:

Dificuldade da tarefa

O que mais importa

Volume de requisições

Claude Sonnet

O padrão equilibrado — raciocínio e programação fortes por uma fração do custo do Opus. Comece por aqui e só suba de nível se atingir um teto real de qualidade.

Consulte o ID exato do modelo na tabela de modelos. Apenas uma regra geral — faça uma avaliação rápida com seus próprios dados para ter certeza.

O modelo mental: uma escada de capacidade

Comece com o Sonnet. Ele é o cavalo de batalha padrão — forte em raciocínio e codificação a um custo sensato. A maioria das tarefas deve começar aqui.
Suba para o Opus apenas quando o Sonnet tiver dificuldades e a qualidade importar mais que o custo (raciocínio difícil, agentes complicados, código intrincado).
Desça para o Haiku em trabalhos de alto volume, sensíveis à latência ou simples (classificação, extração, roteamento, subagentes baratos).

Como escolher de verdade

Use o Sonnet como padrão e coloque em produção.
Atingindo um teto de qualidade? Experimente o Opus apenas no subconjunto difícil.
Custo ou latência incomodando? Veja se o Haiku é bom o suficiente para aquela etapa.
Misture modelos. Use o Haiku para pré/pós-processamento barato e o Sonnet/Opus para o núcleo difícil. Esse "escalonamento de modelos" é uma das maiores alavancas de custo — veja Custo e Latência.

:::tip Não escolha apenas por benchmarks Benchmarks públicos são um indício inicial, não um veredito para a sua tarefa. Rode uma pequena eval em um punhado das suas entradas reais entre dois modelos — leva minutos e supera adivinhar. :::

Consultando o ID exato do modelo

Sempre passe o ID atual do modelo na API (por exemplo, na sua chamada messages.create). Obtenha-o na tabela de modelos acima ou na página oficial de modelos — e prefira lê-lo a partir da configuração em vez de codificá-lo em vários lugares, para que atualizações de modelo sejam uma mudança de uma única linha.

Os modelos atuais​

Experimente: qual modelo se encaixa?​

O modelo mental: uma escada de capacidade​

Como escolher de verdade​

Consultando o ID exato do modelo​

Próximo​

Os modelos atuais

Experimente: qual modelo se encaixa?

O modelo mental: uma escada de capacidade

Como escolher de verdade

Consultando o ID exato do modelo

Próximo