Controles de Amostragem: Temperatura e Companhia

Intermediário

Quando um modelo gera texto, ele escolhe o próximo token a partir de uma distribuição de probabilidade. Os controles de amostragem ajustam como ele escolhe — quão focada vs. quão variada é a saída.

Os principais botões

Temperatura — aleatoriedade. Baixa (≈0) = focada, quase determinística, repetível; o modelo segue o caminho mais provável. Alta = mais variada e criativa, mas mais propensa a divagar ou errar.
top-p (núcleo) — restringe as escolhas ao menor conjunto de tokens cujas probabilidades somam p. Uma forma diferente de limitar a aleatoriedade.
top-k — considera apenas os k tokens mais prováveis.
sequências de parada — strings que, quando geradas, encerram a resposta (úteis para saída estruturada).

Você normalmente ajusta temperatura OU top-p, não os dois.

Quando rodar frio vs. quente

Rodar frio (temp. baixa)	Rodar quente (temp. mais alta)
Extração, classificação, código	Brainstorming, nomes, copy criativo
Qualquer coisa que você queira reproduzível	Explorar muitas opções
Saída factual / estruturada	Variedade de tom, ideação

Um bom padrão para a maioria dos trabalhos é moderado a baixo. Aumente apenas quando você quiser surpresa.

:::note Modelos mais novos podem esconder esses controles Vários modelos Claude recentes adaptam a própria decodificação e minimizam (ou omitem) a temperatura. Se um botão não estiver disponível, isso é intencional — molde o comportamento pelo prompt e (onde for oferecido) pela configuração de esforço/pensamento. :::

Ressalva sobre determinismo

Mesmo com temperatura 0, as saídas não têm garantia de serem idênticas bit a bit entre execuções/versões. Não confie em reprodutibilidade exata; confie em evals para detectar desvios.

Os principais botões​

Quando rodar frio vs. quente​

Ressalva sobre determinismo​

Próximo​

Os principais botões

Quando rodar frio vs. quente

Ressalva sobre determinismo

Próximo