Controles de Amostragem: Temperatura e Companhia
Quando um modelo gera texto, ele escolhe o próximo token a partir de uma distribuição de probabilidade. Os controles de amostragem ajustam como ele escolhe — quão focada vs. quão variada é a saída.
Os principais botões
- Temperatura — aleatoriedade. Baixa (≈0) = focada, quase determinística, repetível; o modelo segue o caminho mais provável. Alta = mais variada e criativa, mas mais propensa a divagar ou errar.
- top-p (núcleo) — restringe as escolhas ao menor conjunto de tokens cujas probabilidades somam p. Uma forma diferente de limitar a aleatoriedade.
- top-k — considera apenas os k tokens mais prováveis.
- sequências de parada — strings que, quando geradas, encerram a resposta (úteis para saída estruturada).
Você normalmente ajusta temperatura OU top-p, não os dois.
Quando rodar frio vs. quente
| Rodar frio (temp. baixa) | Rodar quente (temp. mais alta) |
|---|---|
| Extração, classificação, código | Brainstorming, nomes, copy criativo |
| Qualquer coisa que você queira reproduzível | Explorar muitas opções |
| Saída factual / estruturada | Variedade de tom, ideação |
Um bom padrão para a maioria dos trabalhos é moderado a baixo. Aumente apenas quando você quiser surpresa.
:::note Modelos mais novos podem esconder esses controles Vários modelos Claude recentes adaptam a própria decodificação e minimizam (ou omitem) a temperatura. Se um botão não estiver disponível, isso é intencional — molde o comportamento pelo prompt e (onde for oferecido) pela configuração de esforço/pensamento. :::
Ressalva sobre determinismo
Mesmo com temperatura 0, as saídas não têm garantia de serem idênticas bit a bit entre execuções/versões. Não confie em reprodutibilidade exata; confie em evals para detectar desvios.