Pular para o conteúdo principal

Controles de Amostragem: Temperatura e Companhia

Intermediário

Quando um modelo gera texto, ele escolhe o próximo token a partir de uma distribuição de probabilidade. Os controles de amostragem ajustam como ele escolhe — quão focada vs. quão variada é a saída.

Os principais botões

  • Temperatura — aleatoriedade. Baixa (≈0) = focada, quase determinística, repetível; o modelo segue o caminho mais provável. Alta = mais variada e criativa, mas mais propensa a divagar ou errar.
  • top-p (núcleo) — restringe as escolhas ao menor conjunto de tokens cujas probabilidades somam p. Uma forma diferente de limitar a aleatoriedade.
  • top-k — considera apenas os k tokens mais prováveis.
  • sequências de parada — strings que, quando geradas, encerram a resposta (úteis para saída estruturada).

Você normalmente ajusta temperatura OU top-p, não os dois.

Quando rodar frio vs. quente

Rodar frio (temp. baixa)Rodar quente (temp. mais alta)
Extração, classificação, códigoBrainstorming, nomes, copy criativo
Qualquer coisa que você queira reproduzívelExplorar muitas opções
Saída factual / estruturadaVariedade de tom, ideação

Um bom padrão para a maioria dos trabalhos é moderado a baixo. Aumente apenas quando você quiser surpresa.

:::note Modelos mais novos podem esconder esses controles Vários modelos Claude recentes adaptam a própria decodificação e minimizam (ou omitem) a temperatura. Se um botão não estiver disponível, isso é intencional — molde o comportamento pelo prompt e (onde for oferecido) pela configuração de esforço/pensamento. :::

Ressalva sobre determinismo

Mesmo com temperatura 0, as saídas não têm garantia de serem idênticas bit a bit entre execuções/versões. Não confie em reprodutibilidade exata; confie em evals para detectar desvios.

Próximo