Passa al contenuto principale

Controlli di campionamento: temperatura e affini

Intermedio

Quando un modello genera testo, sceglie il token successivo da una distribuzione di probabilità. I controlli di campionamento regolano come lo sceglie — quanto focalizzato vs quanto vario sarà l'output.

Le manopole principali

  • Temperatura — casualità. Bassa (≈0) = focalizzata, quasi deterministica, ripetibile; il modello prende il percorso più probabile. Alta = più varia e creativa, ma più incline a divagare o sbagliare.
  • top-p (nucleus) — limita le scelte all'insieme più piccolo di token le cui probabilità sommano a p. Un modo diverso di limitare la casualità.
  • top-k — considera solo i k token più probabili.
  • stop sequence — stringhe che, quando generate, terminano la risposta (comode per l'output strutturato).

Di solito si regola la temperatura OPPURE il top-p, non entrambi.

Quando andare a freddo vs a caldo

Vai a freddo (temp bassa)Vai a caldo (temp più alta)
Estrazione, classificazione, codiceBrainstorming, nomi, copy creativo
Qualsiasi cosa tu voglia riproducibileEsplorare molte opzioni
Output fattuale / strutturatoVarietà di tono, ideazione

Un buon valore predefinito per la maggior parte del lavoro è da moderato a basso. Alzalo solo quando vuoi la sorpresa.

:::note I modelli più recenti potrebbero nasconderle Diversi modelli Claude recenti adattano la propria decodifica e riducono l'importanza (o omettono) della temperatura. Se una manopola non è disponibile, è una scelta di progettazione — modella il comportamento tramite il prompt e (dove offerta) l'impostazione di effort/thinking. :::

Avvertenza sul determinismo

Anche a temperatura 0, gli output non sono garantiti identici bit per bit tra esecuzioni/versioni. Non fare affidamento sulla riproducibilità esatta; affidati agli evals per intercettare la deriva.

Prossimi passi