Controlli di campionamento: temperatura e affini
Quando un modello genera testo, sceglie il token successivo da una distribuzione di probabilità. I controlli di campionamento regolano come lo sceglie — quanto focalizzato vs quanto vario sarà l'output.
Le manopole principali
- Temperatura — casualità. Bassa (≈0) = focalizzata, quasi deterministica, ripetibile; il modello prende il percorso più probabile. Alta = più varia e creativa, ma più incline a divagare o sbagliare.
- top-p (nucleus) — limita le scelte all'insieme più piccolo di token le cui probabilità sommano a p. Un modo diverso di limitare la casualità.
- top-k — considera solo i k token più probabili.
- stop sequence — stringhe che, quando generate, terminano la risposta (comode per l'output strutturato).
Di solito si regola la temperatura OPPURE il top-p, non entrambi.
Quando andare a freddo vs a caldo
| Vai a freddo (temp bassa) | Vai a caldo (temp più alta) |
|---|---|
| Estrazione, classificazione, codice | Brainstorming, nomi, copy creativo |
| Qualsiasi cosa tu voglia riproducibile | Esplorare molte opzioni |
| Output fattuale / strutturato | Varietà di tono, ideazione |
Un buon valore predefinito per la maggior parte del lavoro è da moderato a basso. Alzalo solo quando vuoi la sorpresa.
:::note I modelli più recenti potrebbero nasconderle Diversi modelli Claude recenti adattano la propria decodifica e riducono l'importanza (o omettono) della temperatura. Se una manopola non è disponibile, è una scelta di progettazione — modella il comportamento tramite il prompt e (dove offerta) l'impostazione di effort/thinking. :::
Avvertenza sul determinismo
Anche a temperatura 0, gli output non sono garantiti identici bit per bit tra esecuzioni/versioni. Non fare affidamento sulla riproducibilità esatta; affidati agli evals per intercettare la deriva.