Contrôles d'échantillonnage : température et compagnie
Lorsqu'un modèle génère du texte, il choisit le jeton suivant à partir d'une distribution de probabilités. Les contrôles d'échantillonnage règlent la façon dont il choisit — à quel point la sortie est concentrée ou variée.
Les principaux réglages
- Température — le caractère aléatoire. Basse (≈0) = concentrée, plutôt déterministe, reproductible ; le modèle suit le chemin le plus probable. Élevée = plus variée et créative, mais plus encline à divaguer ou à se tromper.
- top-p (noyau) — limite les choix au plus petit ensemble de jetons dont les probabilités totalisent p. Une autre manière de borner le caractère aléatoire.
- top-k — ne considère que les k jetons les plus probables.
- séquences d'arrêt — chaînes qui, une fois générées, mettent fin à la réponse (pratique pour une sortie structurée).
On ajuste généralement soit la température, soit le top-p, pas les deux.
Quand refroidir ou chauffer
| Mode froid (température basse) | Mode chaud (température plus élevée) |
|---|---|
| Extraction, classification, code | Brainstorming, noms, écriture créative |
| Tout ce que vous voulez reproductible | Explorer de nombreuses options |
| Sortie factuelle / structurée | Variété de ton, idéation |
Une bonne valeur par défaut pour la plupart des travaux est modérée à basse. Ne la montez que lorsque vous voulez de la surprise.
:::note Les modèles plus récents peuvent masquer ces réglages Plusieurs modèles Claude récents adaptent eux-mêmes leur décodage et minimisent (voire omettent) la température. Si un réglage n'est pas disponible, c'est voulu — façonnez plutôt le comportement par le prompt et (lorsqu'il est proposé) le réglage d'effort/réflexion. :::
Mise en garde sur le déterminisme
Même à une température de 0, les sorties ne sont pas garanties identiques au bit près d'une exécution ou d'une version à l'autre. Ne comptez pas sur une reproductibilité exacte ; comptez sur les évaluations pour détecter les dérives.