Controles de muestreo: temperatura y compañía
Cuando un modelo genera texto, elige el siguiente token a partir de una distribución de probabilidad. Los controles de muestreo ajustan cómo lo elige — qué tan enfocada o qué tan variada es la salida.
Los diales principales
- Temperatura — aleatoriedad. Baja (≈0) = enfocada, casi determinista, repetible; el modelo toma el camino más probable. Alta = más variada y creativa, pero más propensa a divagar o a errar.
- top-p (núcleo) — restringe las opciones al conjunto más pequeño de tokens cuyas probabilidades suman p. Una forma distinta de acotar la aleatoriedad.
- top-k — solo considera los k tokens más probables.
- secuencias de parada — cadenas que, al generarse, terminan la respuesta (útil para la salida estructurada).
Normalmente ajustas temperatura O top-p, no ambos.
Cuándo ir en frío y cuándo en caliente
| Ir en frío (temp. baja) | Ir en caliente (temp. más alta) |
|---|---|
| Extracción, clasificación, código | Lluvia de ideas, nombres, textos creativos |
| Cualquier cosa que quieras reproducible | Explorar muchas opciones |
| Salida factual / estructurada | Variedad de tono, ideación |
Un buen valor por defecto para la mayoría del trabajo es de moderado a bajo. Súbelo solo cuando quieras sorpresa.
:::note Los modelos más nuevos pueden ocultarlos Varios modelos Claude recientes adaptan su propia decodificación y restan importancia a (u omiten) la temperatura. Si un dial no está disponible, es por diseño — moldea el comportamiento a través del prompt y (cuando se ofrezca) del ajuste de esfuerzo/razonamiento en su lugar. :::
Advertencia sobre el determinismo
Incluso a temperatura 0, las salidas no están garantizadas como idénticas bit a bit entre ejecuciones/versiones. No te apoyes en la reproducibilidad exacta; apóyate en las evaluaciones para detectar desviaciones.