Saltar al contenido principal

Controles de muestreo: temperatura y compañía

Intermedio

Cuando un modelo genera texto, elige el siguiente token a partir de una distribución de probabilidad. Los controles de muestreo ajustan cómo lo elige — qué tan enfocada o qué tan variada es la salida.

Los diales principales

  • Temperatura — aleatoriedad. Baja (≈0) = enfocada, casi determinista, repetible; el modelo toma el camino más probable. Alta = más variada y creativa, pero más propensa a divagar o a errar.
  • top-p (núcleo) — restringe las opciones al conjunto más pequeño de tokens cuyas probabilidades suman p. Una forma distinta de acotar la aleatoriedad.
  • top-k — solo considera los k tokens más probables.
  • secuencias de parada — cadenas que, al generarse, terminan la respuesta (útil para la salida estructurada).

Normalmente ajustas temperatura O top-p, no ambos.

Cuándo ir en frío y cuándo en caliente

Ir en frío (temp. baja)Ir en caliente (temp. más alta)
Extracción, clasificación, códigoLluvia de ideas, nombres, textos creativos
Cualquier cosa que quieras reproducibleExplorar muchas opciones
Salida factual / estructuradaVariedad de tono, ideación

Un buen valor por defecto para la mayoría del trabajo es de moderado a bajo. Súbelo solo cuando quieras sorpresa.

:::note Los modelos más nuevos pueden ocultarlos Varios modelos Claude recientes adaptan su propia decodificación y restan importancia a (u omiten) la temperatura. Si un dial no está disponible, es por diseño — moldea el comportamiento a través del prompt y (cuando se ofrezca) del ajuste de esfuerzo/razonamiento en su lugar. :::

Advertencia sobre el determinismo

Incluso a temperatura 0, las salidas no están garantizadas como idénticas bit a bit entre ejecuciones/versiones. No te apoyes en la reproducibilidad exacta; apóyate en las evaluaciones para detectar desviaciones.

Siguiente