Razonamiento extendido y esfuerzo

Intermedio

Para los problemas difíciles, Claude puede dedicar cómputo extra a pensar antes de responder, mejorando la precisión en el razonamiento de varios pasos, el código complicado y las matemáticas. Tú controlas aproximadamente cuánto esfuerzo gastar.

La idea

Menos razonamiento = más rápido y más barato; bien para tareas simples y bien especificadas.
Más razonamiento = mejor en problemas genuinamente difíciles, a mayor latencia/coste.

Los modelos más recientes exponen esto como un control de esfuerzo (y adaptan la profundidad del razonamiento automáticamente); en ellos, eliges un nivel en lugar de un presupuesto de tokens en bruto. Ajusta el nivel a la tarea.

Elegir la profundidad

Tarea	Esfuerzo sugerido
Formateo, extracción, Q&A simple	Bajo
Programación cotidiana, redacción, análisis	Medio
Depuración difícil, algoritmos complicados, demostraciones cuidadosas	Alto

No pongas todo al máximo por defecto: pagas en latencia y coste por un razonamiento que la tarea no necesita. Empieza en medio; súbelo solo donde la calidad lo exija.

Notas prácticas

El razonamiento extendido combina bien con el prompting de cadena de pensamiento, pero en los modelos de razonamiento a menudo no necesitas pedir el paso a paso; el razonamiento ocurre internamente.
El razonamiento consume tokens, lo que afecta al coste: presupuesta en consecuencia.
Para los agentes, más esfuerzo en el paso de planificación y menos en las llamadas rutinarias a herramientas es un buen reparto.

La idea​

Elegir la profundidad​

Notas prácticas​

Siguiente​

La idea

Elegir la profundidad

Notas prácticas

Siguiente