Razonamiento extendido y esfuerzo
Para los problemas difíciles, Claude puede dedicar cómputo extra a pensar antes de responder, mejorando la precisión en el razonamiento de varios pasos, el código complicado y las matemáticas. Tú controlas aproximadamente cuánto esfuerzo gastar.
La idea
- Menos razonamiento = más rápido y más barato; bien para tareas simples y bien especificadas.
- Más razonamiento = mejor en problemas genuinamente difíciles, a mayor latencia/coste.
Los modelos más recientes exponen esto como un control de esfuerzo (y adaptan la profundidad del razonamiento automáticamente); en ellos, eliges un nivel en lugar de un presupuesto de tokens en bruto. Ajusta el nivel a la tarea.
Elegir la profundidad
| Tarea | Esfuerzo sugerido |
|---|---|
| Formateo, extracción, Q&A simple | Bajo |
| Programación cotidiana, redacción, análisis | Medio |
| Depuración difícil, algoritmos complicados, demostraciones cuidadosas | Alto |
No pongas todo al máximo por defecto: pagas en latencia y coste por un razonamiento que la tarea no necesita. Empieza en medio; súbelo solo donde la calidad lo exija.
Notas prácticas
- El razonamiento extendido combina bien con el prompting de cadena de pensamiento, pero en los modelos de razonamiento a menudo no necesitas pedir el paso a paso; el razonamiento ocurre internamente.
- El razonamiento consume tokens, lo que afecta al coste: presupuesta en consecuencia.
- Para los agentes, más esfuerzo en el paso de planificación y menos en las llamadas rutinarias a herramientas es un buen reparto.