Extended thinking ed effort
Per i problemi difficili, Claude può spendere compute aggiuntivo pensando prima di rispondere — migliorando l'accuratezza sul ragionamento multi-step, sul codice complesso e sulla matematica. Tu controlli all'incirca quanto effort spendere.
L'idea
- Meno pensiero = più veloce, più economico — va bene per task semplici e ben specificati.
- Più pensiero = migliore sui problemi davvero difficili, a costo di maggiore latenza/costo.
I modelli più recenti espongono questo come un controllo dell'effort (e adattano automaticamente la profondità del pensiero); su di essi, scegli un tier anziché un budget di token grezzo. Adatta il tier al task.
Scegliere la profondità
| Task | Effort suggerito |
|---|---|
| Formattazione, estrazione, Q&A semplice | Basso |
| Coding quotidiano, stesura, analisi | Medio |
| Debugging difficile, algoritmi complessi, dimostrazioni accurate | Alto |
Non impostare tutto al massimo per impostazione predefinita — paghi in latenza e costo per un pensiero di cui il task non ha bisogno. Parti da medio; alzalo solo dove la qualità lo richiede.
Note pratiche
- L'extended thinking si abbina bene al prompting chain-of-thought — ma sui modelli di ragionamento spesso non serve chiedere esplicitamente il passo-passo; il pensiero avviene internamente.
- Il pensiero consuma token, il che incide sul costo — fai il budget di conseguenza.
- Per gli agent, più effort sul passo di pianificazione e meno sulle chiamate di routine agli strumenti è una buona suddivisione.