Extended thinking ed effort

Intermedio

Per i problemi difficili, Claude può spendere compute aggiuntivo pensando prima di rispondere — migliorando l'accuratezza sul ragionamento multi-step, sul codice complesso e sulla matematica. Tu controlli all'incirca quanto effort spendere.

L'idea

Meno pensiero = più veloce, più economico — va bene per task semplici e ben specificati.
Più pensiero = migliore sui problemi davvero difficili, a costo di maggiore latenza/costo.

I modelli più recenti espongono questo come un controllo dell'effort (e adattano automaticamente la profondità del pensiero); su di essi, scegli un tier anziché un budget di token grezzo. Adatta il tier al task.

Scegliere la profondità

Task	Effort suggerito
Formattazione, estrazione, Q&A semplice	Basso
Coding quotidiano, stesura, analisi	Medio
Debugging difficile, algoritmi complessi, dimostrazioni accurate	Alto

Non impostare tutto al massimo per impostazione predefinita — paghi in latenza e costo per un pensiero di cui il task non ha bisogno. Parti da medio; alzalo solo dove la qualità lo richiede.

Note pratiche

L'extended thinking si abbina bene al prompting chain-of-thought — ma sui modelli di ragionamento spesso non serve chiedere esplicitamente il passo-passo; il pensiero avviene internamente.
Il pensiero consuma token, il che incide sul costo — fai il budget di conseguenza.
Per gli agent, più effort sul passo di pianificazione e meno sulle chiamate di routine agli strumenti è una buona suddivisione.

L'idea​

Scegliere la profondità​

Note pratiche​

Avanti​

L'idea

Scegliere la profondità

Note pratiche

Avanti