Passa al contenuto principale

Extended thinking ed effort

Intermedio

Per i problemi difficili, Claude può spendere compute aggiuntivo pensando prima di rispondere — migliorando l'accuratezza sul ragionamento multi-step, sul codice complesso e sulla matematica. Tu controlli all'incirca quanto effort spendere.

L'idea

  • Meno pensiero = più veloce, più economico — va bene per task semplici e ben specificati.
  • Più pensiero = migliore sui problemi davvero difficili, a costo di maggiore latenza/costo.

I modelli più recenti espongono questo come un controllo dell'effort (e adattano automaticamente la profondità del pensiero); su di essi, scegli un tier anziché un budget di token grezzo. Adatta il tier al task.

Scegliere la profondità

TaskEffort suggerito
Formattazione, estrazione, Q&A sempliceBasso
Coding quotidiano, stesura, analisiMedio
Debugging difficile, algoritmi complessi, dimostrazioni accurateAlto

Non impostare tutto al massimo per impostazione predefinita — paghi in latenza e costo per un pensiero di cui il task non ha bisogno. Parti da medio; alzalo solo dove la qualità lo richiede.

Note pratiche

  • L'extended thinking si abbina bene al prompting chain-of-thought — ma sui modelli di ragionamento spesso non serve chiedere esplicitamente il passo-passo; il pensiero avviene internamente.
  • Il pensiero consuma token, il che incide sul costo — fai il budget di conseguenza.
  • Per gli agent, più effort sul passo di pianificazione e meno sulle chiamate di routine agli strumenti è una buona suddivisione.

Avanti