Réflexion étendue et effort

Intermédiaire

Pour les problèmes difficiles, Claude peut consacrer du calcul supplémentaire à réfléchir avant de répondre — améliorant la précision sur le raisonnement en plusieurs étapes, le code délicat et les mathématiques. Vous contrôlez approximativement combien d'effort y consacrer.

L'idée

Moins de réflexion = plus rapide, moins cher — parfait pour les tâches simples et bien spécifiées.
Plus de réflexion = meilleur sur les problèmes réellement difficiles, au prix d'une latence et d'un coût supérieurs.

Les modèles plus récents exposent cela via un contrôle d'effort (et adaptent automatiquement la profondeur de réflexion) ; sur ceux-ci, vous choisissez un palier plutôt qu'un budget brut de tokens. Adaptez le palier à la tâche.

Choisir la profondeur

Tâche	Effort suggéré
Mise en forme, extraction, questions-réponses simples	Faible
Codage courant, rédaction, analyse	Moyen
Débogage difficile, algorithmes délicats, démonstrations rigoureuses	Élevé

Ne mettez pas tout au maximum par défaut — vous payez en latence et en coût pour une réflexion dont la tâche n'a pas besoin. Commencez au niveau moyen ; ne l'augmentez que là où la qualité l'exige.

Notes pratiques

La réflexion étendue se marie bien avec le prompting en chaîne de pensée — mais sur les modèles de raisonnement, vous n'avez souvent pas besoin de demander un raisonnement étape par étape ; la réflexion se produit en interne.
La réflexion consomme des tokens, ce qui affecte le coût — budgétez en conséquence.
Pour les agents, consacrer plus d'effort à l'étape de planification et moins aux appels d'outils de routine est une bonne répartition.

L'idée​

Choisir la profondeur​

Notes pratiques​

Suite​

L'idée

Choisir la profondeur

Notes pratiques

Suite