Aller au contenu principal

Réflexion étendue et effort

Intermédiaire

Pour les problèmes difficiles, Claude peut consacrer du calcul supplémentaire à réfléchir avant de répondre — améliorant la précision sur le raisonnement en plusieurs étapes, le code délicat et les mathématiques. Vous contrôlez approximativement combien d'effort y consacrer.

L'idée

  • Moins de réflexion = plus rapide, moins cher — parfait pour les tâches simples et bien spécifiées.
  • Plus de réflexion = meilleur sur les problèmes réellement difficiles, au prix d'une latence et d'un coût supérieurs.

Les modèles plus récents exposent cela via un contrôle d'effort (et adaptent automatiquement la profondeur de réflexion) ; sur ceux-ci, vous choisissez un palier plutôt qu'un budget brut de tokens. Adaptez le palier à la tâche.

Choisir la profondeur

TâcheEffort suggéré
Mise en forme, extraction, questions-réponses simplesFaible
Codage courant, rédaction, analyseMoyen
Débogage difficile, algorithmes délicats, démonstrations rigoureusesÉlevé

Ne mettez pas tout au maximum par défaut — vous payez en latence et en coût pour une réflexion dont la tâche n'a pas besoin. Commencez au niveau moyen ; ne l'augmentez que là où la qualité l'exige.

Notes pratiques

  • La réflexion étendue se marie bien avec le prompting en chaîne de pensée — mais sur les modèles de raisonnement, vous n'avez souvent pas besoin de demander un raisonnement étape par étape ; la réflexion se produit en interne.
  • La réflexion consomme des tokens, ce qui affecte le coût — budgétez en conséquence.
  • Pour les agents, consacrer plus d'effort à l'étape de planification et moins aux appels d'outils de routine est une bonne répartition.

Suite