拡張思考 & エフォート
難しい問題に対して、Claude は答える前に考えることに追加の計算を費やせます — 複数ステップの推論、扱いにくいコード、数学において精度が向上します。どれくらいのエフォートを費やすかを、おおまかに制御できます。
考え方
- 思考を減らす = 速く・安い — 単純でよく定義されたタスクには十分。
- 思考を増やす = 本当に難しい問題でより良い結果。レイテンシー/コストは高くなります。
新しいモデルはこれをエフォート制御として公開しています(思考の深さは自動で適応します)。それらのモデルでは、生のトークン予算ではなくティアを選びます。ティアをタスクに合わせましょう。
深さを選ぶ
| タスク | 推奨エフォート |
|---|---|
| 整形、抽出、単純な Q&A | 低(Low) |
| 日常的なコーディング、ドラフト作成、分析 | 中(Medium) |
| 難しいデバッグ、扱いにくいアルゴリズム、慎重な証明 | 高(High) |
すべてを最大にデフォルト設定しないでください — タスクが必要としない思考に、レイテンシーとコストで支払うことになります。中(Medium)から始め、品質が要求する箇所だけ上げましょう。
実践的なメモ
- 拡張思考は**思考連鎖(chain-of-thought)プロンプティング** と相性が良いですが、推論モデルでは段階的に頼む必要がないことが多いです。思考は内部で行われます。
- 思考はトークンを消費し、コストに影響します — それを見込んで予算を立てましょう。
- エージェントでは、計画のステップにより多くのエフォートを、ルーティンなツール呼び出しには少なめのエフォートを割り当てるのが良い配分です。