API でエージェントを構築する
エージェントとは、ループ内で動作するモデルのことです。ツールを呼び出し、結果を観察し、完了するまで次のステップを判断しながら、目標を追求します。エージェントを構築する前に、動作する最もシンプルな手段を選びましょう。
判断のためのテスト(過剰に作り込まない)
- 単一呼び出し — 1 つのプロンプトで答えが出る。大半のタスクがこれに該当します。最も安価で、最も信頼できます。
- ワークフロー — 固定された一連の呼び出しをコードでオーケストレーションします(決定論的な制御フロー)。ステップが既知の場合に使います。
- エージェント — モデルが動的にステップを判断します。経路を本当にハードコードできない場合にのみ使います。
アダプティブであること自体が目的のときにこそエージェントを選びましょう。見栄えがするから、という理由で選んではいけません。自分で制御するワークフローのほうがテストもデバッグも容易です。
ループを設計する
最小限のカスタムエージェント:
- システムプロンプト: 目標、制約、利用可能なツール。
- ループ: メッセージを送信 →
tool_useがあればツールを実行し、tool_resultを追加して繰り返す → 最終回答または停止条件に達するまで。 - ガードレール: 最大反復回数の上限、トークン/コストの予算、ツール入力のバリデーション。
- コンテキスト管理: 履歴が増えたら要約・トリミングする(コンテキスト管理と同じ考え方)。
Claude Agent SDK は、このループ — ツール、権限、コンテキスト処理 — を一式そろえて提供します。自前で組み上げる必要はありません。
堅牢にする
- すべてに上限を設ける: 反復回数、時間、コスト。エージェントはループに陥り得ます。
- ツールの失敗を丁寧に扱う(エラーを結果として返す)。
- リスクのあるアクションには最小権限 + ヒューマン・イン・ザ・ループを — エージェントのセキュリティを参照。
- 信頼する前に実際のケースで評価する — 評価(Evals)を参照。