확장 사고 & Effort
어려운 문제에 대해 Claude는 답하기 전에 생각하는 데 추가 연산을 쓸 수 있습니다 — 다단계 추론, 까다로운 코드, 수학에서 정확도를 높입니다. 당신은 대략 얼마나 많은 effort를 쓸지 제어합니다.
핵심 아이디어
- 적은 사고 = 더 빠르고 저렴함 — 단순하고 잘 정의된 작업에 적합합니다.
- 많은 사고 = 진정으로 어려운 문제에서 더 나음, 더 높은 지연 시간/비용으로.
최신 모델은 이를 effort 제어로 노출합니다(그리고 사고 깊이를 자동으로 조절합니다); 이런 모델에서는 원시 토큰 예산이 아니라 등급을 선택합니다. 등급을 작업에 맞추세요.
깊이 선택하기
| 작업 | 권장 effort |
|---|---|
| 포매팅, 추출, 단순 Q&A | 낮음 |
| 일상적인 코딩, 초안 작성, 분석 | 중간 |
| 어려운 디버깅, 까다로운 알고리즘, 신중한 증명 | 높음 |
모든 것을 최대로 기본 설정하지 마세요 — 작업에 필요 없는 사고에 대해 지연 시간과 비용으로 대가를 치릅니다. 중간으로 시작하고, 품질이 요구하는 곳에서만 올리세요.
실용적 참고 사항
- 확장 사고는 **사고 사슬(chain-of-thought) 프롬프팅**과 잘 어울립니다 — 하지만 추론 모델에서는 단계별로 요청할 필요가 없는 경우가 많습니다; 사고가 내부적으로 일어납니다.
- 사고는 토큰을 소비하며, 이는 비용에 영향을 미칩니다 — 그에 맞춰 예산을 잡으세요.
- 에이전트의 경우, 계획 단계에 더 많은 effort를, 일상적인 도구 호출에 더 적은 effort를 주는 것이 좋은 배분입니다.