Token、上下文与定价

入门

API 上的成本和限制都以 token（约为四分之三个单词）来衡量。有三件事要做对。

1. 正确地计算 token

不要靠猜，也 不要用另一个模型的分词器（例如 tiktoken）——token 数因模型家族而异。使用 Anthropic 的 token 计数 端点/SDK 辅助方法，在发送请求前测量它。粗略的规划法则：约 750 个单词 ≈ 约 1,000 个 token。

把 max_tokens 设为任务所需的大小——过低会截断；无谓地调高并不会花更多钱（你只为生成的 token 付费），但可能让回复啰嗦。

你按 输入 token + 输出 token 计费，费率因模型而异（Opus > Sonnet > Haiku）。一个快速估算：

cost ≈ (input_tokens × input_rate) + (output_tokens × output_rate)

从官方定价页面获取当前费率——我们在这里有意不硬编码它们。