术语表

所有级别

大白话定义，不假定任何先备知识。随手翻翻，或者搜索一个你在别处遇到的术语。

智能体（Agent）

一个被设置成 在循环中采取行动 的 AI——它读取一个目标、调用工具、查看结果，然后不断重复直到完成。Claude Code 就是面向你代码库的一个智能体。

Anthropic

制造 Claude 的公司。

API（应用程序编程接口）

一种让你的软件以编程方式与 Claude 对话的方式，而不是在聊天窗口里打字。参见你的第一次 API 调用。

Artifact（产物）

一个实时、可运行的输出（应用、图表或文档），Claude 会把它渲染在 claude.ai 的侧边面板中，与聊天分开。

思维链（Chain-of-thought，CoT）

让模型在回答之前 一步步推理，这能提升它在难题上的准确性。

Claude

由 Anthropic 制造的 AI 模型（及应用）家族。视语境而定，"Claude"可以指聊天应用、模型，或品牌。

Claude Code

Anthropic 的 智能体式命令行/IDE 工具，能读取并编辑你的代码库、运行命令、使用工具。参见 Claude Code 是什么。

CLAUDE.md

一个纯文本文件，你在其中给 Claude Code 关于项目的持久化指令——它是最高杠杆率的定制方式。

上下文窗口（Context window）

模型一次能考虑的文本最大量（以 token 计量）——你的提示词加上它的回复。一旦超出，最早的内容就会被丢弃。

嵌入（Embedding）

一串代表某段文本含义的数字，让软件能找到含义相近（而不仅仅是关键词匹配）的内容。它为语义搜索和 RAG 提供动力。

评估（Eval / evaluation）

一种可重复的 AI 输出质量测试，让你能判断某个改动是让结果变好了还是变差了。

少样本（Few-shot）

在你的提示词里包含 几个做好的示例，向模型展示你想要的模式。

微调（Fine-tuning）

用你自己的示例进一步训练模型，使其专门化。通常是最后的手段——先尝试提示词和 RAG。

幻觉（Hallucination）

当模型陈述某件 错误却很自信 的事情。核心技能是核验。参见幻觉。

钩子（Hook）

在 Claude Code 中，一条在生命周期事件（例如每次文件编辑之后）自动运行的命令，用于强制执行格式化、关卡校验或安全检查。

推理执行（Inference）

运行模型以获得输出的动作（与训练它相对）。

LLM（大语言模型）

Claude 背后的那类 AI：被训练用来 预测下一段文本，而这恰好足以用来写作、编码、总结和推理。参见什么是 LLM？。

MCP（模型上下文协议）

一个用于把 AI 连接到外部工具和数据（数据库、GitHub、浏览器）的 开放标准。一个"MCP 服务器"对外暴露一个工具；Claude 可以调用它。参见 MCP。

多模态（Multimodal）

一个能处理 不止文本 的模型——例如把图像和 PDF 作为输入。

提示词（Prompt）

你发给模型的内容：你的指令、问题，以及任何上下文。

提示词缓存（Prompt caching）

在多次调用之间复用提示词中保持不变的前部，以削减成本和延迟。参见提示词缓存。

提示词注入（Prompt injection）

一种攻击：隐藏在 AI 所读内容中的恶意指令（一个网页、一份文档）试图劫持它。参见提示词注入。

RAG（检索增强生成）

从你的数据中取出相关片段并加进提示词，让模型基于它们来作答。参见 RAG。

推理 / 扩展思考（Reasoning / extended thinking）

一种模式，模型在回答之前花费额外算力来"思考"，用于更难的任务。

技能（Skill）

一个打包好的能力（指令 + 可选脚本），Claude 会在相关时按需加载它。参见技能。

子智能体（Subagent）

一个拥有自身上下文和工具的独立 Claude 实例，用于委派一部分任务（例如调研），让主会话保持专注。

系统提示词（System prompt）

为整段对话设定模型角色与规则的高层指令——你最强的引导杠杆。

温度（Temperature）

一个（在某些模型上的）控制随机性的设置：低 = 聚焦且可复现，高 = 多样且有创意。

Token（词元）

模型读取并计数的单位——在英语里大约相当于 ¾ 个单词。定价和上下文限额都以 token 计量。参见 Token 与上下文。

工具使用 / 函数调用（Tool use / function calling）

让模型调用你定义的函数（搜索、计算器、你的 API）并使用其结果。参见工具使用。

护栏（Guardrails）

让 AI 行为保持安全且不偏离任务的规则与限制——例如权限规则、"完成前先运行测试"，或对高风险操作要求人工批准。参见为智能体加固安全。

延迟（Latency）

你等待一个回复要花多久。更大的模型通常更慢；流式输出通过边生成边显示来改善 感知上的 延迟。

结构化输出（Structured output）

让结果以严格、机器可读的形式呈现（例如符合某个 schema 的 JSON），而不是自由文本——这样其他软件就能依赖它们。参见结构化输出。

上下文工程（Context engineering）

有意地决定要放进模型上下文窗口的内容——指令、示例、检索到的数据——以获得最佳结果。它是提示词、RAG 和记忆背后的学问。

缺了某个术语？把它加上——术语表条目是绝佳的第一次贡献。

智能体（Agent）​

Anthropic​

API（应用程序编程接口）​

Artifact（产物）​

思维链（Chain-of-thought，CoT）​

Claude​

Claude Code​

CLAUDE.md​

上下文窗口（Context window）​

嵌入（Embedding）​

评估（Eval / evaluation）​

少样本（Few-shot）​

微调（Fine-tuning）​

幻觉（Hallucination）​

钩子（Hook）​

推理执行（Inference）​

LLM（大语言模型）​

MCP（模型上下文协议）​

多模态（Multimodal）​

提示词（Prompt）​

提示词缓存（Prompt caching）​

提示词注入（Prompt injection）​

RAG（检索增强生成）​

推理 / 扩展思考（Reasoning / extended thinking）​

技能（Skill）​

子智能体（Subagent）​

系统提示词（System prompt）​

温度（Temperature）​

Token（词元）​

工具使用 / 函数调用（Tool use / function calling）​

护栏（Guardrails）​

延迟（Latency）​

结构化输出（Structured output）​

上下文工程（Context engineering）​