术语表
大白话定义,不假定任何先备知识。随手翻翻,或者搜索一个你在别处遇到的术语。
智能体(Agent)
一个被设置成 在循环中采取行动 的 AI——它读取一个目标、调用工具、查看结果,然后不断重复直到完成。Claude Code 就是面向你代码库的一个智能体。
Anthropic
制造 Claude 的公司。
API(应用程序编程接口)
一种让 你的 软件以编程方式与 Claude 对话的方式,而不是在聊天窗口里打字。参见 你的第一次 API 调用。
Artifact(产物)
一个实时、可运行的输出(应用、图表或文档),Claude 会把它渲染在 claude.ai 的侧边面板中,与聊天分开。
思维链(Chain-of-thought,CoT)
让模型在回答之前 一步步推理,这能提升它在难题上的准确性。
Claude
由 Anthropic 制造的 AI 模型(及应用)家族。视语境而定,"Claude"可以指聊天应用、模型,或品牌。
Claude Code
Anthropic 的 智能体式命令行/IDE 工具,能读取并编辑你的代码库、运行命令、使用工具。参见 Claude Code 是什么。
CLAUDE.md
一个纯文本文件,你在其中给 Claude Code 关于项目的持久化指令——它是最高杠杆率的定制方式。
上下文窗口(Context window)
模型一次能考虑的文本最大量(以 token 计量)——你的提示词 加上 它的回复。一旦超出,最早的内容就会被丢弃。
嵌入(Embedding)
一串代表某段文本 含义 的数字,让软件能找到含义相近(而不仅仅是关键词匹配)的内容。它为语义搜索和 RAG 提供动力。
评估(Eval / evaluation)
一种可重复的 AI 输出质量测试,让你能判断某个改动是让结果变好了还是变差了。
少样本(Few-shot)
在你的提示词里包含 几个做好的示例,向模型展示你想要的模式。
微调(Fine-tuning)
用你自己的示例进一步训练模型,使其专门化。通常是最后的手段——先尝试提示词和 RAG。
幻觉(Hallucination)
当模型陈述某件 错误却很自信 的事情。核心技能是核验。参见 幻觉。
钩子(Hook)
在 Claude Code 中,一条在生命周期事件(例如每次文件编辑之后)自动 运行的命令,用于强制执行格式化、关卡校验或安全检查。
推理执行(Inference)
运行模型以获得输出的动作(与训练它相对)。
LLM(大语言模型)
Claude 背后的那类 AI:被训练用来 预测下一段文本,而这恰好足以用来写作、编码、总结和推理。参见 什么是 LLM?。
MCP(模型上下文协议)
一个用于把 AI 连接到外部工具和数据(数据库、GitHub、浏览器)的 开放标准。一个"MCP 服务器"对外暴露一个工具;Claude 可以调用它。参见 MCP。
多模态(Multimodal)
一个能处理 不止文本 的模型——例如把图像和 PDF 作为输入。
提示词(Prompt)
你发给模型的内容:你的指令、问题,以及任何上下文。
提示词缓存(Prompt caching)
在多次调用之间复用提示词中保持不变的前部,以削减成本和延迟。参见 提示词缓存。
提示词注入(Prompt injection)
一种攻击:隐藏在 AI 所读内容中的恶意指令(一个网页、一份文档)试图劫持它。参见 提示词注入。
RAG(检索增强生成)
从 你的 数据中取出相关片段并加进提示词,让模型基于它们来作答。参见 RAG。
推理 / 扩展思考(Reasoning / extended thinking)
一种模式,模型在回答之前花费额外算力来"思考",用于更难的任务。
技能(Skill)
一个打包好的能力(指令 + 可选脚本),Claude 会在相关时 按需 加载它。参见 技能。
子智能体(Subagent)
一个拥有自身上下文和工具的独立 Claude 实例,用于 委派 一部分任务(例如调研),让主会话保持专注。
系统提示词(System prompt)
为整段对话设定模型角色与规则的高层指令——你最强的引导杠杆。
温度(Temperature)
一个(在某些模型上的)控制随机性的设置:低 = 聚焦且可复现,高 = 多样且有创意。
Token(词元)
模型读取并计数的单位——在英语里大约相当于 ¾ 个单词。定价和上下文限额都以 token 计量。参见 Token 与上下文。
工具使用 / 函数调用(Tool use / function calling)
让模型调用你定义的函数(搜索、计算器、你的 API)并使用其结果。参见 工具使用。
护栏(Guardrails)
让 AI 行为保持安全且不偏离任务的规则与限制——例如权限规则、"完成前先运行测试",或对高风险操作要求人工批准。参见 为智能体加固安全。
延迟(Latency)
你等待一个回复要花多久。更大的模型通常更慢;流式输出 通过边生成边显示来改善 感知上的 延迟。
结构化输出(Structured output)
让结果以严格、机器可读的形式呈现(例如符合某个 schema 的 JSON),而不是自由文本——这样其他软件就能依赖它们。参见 结构化输出。
上下文工程(Context engineering)
有意地决定要放进模型 上下文窗口 的内容——指令、示例、检索到的数据——以获得最佳结果。它是提示词、RAG 和记忆背后的学问。
缺了某个术语?把它加上——术语表条目是绝佳的第一次贡献。