跳到主要内容

术语表

所有级别

大白话定义,不假定任何先备知识。随手翻翻,或者搜索一个你在别处遇到的术语。

智能体(Agent)

一个被设置成 在循环中采取行动 的 AI——它读取一个目标、调用工具、查看结果,然后不断重复直到完成。Claude Code 就是面向你代码库的一个智能体。

Anthropic

制造 Claude 的公司。

API(应用程序编程接口)

一种让 你的 软件以编程方式与 Claude 对话的方式,而不是在聊天窗口里打字。参见 你的第一次 API 调用

Artifact(产物)

一个实时、可运行的输出(应用、图表或文档),Claude 会把它渲染在 claude.ai 的侧边面板中,与聊天分开。

思维链(Chain-of-thought,CoT)

让模型在回答之前 一步步推理,这能提升它在难题上的准确性。

Claude

由 Anthropic 制造的 AI 模型(及应用)家族。视语境而定,"Claude"可以指聊天应用、模型,或品牌。

Claude Code

Anthropic 的 智能体式命令行/IDE 工具,能读取并编辑你的代码库、运行命令、使用工具。参见 Claude Code 是什么

CLAUDE.md

一个纯文本文件,你在其中给 Claude Code 关于项目的持久化指令——它是最高杠杆率的定制方式。

上下文窗口(Context window)

模型一次能考虑的文本最大量(以 token 计量)——你的提示词 加上 它的回复。一旦超出,最早的内容就会被丢弃。

嵌入(Embedding)

一串代表某段文本 含义 的数字,让软件能找到含义相近(而不仅仅是关键词匹配)的内容。它为语义搜索和 RAG 提供动力。

评估(Eval / evaluation)

一种可重复的 AI 输出质量测试,让你能判断某个改动是让结果变好了还是变差了。

少样本(Few-shot)

在你的提示词里包含 几个做好的示例,向模型展示你想要的模式。

微调(Fine-tuning)

用你自己的示例进一步训练模型,使其专门化。通常是最后的手段——先尝试提示词和 RAG

幻觉(Hallucination)

当模型陈述某件 错误却很自信 的事情。核心技能是核验。参见 幻觉

钩子(Hook)

在 Claude Code 中,一条在生命周期事件(例如每次文件编辑之后)自动 运行的命令,用于强制执行格式化、关卡校验或安全检查。

推理执行(Inference)

运行模型以获得输出的动作(与训练它相对)。

LLM(大语言模型)

Claude 背后的那类 AI:被训练用来 预测下一段文本,而这恰好足以用来写作、编码、总结和推理。参见 什么是 LLM?

MCP(模型上下文协议)

一个用于把 AI 连接到外部工具和数据(数据库、GitHub、浏览器)的 开放标准。一个"MCP 服务器"对外暴露一个工具;Claude 可以调用它。参见 MCP

多模态(Multimodal)

一个能处理 不止文本 的模型——例如把图像和 PDF 作为输入。

提示词(Prompt)

你发给模型的内容:你的指令、问题,以及任何上下文。

提示词缓存(Prompt caching)

在多次调用之间复用提示词中保持不变的前部,以削减成本和延迟。参见 提示词缓存

提示词注入(Prompt injection)

一种攻击:隐藏在 AI 所读内容中的恶意指令(一个网页、一份文档)试图劫持它。参见 提示词注入

RAG(检索增强生成)

你的 数据中取出相关片段并加进提示词,让模型基于它们来作答。参见 RAG

推理 / 扩展思考(Reasoning / extended thinking)

一种模式,模型在回答之前花费额外算力来"思考",用于更难的任务。

技能(Skill)

一个打包好的能力(指令 + 可选脚本),Claude 会在相关时 按需 加载它。参见 技能

子智能体(Subagent)

一个拥有自身上下文和工具的独立 Claude 实例,用于 委派 一部分任务(例如调研),让主会话保持专注。

系统提示词(System prompt)

为整段对话设定模型角色与规则的高层指令——你最强的引导杠杆。

温度(Temperature)

一个(在某些模型上的)控制随机性的设置:低 = 聚焦且可复现,高 = 多样且有创意。

Token(词元)

模型读取并计数的单位——在英语里大约相当于 ¾ 个单词。定价和上下文限额都以 token 计量。参见 Token 与上下文

工具使用 / 函数调用(Tool use / function calling)

让模型调用你定义的函数(搜索、计算器、你的 API)并使用其结果。参见 工具使用

护栏(Guardrails)

让 AI 行为保持安全且不偏离任务的规则与限制——例如权限规则、"完成前先运行测试",或对高风险操作要求人工批准。参见 为智能体加固安全

延迟(Latency)

你等待一个回复要花多久。更大的模型通常更慢;流式输出 通过边生成边显示来改善 感知上的 延迟。

结构化输出(Structured output)

让结果以严格、机器可读的形式呈现(例如符合某个 schema 的 JSON),而不是自由文本——这样其他软件就能依赖它们。参见 结构化输出

上下文工程(Context engineering)

有意地决定要放进模型 上下文窗口 的内容——指令、示例、检索到的数据——以获得最佳结果。它是提示词、RAG 和记忆背后的学问。


缺了某个术语?把它加上——术语表条目是绝佳的第一次贡献。