微调 vs 提示 vs RAG

进阶

当模型没有按你的期望去做时，有三个杠杆可用——而人们往往先去够最贵的那一个。下面是真正有效的顺序。

按此顺序尝试

更清晰的指令、示例、角色、输出约束（提示工程基础）。它能修复绝大多数问题，不产生额外成本，而且迭代起来即时。大多数"模型在 X 上很差"最后都被证明是"提示词太含糊"。

如果差距在于缺失或时新的信息（你的文档、你的数据、当前事实），那就加上 RAG。它让知识保持可更新、可引用，而无需触碰模型。

微调会在你的示例上对模型进行进一步训练。只有当提示 + RAG 都无法获得一致的风格、格式或任务行为，且你拥有大量高质量示例以及足以证明其合理性的用量时，才动用它。

微调听起来像是"教会模型"，所以感觉它才是真正的解决办法。但它是最慢、最贵、最不灵活的选项，它并不擅长补充时新的知识（那是 RAG 的活），而且很容易做砸。先把提示和 RAG 用尽——你通常根本用不到第 3 步。

:::tip 它们可以组合一个强大的系统往往是一个好提示 + 用于知识的 RAG，并把微调保留给某个狭窄的行为需求。它们并不互斥。 :::