跳到主要内容

微调 vs 提示 vs RAG

进阶

当模型没有按你的期望去做时,有三个杠杆可用——而人们往往先去够最贵的那一个。下面是真正有效的顺序。

按此顺序尝试

1. 提示——永远从这里开始

更清晰的指令、示例、角色、输出约束(提示工程基础)。它能修复绝大多数问题,不产生额外成本,而且迭代起来即时。大多数"模型在 X 上很差"最后都被证明是"提示词太含糊"。

2. RAG——当它需要你的知识时

如果差距在于缺失或时新的信息(你的文档、你的数据、当前事实),那就加上 RAG。它让知识保持可更新、可引用,而无需触碰模型。

3. 微调——最后手段,用于规模化的行为/格式

微调会在你的示例上对模型进行进一步训练。只有当提示 + RAG 都无法获得一致的风格、格式或任务行为,且你拥有大量高质量示例以及足以证明其合理性的用量时,才动用它。

决策表

你的问题应选用
输出含糊/错误、格式不对提示
不了解你的数据 / 需要当前信息RAG
需要非常特定的风格/行为,并要一致、规模化微调
需要执行操作(都不是——那属于 工具使用/智能体

人们为何会弄错

微调听起来像是"教会模型",所以感觉它才是真正的解决办法。但它是最慢、最贵、最不灵活的选项,它并不擅长补充时新的知识(那是 RAG 的活),而且很容易做砸。先把提示和 RAG 用尽——你通常根本用不到第 3 步。

:::tip 它们可以组合 一个强大的系统往往是一个好提示 + 用于知识的 RAG,并把微调保留给某个狭窄的行为需求。它们并不互斥。 :::

下一步