Aller au contenu principal

Fine-tuning vs prompting vs RAG

Intermédiaire

Quand le modèle ne fait pas ce que vous voulez, il existe trois leviers — et les gens saisissent d'abord le plus coûteux. Voici l'ordre qui fonctionne réellement.

Essayez dans cet ordre

1. Le prompting — commencez ici, toujours

Des instructions plus claires, des exemples, un rôle, des contraintes de sortie (Les bases du prompting). Cela règle la majorité des problèmes, ne coûte rien de plus et s'itère instantanément. La plupart des « le modèle est mauvais sur X » se révèlent être des « le prompt était vague ».

2. Le RAG — quand il a besoin de votre savoir

Si l'écart vient d'une information manquante ou récente (vos documents, vos données, des faits actuels), ajoutez du RAG. Cela garde le savoir actualisable et citable sans toucher au modèle.

3. Le fine-tuning — dernier recours, pour le comportement/format à grande échelle

Le fine-tuning poursuit l'entraînement d'un modèle sur vos exemples. N'y recourez que lorsque le prompting + RAG ne parviennent pas à obtenir un style, un format ou un comportement de tâche cohérent, que vous disposez de nombreux exemples de haute qualité et d'un volume qui le justifie.

La table de décision

Votre problèmeRecourez à
Sorties vagues/erronées, mauvais formatLe prompting
Ne connaît pas vos données / a besoin d'infos actuellesLe RAG
A besoin d'un style/comportement très spécifique, de façon cohérente, à grande échelleLe fine-tuning
A besoin d'effectuer des actions(Pas ceux-ci — c'est l'utilisation d'outils/les agents)

Pourquoi les gens se trompent

Le fine-tuning ressemble à « apprendre au modèle », ce qui donne l'impression d'être le vrai remède. Mais c'est l'option la plus lente, la plus coûteuse, la moins flexible, elle n'ajoute pas bien de savoir récent (le RAG le fait), et elle est facile à mal faire. Épuisez d'abord le prompting et le RAG — vous n'aurez généralement pas besoin de l'étape 3.

:::tip Ils se combinent Un système solide est souvent un bon prompt + du RAG pour le savoir, le fine-tuning étant réservé à un besoin comportemental restreint. Ils ne s'excluent pas mutuellement. :::

Pour aller plus loin