Pular para o conteúdo principal

Fine-tuning vs Prompting vs RAG

Intermediário

Quando o modelo não faz o que você quer, há três alavancas — e as pessoas recorrem primeiro à mais cara. Aqui está a ordem que realmente funciona.

Tente nesta ordem

1. Prompting — comece aqui, sempre

Instruções mais claras, exemplos, um papel, restrições de saída (Fundamentos de Prompting). Resolve a maioria dos problemas, não custa nada a mais e é instantâneo de iterar. A maior parte dos "o modelo é ruim em X" acaba sendo "o prompt estava vago".

2. RAG — quando ele precisa do seu conhecimento

Se a lacuna for informação ausente ou atualizada (seus documentos, seus dados, fatos atuais), adicione RAG. Mantém o conhecimento atualizável e citável sem tocar no modelo.

3. Fine-tuning — último recurso, para comportamento/formato em escala

O fine-tuning treina ainda mais um modelo com os seus exemplos. Recorra a ele apenas quando prompting + RAG não conseguirem estilo, formato ou comportamento de tarefa consistentes e você tiver muitos exemplos de alta qualidade e o volume que o justifique.

A tabela de decisão

Seu problemaRecorra a
Saídas vagas/erradas, formato erradoPrompting
Não conhece os seus dados / precisa de informação atualRAG
Precisa de um estilo/comportamento muito específico, de forma consistente, em escalaFine-tuning
Precisa executar ações(Nenhum desses — isso é uso de ferramentas/agentes)

Por que as pessoas erram

O fine-tuning soa como "ensinar o modelo", então parece a solução de verdade. Mas é a opção mais lenta, mais cara e menos flexível, ele não adiciona conhecimento novo bem (o RAG faz isso) e é fácil de fazer mal. Esgote prompting e RAG primeiro — você geralmente não precisará do passo 3.

:::tip Eles se combinam Um sistema forte costuma ser um bom prompt + RAG para conhecimento, com o fine-tuning reservado para uma necessidade comportamental específica. Eles não são mutuamente exclusivos. :::

Próximo