Saltar al contenido principal

Fine-tuning vs prompting vs RAG

Intermedio

Cuando el modelo no hace lo que quieres, hay tres palancas — y la gente recurre primero a la cara. Aquí está el orden que de verdad funciona.

Prueba en este orden

1. Prompting — empieza aquí, siempre

Instrucciones más claras, ejemplos, un rol, restricciones de salida (Fundamentos del prompting). Soluciona la mayoría de los problemas, no cuesta nada extra y es instantáneo de iterar. La mayoría de los "el modelo es malo en X" resultan ser "el prompt era vago".

2. RAG — cuando necesita tu conocimiento

Si la brecha es información faltante o reciente (tus documentos, tus datos, hechos actuales), añade RAG. Mantiene el conocimiento actualizable y citable sin tocar el modelo.

3. Fine-tuning — último recurso, para comportamiento/formato a escala

El fine-tuning sigue entrenando un modelo con tus ejemplos. Recurre a él solo cuando prompting + RAG no logren un estilo, formato o comportamiento de tarea consistentes y tengas muchos ejemplos de alta calidad y el volumen que lo justifique.

La tabla de decisión

Tu problemaRecurre a
Salidas vagas/incorrectas, formato erróneoPrompting
No conoce tus datos / necesita información actualRAG
Necesita un estilo/comportamiento muy específico, de forma consistente, a escalaFine-tuning
Necesita realizar acciones(Ninguna de estas — eso es uso de herramientas/agentes)

Por qué la gente lo confunde

El fine-tuning suena como "enseñarle al modelo", así que parece la solución de verdad. Pero es la opción más lenta, más cara y menos flexible, no añade conocimiento fresco bien (RAG hace eso) y es fácil hacerlo mal. Agota primero el prompting y RAG — normalmente no necesitarás el paso 3.

:::tip Se combinan Un sistema sólido suele ser un buen prompt + RAG para el conocimiento, con el fine-tuning reservado para una necesidad de comportamiento concreta. No son mutuamente excluyentes. :::

Siguiente