← Blog · 16 jul 2026 · IA

RAG en la práctica: cuándo sí, cuándo no y cómo medir su calidad

RAG es la respuesta por defecto a "quiero un chatbot que conozca mis documentos". Y muchas veces es la correcta. Pero también es donde más proyectos se atascan: se monta a ojo, no se mide y nadie sabe por qué a veces responde mal. Esta es la versión práctica, sin humo, de cuándo usar RAG, cómo montarlo y cómo saber si funciona. Es la continuación natural de lo que contamos en IA en producción.

1. Qué es RAG (y qué no)

RAG = recuperar primero, generar después. En cada pregunta, buscas en tus documentos los fragmentos relevantes y se los pasas al modelo como contexto, para que responda con tu información en lugar de con lo que "recuerda". No es magia ni reentrenar el modelo: es un buscador delante de un generador. Si la recuperación falla, la respuesta falla, por muy bueno que sea el modelo.

2. Cuándo SÍ y cuándo NO

Cuándo SÍ
  • Base de conocimiento grande o cambiante (docs, tickets, manuales).
  • Respuestas que deben citar la fuente.
  • Información que se actualiza y no quieres reentrenar nada.
  • Soporte, búsqueda interna, asistentes sobre documentación.
Cuándo NO
  • El conocimiento cabe entero en el prompt (pocos docs estables).
  • La tarea no necesita datos externos (clasificar, traducir, reescribir).
  • Necesitas un dato exacto: mejor una consulta a la base de datos.
  • Búsqueda por palabra clave precisa: a veces basta full-text search.

Regla corta: RAG añade infraestructura (indexado, embeddings, recuperación). Si no la necesitas, es complejidad gratis.

3. Cómo se monta, pieza a pieza

4. Cómo medir su calidad (lo que casi nadie hace)

Sin medición, RAG es fe. Separa siempre dos planos:

Para medir necesitas un conjunto de evaluación: 30-100 preguntas reales con su respuesta/fuente esperada. Con eso corres la evaluación antes y después de cada cambio (otro modelo de embeddings, otro tamaño de chunk, añadir reranking) y sabes si mejoras o empeoras. Sin ese conjunto, cada ajuste es a ciegas.

5. Errores típicos que vemos

Preguntas frecuentes

¿Qué es RAG en una frase?

Darle al modelo, en cada pregunta, los fragmentos relevantes de tus documentos para que responda con tu información. Recuperas primero, generas después.

¿Cuándo NO merece la pena?

Cuando el conocimiento cabe en el prompt, la tarea no necesita datos externos, o lo que necesitas es un dato exacto de base de datos. RAG añade infraestructura.

¿Cómo se mide?

Por separado: recuperación (recall@k, precision@k) y generación (fidelidad, relevancia), con un conjunto de preguntas reales y su fuente esperada.

¿Hace falta base vectorial dedicada?

No siempre. pgvector sobre Postgres basta para volúmenes pequeños/medios; las dedicadas tienen sentido con millones de vectores o filtros complejos.

¿Quieres un asistente que conozca tus documentos de verdad?

Diseñamos sistemas RAG con recuperación híbrida, evaluación y control de coste. Precio cerrado por hitos.

Servicio IA y chatbots   Pedir presupuesto

Recursos relacionados

Publicado: 16 de julio de 2026 · Escrito por el estudio RoviDev.

Pide presupuesto sin compromiso

Cuéntame brevemente tu proyecto y te respondo normalmente en menos de 30 minutos con viabilidad, fases y un rango de precio.

o escribe a contacto@rovidev.com