Recursos / Glosario IA / RAG (Retrieval-Augmented Generation)
RAG (Retrieval-Augmented Generation)
RAG (Retrieval-Augmented Generation) es la técnica que permite a un modelo de lenguaje como GPT-4 o Claude responder preguntas usando información que no estaba en su entrenamiento original.
El problema que resuelve
Los modelos de lenguaje son entrenados hasta una fecha de corte y no saben nada de tu empresa, tus productos, tus procesos o tus datos internos. Sin RAG, un asistente de IA te dará respuestas genéricas o inventará información (alucinaciones).
Cómo funciona
Cuando el usuario hace una pregunta, el sistema RAG:
- Busca en tu base de conocimiento (documentos, FAQs, manuales, base de datos) los fragmentos más relevantes para esa pregunta.
- Le pasa esos fragmentos al modelo de lenguaje como contexto.
- El modelo genera una respuesta basada en ese contexto, no en lo que “cree saber”.
El resultado es un asistente que responde sobre tus productos, tus políticas y tus datos con precisión y sin inventar.
Cuándo usarlo
RAG es la base de cualquier asistente de IA empresarial que necesite responder sobre información específica de la empresa: asistente de atención al cliente, asistente interno para empleados, chatbot de soporte técnico.
Si el asistente solo necesita capacidad de razonamiento general (redactar, resumir, traducir), no necesita RAG.