Saltar al contenido principal
Formación DatIACode

Arquitecturas RAG con LangChain, FastAPI y bases vectoriales

Curso técnico para construir sistemas RAG completos: pipeline de ingesta y chunking, recuperación con bases vectoriales, orquestación con LangChain, API con FastAPI y despliegue con evaluación continua.

Nivel
Avanzado
Duración
24 horas
Modalidades
Online en directo · In-company · A medida
Dirigido a
Desarrolladores e ingenieros de datos que necesitan construir sistemas RAG listos para producción, no demos.
Sobre el curso

¿Qué es este curso y por qué te interesa?

Montar una demo de RAG cuesta una tarde: se cargan unos PDFs, se trocean, se indexan y el modelo responde. Llevar eso a producción es otro deporte. Los documentos reales llegan en formatos sucios, el chunking ingenuo rompe el contexto, la búsqueda puramente vectorial falla con terminología interna, los costes se disparan y nadie sabe medir si el sistema responde bien o solo responde bonito. La distancia entre la demo y el sistema fiable es exactamente lo que cubre este curso.

Es un curso técnico de extremo a extremo. Construirás el pipeline de ingesta completo —parsing de PDF, Word y HTML, limpieza, estrategias de chunking y metadatos—, indexarás en bases vectoriales comparando opciones reales (pgvector para quien ya tiene PostgreSQL, Pinecone como servicio gestionado, FAISS y Qdrant), montarás recuperación híbrida con reranking, orquestarás todo con LangChain y lo expondrás como API en FastAPI con streaming, autenticación y control de costes.

La última parte ataca lo que separa un proyecto serio de un juguete: evaluación con datasets propios, métricas de fidelidad y relevancia, trazabilidad de cada respuesta hasta sus fuentes y despliegue con Docker. Saldrás con un sistema RAG funcional construido por ti durante el curso y con los criterios de arquitectura para adaptarlo al caso de tu empresa.

Qué aprenderás

Capacidades que adquirirás

  • Diseñar el pipeline de ingesta: parsing de formatos reales, limpieza, chunking y metadatos.
  • Elegir y operar la base vectorial adecuada: pgvector, Pinecone, FAISS o Qdrant, con criterio.
  • Implementar recuperación híbrida (vectorial + keyword) con reranking para mejorar precisión.
  • Orquestar el sistema con LangChain y LCEL: cadenas, memoria y citación de fuentes.
  • Exponer el RAG como API de producción con FastAPI: streaming, auth y control de costes.
  • Evaluar el sistema con métricas de fidelidad y relevancia, y desplegarlo con Docker.
Objetivos

Objetivos del curso

  1. 01Comprender la arquitectura completa de un sistema RAG y sus puntos de fallo habituales.
  2. 02Construir pipelines de ingesta robustos para documentación empresarial real.
  3. 03Dominar embeddings, indexación y estrategias de recuperación más allá de la búsqueda básica.
  4. 04Implementar un servicio RAG completo con LangChain y FastAPI, con streaming y trazabilidad.
  5. 05Establecer un proceso de evaluación reproducible antes y después de cada cambio.
  6. 06Desplegar y operar el sistema con control de costes, latencia y calidad.
A quién va dirigido

¿Es este curso para ti o para tu equipo?

Desarrolladores e ingenieros de datos que necesitan construir sistemas RAG listos para producción, no demos.

Desarrolladores backend y de Python

Perfiles que dominan Python y APIs y necesitan construir su primer sistema RAG serio o arreglar uno que no pasa de demo.

Ingenieros de datos y ML engineers

Perfiles que ya manejan pipelines de datos y quieren incorporar la capa de recuperación, generación y evaluación con LLMs.

Equipos técnicos con un proyecto RAG entre manos

Equipos que tienen el encargo de construir un asistente sobre documentación corporativa y quieren hacerlo bien a la primera.

Temario

Temario completo

Programa estructurado en módulos. Cada itinerario in-company se ajusta al nivel y a los objetivos concretos del equipo.

    • Anatomía de un RAG: ingesta, indexación, recuperación, generación y evaluación.
    • Por qué fallan los RAG en producción: los cinco puntos de ruptura habituales.
    • Decisiones de arquitectura: modelo, embeddings, base vectorial y hosting.
    • RAG vs. fine-tuning vs. contexto largo: cuándo cada opción y cuándo combinar.
Metodología

Cómo se imparte

Práctica desde la primera sesión

Cada bloque combina explicación, demostración y laboratorio. Los alumnos trabajan sobre casos reales aplicables a su contexto profesional.

Casos de cliente

En programas in-company partimos de los procesos y datos del cliente. La formación deja de sonar genérica y empieza a resolver problemas concretos.

Materiales de apoyo

Los participantes reciben código, plantillas y guías reutilizables tras la formación. Lo que se aprende se mantiene en el día a día.

Adaptación al nivel del equipo

Antes de impartir, hacemos un breve diagnóstico y ajustamos profundidad y ritmo. La formación no se queda corta ni avanza por encima del grupo.

Modalidades

Modalidades disponibles

Cada formato puede adaptarse al ritmo y al contexto operativo de la organización.

Online en directo

Sesiones en streaming con interacción en vivo, ejercicios guiados y resolución de dudas.

In-company

Programa diseñado a medida y impartido para un único equipo o organización.

A medida

Itinerario completamente personalizado: temario, duración, formato y casos del cliente.

Beneficios para empresas

¿Por qué contratar este programa para tu equipo?

La formación no se diseña contra un examen, se diseña contra un objetivo de negocio.

  • Mejora de productividad real en el puesto de trabajo.
  • Actualización de competencias clave para el negocio.
  • Mayor autonomía técnica y reducción de dependencia externa.
  • Aplicación práctica inmediata sobre procesos del cliente.
  • Mejor adopción tecnológica con criterios profesionales.
  • Preparación para proyectos de IA, datos, automatización o desarrollo.
Formación bonificada

¿Se puede gestionar como formación bonificada?

Este curso puede plantearse como formación para empresas y, según las condiciones de cada organización, podría gestionarse dentro de iniciativas de formación bonificada. En DatIACode te ayudamos a estructurar la propuesta formativa y la documentación necesaria para su valoración.

Requisitos previos

¿Qué necesitas saber antes de empezar?

  • Experiencia sólida programando en Python.
  • Conocimientos básicos de APIs REST; haber tocado FastAPI o Flask ayuda.
  • Familiaridad con conceptos de LLMs (prompts, tokens, contexto); no se requiere experiencia previa con RAG.
Aplicaciones

Cómo se aplica lo aprendido

  • Asistentes de consulta sobre documentación técnica, normativa y procedimientos internos.
  • Buscadores semánticos sobre bases documentales corporativas con citación de fuentes.
  • Soporte interno de primer nivel sobre manuales y bases de conocimiento.
  • APIs de pregunta-respuesta integrables en intranets y aplicaciones existentes.
  • Sistemas de análisis de pliegos, contratos y documentación extensa.
  • Capa de recuperación para agentes que necesitan conocimiento de empresa.
DatIACode

Por qué elegir DatIACode

No vendemos formación: diseñamos programas que se traducen en capacidad operativa real.

Experiencia aplicada

Más de 20 años combinando consultoría, desarrollo y formación tecnológica para empresas de distintos sectores.

Visión de negocio

Cada programa parte de los objetivos del cliente. La técnica está al servicio del problema, no al revés.

Adaptación al equipo

Ajustamos profundidad, ritmo y casos de uso al nivel real del equipo tras un breve diagnóstico inicial.

Formación + consultoría

Si la formación destapa un proyecto, podemos acompañarte en su implantación. No abandonamos el resultado.

Especialización en IA

Trabajamos en IA aplicada todos los días. La formación no la imparte alguien que solo enseña, la imparte alguien que también construye.

Orientación a resultados

Entregables tangibles y métricas pactadas. Sin promesas vacías.

Preguntas frecuentes

FAQ

  • En la profundidad técnica y el entregable. Aquel curso enseña a montar asistentes RAG funcionales con foco en el caso de uso de negocio; este construye la arquitectura completa por código —pipeline de ingesta, base vectorial, recuperación híbrida, API con FastAPI, evaluación y despliegue— y está pensado para quien tiene que mantener ese sistema en producción.

Solicitar información

Cuéntanos qué necesitas

Te respondemos en menos de 24h laborables con disponibilidad, opciones de modalidad y propuesta a medida si aplica.

  • Diagnóstico inicial sin compromiso.
  • Propuesta adaptada al nivel y al sector.
  • Asesoramiento sobre formación bonificada.
Modalidad de interés*
Número aproximado de alumnos*

Información básica de protección de datos. Responsable: Datiacode Tech S.L.. Finalidad: atender tu solicitud y, si lo aceptas, enviarte comunicaciones comerciales. Legitimación: consentimiento del interesado y/o medidas precontractuales. Destinatarios: encargados de tratamiento descritos en la política. Derechos: acceso, rectificación, supresión, oposición, limitación y portabilidad escribiendo a privacidad@datiacode.com. Más información en la Política de Privacidad.

  • Ver curso
    IA24 horas

    RAG con LLMs: asistentes inteligentes conectados a los documentos de tu empresa

  • Ver curso
    IA20 horas

    Bases de Datos Vectoriales y Búsqueda Semántica

  • Ver curso
    IA16 horas

    Evaluación de sistemas RAG: precisión, relevancia y alucinaciones

Ver todos los cursos