Saltar al contenido principal
Formación DatIACode

Bases de Datos Vectoriales y Búsqueda Semántica

Aprende a construir búsqueda semántica con bases de datos vectoriales: embeddings, indexación, métricas de similitud y elección de motor con criterio.

Nivel
Intermedio
Duración
20 horas
Modalidades
Online en directo · In-company · A medida
Dirigido a
Desarrolladores, ingenieros de datos y arquitectos de soluciones.
Sobre el curso

¿Qué es este curso y por qué te interesa?

Las bases de datos vectoriales son la pieza que permite buscar por significado y no por palabras exactas: alimentan buscadores semánticos, sistemas de recomendación y la capa de recuperación de los sistemas RAG. Elegir bien el motor, el índice y el modelo de embeddings marca la diferencia entre una búsqueda útil y una que devuelve ruido.

Este curso se centra en dominar esa pieza: cómo funcionan los embeddings y las métricas de similitud, qué hace por dentro un índice ANN como HNSW y cómo trabajar con pgvector, Pinecone y FAISS con criterio de producción. El pipeline RAG completo se trata en cursos específicos; aquí construyes la base que lo sostiene.

Qué aprenderás

Capacidades que adquirirás

  • Generar y evaluar embeddings adecuados al dominio y al idioma.
  • Elegir métrica de similitud (coseno, producto escalar, euclídea) con criterio.
  • Configurar índices ANN (HNSW, IVF) equilibrando recall, latencia y memoria.
  • Trabajar con pgvector, Pinecone y FAISS y saber cuándo conviene cada uno.
  • Combinar búsqueda vectorial con filtros de metadatos y keyword (híbrida).
  • Medir la calidad de la recuperación con métricas como recall@k y MRR.
Objetivos

Objetivos del curso

  1. 01Comprender la representación vectorial de texto y otros datos.
  2. 02Dominar las métricas de similitud y sus implicaciones prácticas.
  3. 03Diseñar la indexación según volumen, latencia y presupuesto.
  4. 04Implementar búsqueda semántica con pgvector, Pinecone y FAISS.
  5. 05Aplicar búsqueda híbrida y filtrado por metadatos.
  6. 06Evaluar y mantener la calidad de la búsqueda en producción.
A quién va dirigido

¿Es este curso para ti o para tu equipo?

Desarrolladores, ingenieros de datos y arquitectos de soluciones.

Desarrolladores e ingenieros de datos

Necesitan incorporar búsqueda semántica a productos internos o de cliente.

Arquitectos de soluciones

Deben elegir motor, índice y arquitectura de búsqueda con criterio.

Equipos que construyen RAG

Quieren dominar la capa de recuperación antes de montar el pipeline completo.

Temario

Temario completo

Programa estructurado en módulos. Cada itinerario in-company se ajusta al nivel y a los objetivos concretos del equipo.

    • De texto a vectores: modelos de embeddings y dimensionalidad.
    • Elección de modelo: dominio, idioma y coste.
    • Normalización y embeddings multimodales.
Metodología

Cómo se imparte

Práctica desde la primera sesión

Cada bloque combina explicación, demostración y laboratorio. Los alumnos trabajan sobre casos reales aplicables a su contexto profesional.

Casos de cliente

En programas in-company partimos de los procesos y datos del cliente. La formación deja de sonar genérica y empieza a resolver problemas concretos.

Materiales de apoyo

Los participantes reciben código, plantillas y guías reutilizables tras la formación. Lo que se aprende se mantiene en el día a día.

Adaptación al nivel del equipo

Antes de impartir, hacemos un breve diagnóstico y ajustamos profundidad y ritmo. La formación no se queda corta ni avanza por encima del grupo.

Modalidades

Modalidades disponibles

Cada formato puede adaptarse al ritmo y al contexto operativo de la organización.

Online en directo

Sesiones en streaming con interacción en vivo, ejercicios guiados y resolución de dudas.

In-company

Programa diseñado a medida y impartido para un único equipo o organización.

A medida

Itinerario completamente personalizado: temario, duración, formato y casos del cliente.

Beneficios para empresas

¿Por qué contratar este programa para tu equipo?

La formación no se diseña contra un examen, se diseña contra un objetivo de negocio.

  • Mejora de productividad real en el puesto de trabajo.
  • Actualización de competencias clave para el negocio.
  • Mayor autonomía técnica y reducción de dependencia externa.
  • Aplicación práctica inmediata sobre procesos del cliente.
  • Mejor adopción tecnológica con criterios profesionales.
  • Preparación para proyectos de IA, datos, automatización o desarrollo.
Formación bonificada

¿Se puede gestionar como formación bonificada?

Este curso puede plantearse como formación para empresas y, según las condiciones de cada organización, podría gestionarse dentro de iniciativas de formación bonificada. En DatIACode te ayudamos a estructurar la propuesta formativa y la documentación necesaria para su valoración.

Requisitos previos

¿Qué necesitas saber antes de empezar?

  • Conocimientos sólidos de Python.
  • Experiencia básica con APIs y consumo de servicios HTTP.
  • Familiaridad con LLMs (consumo de OpenAI/Anthropic) recomendable.
Aplicaciones

Cómo se aplica lo aprendido

  • Buscadores semánticos sobre catálogos, documentación y bases de conocimiento.
  • Sistemas de recomendación basados en similitud de embeddings.
  • Detección de duplicados y agrupación de contenido similar.
  • Capa de recuperación para sistemas RAG y asistentes con datos propios.
DatIACode

Por qué elegir DatIACode

No vendemos formación: diseñamos programas que se traducen en capacidad operativa real.

Experiencia aplicada

Más de 20 años combinando consultoría, desarrollo y formación tecnológica para empresas de distintos sectores.

Visión de negocio

Cada programa parte de los objetivos del cliente. La técnica está al servicio del problema, no al revés.

Adaptación al equipo

Ajustamos profundidad, ritmo y casos de uso al nivel real del equipo tras un breve diagnóstico inicial.

Formación + consultoría

Si la formación destapa un proyecto, podemos acompañarte en su implantación. No abandonamos el resultado.

Especialización en IA

Trabajamos en IA aplicada todos los días. La formación no la imparte alguien que solo enseña, la imparte alguien que también construye.

Orientación a resultados

Entregables tangibles y métricas pactadas. Sin promesas vacías.

Preguntas frecuentes

FAQ

  • No. Aquí dominas la capa vectorial y la búsqueda semántica, que es la base de cualquier RAG. El pipeline completo (chunking, generación con citas, evaluación end-to-end) se trabaja en los cursos específicos de RAG de DatIACode.

Solicitar información

Cuéntanos qué necesitas

Te respondemos en menos de 24h laborables con disponibilidad, opciones de modalidad y propuesta a medida si aplica.

  • Diagnóstico inicial sin compromiso.
  • Propuesta adaptada al nivel y al sector.
  • Asesoramiento sobre formación bonificada.
Modalidad de interés*
Número aproximado de alumnos*

Información básica de protección de datos. Responsable: Datiacode Tech S.L.. Finalidad: atender tu solicitud y, si lo aceptas, enviarte comunicaciones comerciales. Legitimación: consentimiento del interesado y/o medidas precontractuales. Destinatarios: encargados de tratamiento descritos en la política. Derechos: acceso, rectificación, supresión, oposición, limitación y portabilidad escribiendo a privacidad@datiacode.com. Más información en la Política de Privacidad.

  • Ver curso
    IA24 horas

    RAG con LLMs: asistentes inteligentes conectados a los documentos de tu empresa

  • Ver curso
    IA20 horas

    RAG avanzado: evaluación, seguridad y optimización de respuestas

  • Ver curso
    IA24 horas

    Arquitecturas RAG con LangChain, FastAPI y bases vectoriales

Ver todos los cursos