Gobierno, calidad y linaje del dato en Big Data
Implanta gobierno del dato en tu plataforma Big Data: catálogo de datos, reglas y tests de calidad, linaje de extremo a extremo, roles y ownership, data contracts entre equipos y cumplimiento normativo aplicado.
- Nivel
- Intermedio
- Duración
- 16 horas
- Modalidades
- Online en directo · In-company · A medida
- Dirigido a
- Responsables de datos, ingenieros y data stewards que necesitan gobernar plataformas de datos en crecimiento.

¿Qué es este curso y por qué te interesa?
Toda plataforma de datos que crece acaba chocando con las mismas preguntas: qué significa exactamente este campo, quién es responsable de esta tabla, por qué el dato del dashboard no cuadra con el del informe, de dónde sale esta cifra y qué se rompe si cambio este esquema. Cuando nadie puede responderlas, la organización deja de fiarse de sus datos, y una plataforma de la que nadie se fía es una inversión desperdiciada por cara que sea.
Este curso enseña a implantar gobierno del dato de forma pragmática en entornos Big Data: catálogo de datos con metadatos, glosario de negocio y descubrimiento; calidad medible con dimensiones, reglas y tests automatizados integrados en los pipelines —con herramientas como Great Expectations, Soda o dbt tests—; y linaje de extremo a extremo para responder de dónde viene cada dato y qué impacto tiene cada cambio.
La parte organizativa recibe el mismo peso que la técnica, porque el gobierno fracasa más por personas que por herramientas: roles y ownership —data owners, data stewards, equipos productores y consumidores—, data contracts como acuerdos explícitos entre equipos, y el encaje con el cumplimiento normativo: RGPD, datos personales en el lake, retención y trazabilidad. El curso cierra con un plan de implantación incremental que evita el error clásico de empezar por la burocracia en lugar de por el valor.
Capacidades que adquirirás
- Montar un catálogo de datos útil: metadatos, glosario de negocio, clasificación y descubrimiento.
- Definir y medir la calidad del dato: dimensiones, reglas, métricas y umbrales con criterio.
- Automatizar tests de datos en los pipelines con herramientas como Great Expectations, Soda o dbt tests.
- Implantar linaje de extremo a extremo y usarlo para análisis de impacto e incidencias.
- Diseñar el modelo operativo: roles, ownership, data contracts y encaje con el cumplimiento.
Objetivos del curso
- 01Comprender qué problemas resuelve el gobierno del dato y cómo justificarlo ante negocio.
- 02Implantar un catálogo de datos con metadatos y glosario que el equipo use de verdad.
- 03Definir reglas de calidad medibles sobre las dimensiones relevantes de cada conjunto de datos.
- 04Integrar validaciones automáticas de datos en pipelines con alertas y cuarentena.
- 05Establecer roles, ownership y data contracts entre equipos productores y consumidores.
- 06Trazar un plan de implantación incremental de gobierno adaptado a la madurez de la organización.
¿Es este curso para ti o para tu equipo?
Responsables de datos, ingenieros y data stewards que necesitan gobernar plataformas de datos en crecimiento.
Responsables de datos y de plataforma
CDOs, heads of data y responsables técnicos que necesitan implantar gobierno sin frenar la entrega de los equipos.
Ingenieros de datos y arquitectos
Perfiles técnicos que construyen la plataforma y deben integrar catálogo, tests de calidad y linaje en los pipelines.
Data stewards y perfiles de calidad del dato
Personas con responsabilidad funcional sobre dominios de datos que necesitan método y herramientas para ejercerla.
Temario completo
Programa estructurado en módulos. Cada itinerario in-company se ajusta al nivel y a los objetivos concretos del equipo.
- Síntomas de la falta de gobierno: cifras que no cuadran, datos huérfanos y miedo a cambiar.
- El coste de la mala calidad: decisiones erróneas, retrabajo y pérdida de confianza.
- Gobierno pragmático frente a gobierno burocrático: empezar por el valor.
- Marcos de referencia (DAMA-DMBOK) y su lectura realista para una empresa concreta.
Cómo se imparte
Práctica desde la primera sesión
Cada bloque combina explicación, demostración y laboratorio. Los alumnos trabajan sobre casos reales aplicables a su contexto profesional.
Casos de cliente
En programas in-company partimos de los procesos y datos del cliente. La formación deja de sonar genérica y empieza a resolver problemas concretos.
Materiales de apoyo
Los participantes reciben código, plantillas y guías reutilizables tras la formación. Lo que se aprende se mantiene en el día a día.
Adaptación al nivel del equipo
Antes de impartir, hacemos un breve diagnóstico y ajustamos profundidad y ritmo. La formación no se queda corta ni avanza por encima del grupo.
Modalidades disponibles
Cada formato puede adaptarse al ritmo y al contexto operativo de la organización.
Online en directo
Sesiones en streaming con interacción en vivo, ejercicios guiados y resolución de dudas.
In-company
Programa diseñado a medida y impartido para un único equipo o organización.
A medida
Itinerario completamente personalizado: temario, duración, formato y casos del cliente.
¿Por qué contratar este programa para tu equipo?
La formación no se diseña contra un examen, se diseña contra un objetivo de negocio.
- Mejora de productividad real en el puesto de trabajo.
- Actualización de competencias clave para el negocio.
- Mayor autonomía técnica y reducción de dependencia externa.
- Aplicación práctica inmediata sobre procesos del cliente.
- Mejor adopción tecnológica con criterios profesionales.
- Preparación para proyectos de IA, datos, automatización o desarrollo.
¿Se puede gestionar como formación bonificada?
Este curso puede plantearse como formación para empresas y, según las condiciones de cada organización, podría gestionarse dentro de iniciativas de formación bonificada. En DatIACode te ayudamos a estructurar la propuesta formativa y la documentación necesaria para su valoración.
¿Qué necesitas saber antes de empezar?
- Experiencia trabajando en o con una plataforma de datos: lake, warehouse o lakehouse.
- Conocimientos de SQL y de pipelines de datos a nivel funcional.
- No se requiere experiencia previa con herramientas de gobierno.
Cómo se aplica lo aprendido
- Implantación de un catálogo de datos con glosario de negocio adoptado por los equipos.
- Automatización de tests de calidad en los pipelines de la plataforma.
- Resolución de discrepancias entre informes mediante definiciones y linaje.
- Análisis de impacto previo a cambios de esquema en tablas compartidas.
- Formalización de data contracts entre equipos productores y consumidores.
- Preparación de la plataforma para auditorías y requisitos de cumplimiento.
Por qué elegir DatIACode
No vendemos formación: diseñamos programas que se traducen en capacidad operativa real.
Experiencia aplicada
Más de 20 años combinando consultoría, desarrollo y formación tecnológica para empresas de distintos sectores.
Visión de negocio
Cada programa parte de los objetivos del cliente. La técnica está al servicio del problema, no al revés.
Adaptación al equipo
Ajustamos profundidad, ritmo y casos de uso al nivel real del equipo tras un breve diagnóstico inicial.
Formación + consultoría
Si la formación destapa un proyecto, podemos acompañarte en su implantación. No abandonamos el resultado.
Especialización en IA
Trabajamos en IA aplicada todos los días. La formación no la imparte alguien que solo enseña, la imparte alguien que también construye.
Orientación a resultados
Entregables tangibles y métricas pactadas. Sin promesas vacías.
FAQ
Es ambos a propósito, porque el gobierno del dato fracasa cuando se aborda solo desde un lado. La parte técnica trabaja con herramientas reales —catálogos, Great Expectations o Soda, linaje—; la organizativa cubre roles, ownership, data contracts y plan de implantación. Perfiles técnicos y funcionales salen con piezas distintas pero complementarias del mismo sistema.
Cuéntanos qué necesitas
Te respondemos en menos de 24h laborables con disponibilidad, opciones de modalidad y propuesta a medida si aplica.
- Diagnóstico inicial sin compromiso.
- Propuesta adaptada al nivel y al sector.
- Asesoramiento sobre formación bonificada.
Cursos relacionados
Ver todos los cursos- Ver curso
Big Data20 horasFundamentos de Big Data y arquitecturas de datos modernas
- Ver curso
Big Data20 horasData Lakes y Lakehouse: Delta Lake y Databricks
- Ver curso
IA16 horasGobernanza de la IA y cumplimiento del AI Act
