¿Qué versión de Airflow se utiliza?

Se trabaja con una versión estable reciente de Airflow, usando la TaskFlow API como estilo principal de desarrollo. Se señalan las diferencias relevantes con el estilo clásico de operadores para quien mantenga DAGs antiguos.

¿Airflow sirve también para streaming?

No es su terreno. Airflow orquesta procesos batch y programados; para flujos de eventos en tiempo real la herramienta adecuada es Kafka con un motor de streaming. En el curso se delimita claramente esa frontera y cómo combinar ambos mundos.

¿Se cubren los servicios gestionados de Airflow en cloud?

Sí. Se comparan las opciones gestionadas (MWAA en AWS, Cloud Composer en Google Cloud y Astronomer) frente al autodespliegue, con criterios de coste, operación y límites de cada una.

¿Puede impartirse para empresas?

Sí. Todos nuestros cursos pueden impartirse en formato in-company, adaptando temario, duración y nivel al equipo. Diseñamos el itinerario tras un breve diagnóstico previo.

¿El curso es práctico?

Sí. Combinamos explicación, demostración guiada y laboratorios. Cada alumno trabaja sobre casos reales y termina con entregables aplicables a su contexto profesional.

¿Se entrega certificado de aprovechamiento?

Sí. Al finalizar el curso emitimos un certificado de aprovechamiento de DatIACode con detalle del temario y horas. Si el curso prepara para certificación oficial, lo indicaremos expresamente en su descripción.

Todos los cursos Big Data

Formación DatIACode

Airflow para orquestación de pipelines de datos

Aprende a orquestar pipelines de datos con Apache Airflow: diseño de DAGs mantenibles, scheduling, dependencias, sensores, gestión de fallos, backfills y despliegue en producción.

Nivel: Intermedio
Duración: 20 horas
Modalidades: Online en directo · In-company · A medida
Dirigido a: Ingenieros de datos y desarrolladores que automatizan pipelines de datos.

Sobre el curso

¿Qué es este curso y por qué te interesa?

Cuando los pipelines de datos crecen, los cron jobs y scripts encadenados dejan de ser viables: no hay reintentos, ni visibilidad de fallos, ni gestión de dependencias entre procesos. Apache Airflow es el orquestador de referencia para resolver ese problema: define los flujos como código Python, gestiona el scheduling y ofrece trazabilidad completa de cada ejecución.

Este curso enseña Airflow desde la base hasta producción: diseño de DAGs con la TaskFlow API, scheduling e intervalos de datos, sensores y dependencias entre flujos, gestión de fallos y reintentos, backfills, conexión con bases de datos y servicios cloud, y las decisiones de despliegue que determinan que Airflow funcione de forma fiable en tu organización.

Qué aprenderás

Capacidades que adquirirás

Diseñar DAGs mantenibles con la TaskFlow API y buenas decisiones de estructura.
Dominar el scheduling: intervalos de datos, catchup, backfills y ejecuciones manuales.
Conectar Airflow con bases de datos, APIs y servicios cloud mediante providers y hooks.
Gestionar fallos con reintentos, alertas, SLAs y dependencias entre DAGs.
Desplegar y operar Airflow con criterio: executors, escalado y monitorización.

Objetivos

Objetivos del curso

01Comprender la arquitectura de Airflow: scheduler, executor, workers y metadata database.
02Escribir DAGs idempotentes y testeables siguiendo buenas prácticas establecidas.
03Configurar scheduling avanzado con datasets, sensores y triggers.
04Implementar pipelines reales de extracción, transformación y carga.
05Diagnosticar y recuperar fallos: reintentos, backfills y reprocesados.
06Evaluar opciones de despliegue: contenedores, Kubernetes y servicios gestionados.

A quién va dirigido

¿Es este curso para ti o para tu equipo?

Ingenieros de datos y desarrolladores que automatizan pipelines de datos.

Ingenieros de datos

Profesionales que construyen y mantienen pipelines y necesitan orquestarlos con fiabilidad y trazabilidad.

Desarrolladores backend y de automatización

Programadores Python que heredan o crean procesos de datos programados y quieren profesionalizarlos.

Equipos de plataforma de datos

Equipos que operan la infraestructura de datos y deben desplegar y escalar Airflow para varios consumidores.

Temario

Temario completo

Programa estructurado en módulos. Cada itinerario in-company se ajusta al nivel y a los objetivos concretos del equipo.

- Qué resuelve un orquestador frente a cron y scripts encadenados.
- Arquitectura: scheduler, executor, workers y metadata database.
- Instalación local con Docker Compose y recorrido por la UI.

Metodología

Cómo se imparte

Práctica desde la primera sesión

Cada bloque combina explicación, demostración y laboratorio. Los alumnos trabajan sobre casos reales aplicables a su contexto profesional.

Casos de cliente

En programas in-company partimos de los procesos y datos del cliente. La formación deja de sonar genérica y empieza a resolver problemas concretos.

Materiales de apoyo

Los participantes reciben código, plantillas y guías reutilizables tras la formación. Lo que se aprende se mantiene en el día a día.

Adaptación al nivel del equipo

Antes de impartir, hacemos un breve diagnóstico y ajustamos profundidad y ritmo. La formación no se queda corta ni avanza por encima del grupo.

Modalidades

Modalidades disponibles

Cada formato puede adaptarse al ritmo y al contexto operativo de la organización.

Online en directo

Sesiones en streaming con interacción en vivo, ejercicios guiados y resolución de dudas.

In-company

Programa diseñado a medida y impartido para un único equipo o organización.

A medida

Itinerario completamente personalizado: temario, duración, formato y casos del cliente.

Beneficios para empresas

¿Por qué contratar este programa para tu equipo?

La formación no se diseña contra un examen, se diseña contra un objetivo de negocio.

Mejora de productividad real en el puesto de trabajo.
Actualización de competencias clave para el negocio.
Mayor autonomía técnica y reducción de dependencia externa.
Aplicación práctica inmediata sobre procesos del cliente.
Mejor adopción tecnológica con criterios profesionales.
Preparación para proyectos de IA, datos, automatización o desarrollo.

Formación bonificada

¿Se puede gestionar como formación bonificada?

Este curso puede plantearse como formación para empresas y, según las condiciones de cada organización, podría gestionarse dentro de iniciativas de formación bonificada. En DatIACode te ayudamos a estructurar la propuesta formativa y la documentación necesaria para su valoración.

Requisitos previos

¿Qué necesitas saber antes de empezar?

Conocimientos de Python a nivel intermedio.
Experiencia básica con SQL y bases de datos.
Nociones de Docker recomendadas para el entorno de trabajo.

Aplicaciones

Cómo se aplica lo aprendido

Orquestación de procesos ETL y ELT diarios sobre el data warehouse.
Automatización de ingestas desde APIs, ficheros y bases de datos.
Coordinación de trabajos Spark y transformaciones con dbt.
Reprocesado controlado de históricos tras cambios de lógica.
Sustitución de cron jobs y scripts encadenados sin visibilidad.

DatIACode

Por qué elegir DatIACode

No vendemos formación: diseñamos programas que se traducen en capacidad operativa real.

Experiencia aplicada

Más de 20 años combinando consultoría, desarrollo y formación tecnológica para empresas de distintos sectores.

Visión de negocio

Cada programa parte de los objetivos del cliente. La técnica está al servicio del problema, no al revés.

Adaptación al equipo

Ajustamos profundidad, ritmo y casos de uso al nivel real del equipo tras un breve diagnóstico inicial.

Formación + consultoría

Si la formación destapa un proyecto, podemos acompañarte en su implantación. No abandonamos el resultado.

Especialización en IA

Trabajamos en IA aplicada todos los días. La formación no la imparte alguien que solo enseña, la imparte alguien que también construye.

Orientación a resultados

Entregables tangibles y métricas pactadas. Sin promesas vacías.

Preguntas frecuentes

FAQ

Se trabaja con una versión estable reciente de Airflow, usando la TaskFlow API como estilo principal de desarrollo. Se señalan las diferencias relevantes con el estilo clásico de operadores para quien mantenga DAGs antiguos.

Solicitar información

Cuéntanos qué necesitas

Te respondemos en menos de 24h laborables con disponibilidad, opciones de modalidad y propuesta a medida si aplica.

Diagnóstico inicial sin compromiso.
Propuesta adaptada al nivel y al sector.
Asesoramiento sobre formación bonificada.

Nombre*

Email*

Empresa

Teléfono

Cargo

Sector

Modalidad de interés*

Número aproximado de alumnos*

Mensaje*

He leído y acepto la Política de Privacidad.Acepto recibir comunicaciones comerciales de DatIACode sobre cursos y novedades. Es opcional y puedo darme de baja en cualquier momento.

Información básica de protección de datos. Responsable: Datiacode Tech S.L.. Finalidad: atender tu solicitud y, si lo aceptas, enviarte comunicaciones comerciales. Legitimación: consentimiento del interesado y/o medidas precontractuales. Destinatarios: encargados de tratamiento descritos en la política. Derechos: acceso, rectificación, supresión, oposición, limitación y portabilidad escribiendo a privacidad@datiacode.com. Más información en la Política de Privacidad.

Ver todos los cursos

Ver curso
Big Data20 horas
Fundamentos de Big Data y arquitecturas de datos modernas
Ver curso
Big Data30 horas
Apache Spark con Databricks — Procesamiento a gran escala
Ver curso
Big Data30 horas
Apache Kafka — Data Streaming: fundamentos, producers y consumers