Apache NiFi para ingesta y automatización de flujos
Domina la ingesta de datos con Apache NiFi: diseño visual de flujos, procesadores y conexiones, trazabilidad con data provenance e integración con Kafka, bases de datos y APIs, con buenas prácticas de despliegue.
- Nivel
- Intermedio
- Duración
- 16 horas
- Modalidades
- Online en directo · In-company · A medida
- Dirigido a
- Ingenieros de datos e integradores que necesitan ingestar datos de múltiples fuentes sin programar cada conector.

¿Qué es este curso y por qué te interesa?
Antes de analizar nada, los datos tienen que llegar: de ficheros que aparecen en un SFTP, de bases de datos transaccionales, de APIs de terceros, de sensores o de colas de mensajes. Programar un conector a medida para cada fuente es caro de construir y carísimo de mantener. Apache NiFi resuelve ese problema con un enfoque distinto: flujos de datos diseñados visualmente, con cientos de procesadores listos para usar y trazabilidad completa de cada dato que pasa por el sistema.
Este curso enseña NiFi desde su modelo de funcionamiento —FlowFiles, procesadores, conexiones y back pressure— hasta la construcción de flujos completos de ingesta: recoger ficheros, consultar bases de datos de forma incremental, consumir y publicar en Kafka, llamar a APIs REST y enrutar, transformar y enriquecer los datos por el camino. La trazabilidad se trabaja con data provenance, una de las capacidades más diferenciales de NiFi para auditoría y depuración.
El curso cierra con la parte que separa una prueba de concepto de un despliegue serio: organización de flujos con process groups, parametrización por entorno, control de versiones con NiFi Registry, gestión de errores y reintentos, y criterios de despliegue y dimensionado. Cada bloque se practica sobre escenarios de integración reales de empresa.
Capacidades que adquirirás
- Entender el modelo de NiFi: FlowFiles, procesadores, conexiones, back pressure y prioridades.
- Construir flujos de ingesta desde ficheros, bases de datos, APIs REST y Kafka.
- Enrutar, transformar y enriquecer datos en tránsito con procesadores y Expression Language.
- Auditar y depurar flujos con data provenance: el recorrido completo de cada dato.
- Organizar, versionar y desplegar flujos con process groups, parámetros y NiFi Registry.
Objetivos del curso
- 01Dominar la interfaz y el modelo de ejecución de NiFi para diseñar flujos con criterio.
- 02Implementar ingestas incrementales desde bases de datos sin recargar datos ya procesados.
- 03Integrar NiFi con Kafka como productor y consumidor dentro de una arquitectura de datos.
- 04Aplicar gestión de errores, reintentos y colas de fallos en flujos de producción.
- 05Versionar flujos con NiFi Registry y promocionarlos entre entornos con parámetros.
- 06Construir un flujo de ingesta completo y trazable como proyecto final.
¿Es este curso para ti o para tu equipo?
Ingenieros de datos e integradores que necesitan ingestar datos de múltiples fuentes sin programar cada conector.
Ingenieros de datos e integración
Profesionales que construyen y mantienen ingestas desde múltiples fuentes y buscan reducir el código a medida y su mantenimiento.
Administradores y técnicos de sistemas
Perfiles que gestionan movimientos de ficheros y datos entre sistemas con scripts y quieren una plataforma trazable y gobernada.
Equipos de plataformas Big Data
Equipos que necesitan alimentar data lakes y plataformas de streaming con datos de sistemas heterogéneos de la organización.
Temario completo
Programa estructurado en módulos. Cada itinerario in-company se ajusta al nivel y a los objetivos concretos del equipo.
- Qué resuelve NiFi y dónde encaja frente a Airflow, Kafka Connect o un ETL clásico.
- FlowFiles: contenido y atributos, el dato y su metadato viajando juntos.
- Procesadores, conexiones, colas y relaciones: la anatomía de un flujo.
- Back pressure y priorización: qué pasa cuando el destino no da abasto.
Cómo se imparte
Práctica desde la primera sesión
Cada bloque combina explicación, demostración y laboratorio. Los alumnos trabajan sobre casos reales aplicables a su contexto profesional.
Casos de cliente
En programas in-company partimos de los procesos y datos del cliente. La formación deja de sonar genérica y empieza a resolver problemas concretos.
Materiales de apoyo
Los participantes reciben código, plantillas y guías reutilizables tras la formación. Lo que se aprende se mantiene en el día a día.
Adaptación al nivel del equipo
Antes de impartir, hacemos un breve diagnóstico y ajustamos profundidad y ritmo. La formación no se queda corta ni avanza por encima del grupo.
Modalidades disponibles
Cada formato puede adaptarse al ritmo y al contexto operativo de la organización.
Online en directo
Sesiones en streaming con interacción en vivo, ejercicios guiados y resolución de dudas.
In-company
Programa diseñado a medida y impartido para un único equipo o organización.
A medida
Itinerario completamente personalizado: temario, duración, formato y casos del cliente.
¿Por qué contratar este programa para tu equipo?
La formación no se diseña contra un examen, se diseña contra un objetivo de negocio.
- Mejora de productividad real en el puesto de trabajo.
- Actualización de competencias clave para el negocio.
- Mayor autonomía técnica y reducción de dependencia externa.
- Aplicación práctica inmediata sobre procesos del cliente.
- Mejor adopción tecnológica con criterios profesionales.
- Preparación para proyectos de IA, datos, automatización o desarrollo.
¿Se puede gestionar como formación bonificada?
Este curso puede plantearse como formación para empresas y, según las condiciones de cada organización, podría gestionarse dentro de iniciativas de formación bonificada. En DatIACode te ayudamos a estructurar la propuesta formativa y la documentación necesaria para su valoración.
¿Qué necesitas saber antes de empezar?
- Conocimientos básicos de SQL y de bases de datos relacionales.
- Familiaridad con formatos de datos habituales: CSV, JSON y similares.
- No se requiere experiencia previa con NiFi ni saber programar, aunque ayuda.
Cómo se aplica lo aprendido
- Ingesta continua de ficheros, bases de datos y APIs hacia el data lake.
- Sustitución de scripts de transferencia frágiles por flujos trazables y monitorizados.
- Alimentación de Kafka desde sistemas que no pueden publicar eventos por sí mismos.
- Enrutado y distribución de datos entre sistemas con reglas de negocio.
- Auditoría del recorrido de datos sensibles con data provenance.
- Ingesta de datos de sensores y dispositivos en escenarios IoT.
Por qué elegir DatIACode
No vendemos formación: diseñamos programas que se traducen en capacidad operativa real.
Experiencia aplicada
Más de 20 años combinando consultoría, desarrollo y formación tecnológica para empresas de distintos sectores.
Visión de negocio
Cada programa parte de los objetivos del cliente. La técnica está al servicio del problema, no al revés.
Adaptación al equipo
Ajustamos profundidad, ritmo y casos de uso al nivel real del equipo tras un breve diagnóstico inicial.
Formación + consultoría
Si la formación destapa un proyecto, podemos acompañarte en su implantación. No abandonamos el resultado.
Especialización en IA
Trabajamos en IA aplicada todos los días. La formación no la imparte alguien que solo enseña, la imparte alguien que también construye.
Orientación a resultados
Entregables tangibles y métricas pactadas. Sin promesas vacías.
FAQ
Son complementarias y el curso dedica tiempo a delimitarlo: NiFi mueve y transforma datos en flujo continuo, con back pressure y trazabilidad por dato; Airflow orquesta procesos batch programados con dependencias. Muchas plataformas usan ambos: NiFi para la ingesta y Airflow para la orquestación de transformaciones posteriores.
Cuéntanos qué necesitas
Te respondemos en menos de 24h laborables con disponibilidad, opciones de modalidad y propuesta a medida si aplica.
- Diagnóstico inicial sin compromiso.
- Propuesta adaptada al nivel y al sector.
- Asesoramiento sobre formación bonificada.
Cursos relacionados
Ver todos los cursos- Ver curso
Big Data30 horasApache Kafka — Data Streaming: fundamentos, producers y consumers
- Ver curso
Big Data20 horasAirflow para orquestación de pipelines de datos
- Ver curso
Big Data20 horasFundamentos de Big Data y arquitecturas de datos modernas
