Saltar al contenido principal
Formación DatIACode

Apache NiFi para ingesta y automatización de flujos

Domina la ingesta de datos con Apache NiFi: diseño visual de flujos, procesadores y conexiones, trazabilidad con data provenance e integración con Kafka, bases de datos y APIs, con buenas prácticas de despliegue.

Nivel
Intermedio
Duración
16 horas
Modalidades
Online en directo · In-company · A medida
Dirigido a
Ingenieros de datos e integradores que necesitan ingestar datos de múltiples fuentes sin programar cada conector.
Sobre el curso

¿Qué es este curso y por qué te interesa?

Antes de analizar nada, los datos tienen que llegar: de ficheros que aparecen en un SFTP, de bases de datos transaccionales, de APIs de terceros, de sensores o de colas de mensajes. Programar un conector a medida para cada fuente es caro de construir y carísimo de mantener. Apache NiFi resuelve ese problema con un enfoque distinto: flujos de datos diseñados visualmente, con cientos de procesadores listos para usar y trazabilidad completa de cada dato que pasa por el sistema.

Este curso enseña NiFi desde su modelo de funcionamiento —FlowFiles, procesadores, conexiones y back pressure— hasta la construcción de flujos completos de ingesta: recoger ficheros, consultar bases de datos de forma incremental, consumir y publicar en Kafka, llamar a APIs REST y enrutar, transformar y enriquecer los datos por el camino. La trazabilidad se trabaja con data provenance, una de las capacidades más diferenciales de NiFi para auditoría y depuración.

El curso cierra con la parte que separa una prueba de concepto de un despliegue serio: organización de flujos con process groups, parametrización por entorno, control de versiones con NiFi Registry, gestión de errores y reintentos, y criterios de despliegue y dimensionado. Cada bloque se practica sobre escenarios de integración reales de empresa.

Qué aprenderás

Capacidades que adquirirás

  • Entender el modelo de NiFi: FlowFiles, procesadores, conexiones, back pressure y prioridades.
  • Construir flujos de ingesta desde ficheros, bases de datos, APIs REST y Kafka.
  • Enrutar, transformar y enriquecer datos en tránsito con procesadores y Expression Language.
  • Auditar y depurar flujos con data provenance: el recorrido completo de cada dato.
  • Organizar, versionar y desplegar flujos con process groups, parámetros y NiFi Registry.
Objetivos

Objetivos del curso

  1. 01Dominar la interfaz y el modelo de ejecución de NiFi para diseñar flujos con criterio.
  2. 02Implementar ingestas incrementales desde bases de datos sin recargar datos ya procesados.
  3. 03Integrar NiFi con Kafka como productor y consumidor dentro de una arquitectura de datos.
  4. 04Aplicar gestión de errores, reintentos y colas de fallos en flujos de producción.
  5. 05Versionar flujos con NiFi Registry y promocionarlos entre entornos con parámetros.
  6. 06Construir un flujo de ingesta completo y trazable como proyecto final.
A quién va dirigido

¿Es este curso para ti o para tu equipo?

Ingenieros de datos e integradores que necesitan ingestar datos de múltiples fuentes sin programar cada conector.

Ingenieros de datos e integración

Profesionales que construyen y mantienen ingestas desde múltiples fuentes y buscan reducir el código a medida y su mantenimiento.

Administradores y técnicos de sistemas

Perfiles que gestionan movimientos de ficheros y datos entre sistemas con scripts y quieren una plataforma trazable y gobernada.

Equipos de plataformas Big Data

Equipos que necesitan alimentar data lakes y plataformas de streaming con datos de sistemas heterogéneos de la organización.

Temario

Temario completo

Programa estructurado en módulos. Cada itinerario in-company se ajusta al nivel y a los objetivos concretos del equipo.

    • Qué resuelve NiFi y dónde encaja frente a Airflow, Kafka Connect o un ETL clásico.
    • FlowFiles: contenido y atributos, el dato y su metadato viajando juntos.
    • Procesadores, conexiones, colas y relaciones: la anatomía de un flujo.
    • Back pressure y priorización: qué pasa cuando el destino no da abasto.
Metodología

Cómo se imparte

Práctica desde la primera sesión

Cada bloque combina explicación, demostración y laboratorio. Los alumnos trabajan sobre casos reales aplicables a su contexto profesional.

Casos de cliente

En programas in-company partimos de los procesos y datos del cliente. La formación deja de sonar genérica y empieza a resolver problemas concretos.

Materiales de apoyo

Los participantes reciben código, plantillas y guías reutilizables tras la formación. Lo que se aprende se mantiene en el día a día.

Adaptación al nivel del equipo

Antes de impartir, hacemos un breve diagnóstico y ajustamos profundidad y ritmo. La formación no se queda corta ni avanza por encima del grupo.

Modalidades

Modalidades disponibles

Cada formato puede adaptarse al ritmo y al contexto operativo de la organización.

Online en directo

Sesiones en streaming con interacción en vivo, ejercicios guiados y resolución de dudas.

In-company

Programa diseñado a medida y impartido para un único equipo o organización.

A medida

Itinerario completamente personalizado: temario, duración, formato y casos del cliente.

Beneficios para empresas

¿Por qué contratar este programa para tu equipo?

La formación no se diseña contra un examen, se diseña contra un objetivo de negocio.

  • Mejora de productividad real en el puesto de trabajo.
  • Actualización de competencias clave para el negocio.
  • Mayor autonomía técnica y reducción de dependencia externa.
  • Aplicación práctica inmediata sobre procesos del cliente.
  • Mejor adopción tecnológica con criterios profesionales.
  • Preparación para proyectos de IA, datos, automatización o desarrollo.
Formación bonificada

¿Se puede gestionar como formación bonificada?

Este curso puede plantearse como formación para empresas y, según las condiciones de cada organización, podría gestionarse dentro de iniciativas de formación bonificada. En DatIACode te ayudamos a estructurar la propuesta formativa y la documentación necesaria para su valoración.

Requisitos previos

¿Qué necesitas saber antes de empezar?

  • Conocimientos básicos de SQL y de bases de datos relacionales.
  • Familiaridad con formatos de datos habituales: CSV, JSON y similares.
  • No se requiere experiencia previa con NiFi ni saber programar, aunque ayuda.
Aplicaciones

Cómo se aplica lo aprendido

  • Ingesta continua de ficheros, bases de datos y APIs hacia el data lake.
  • Sustitución de scripts de transferencia frágiles por flujos trazables y monitorizados.
  • Alimentación de Kafka desde sistemas que no pueden publicar eventos por sí mismos.
  • Enrutado y distribución de datos entre sistemas con reglas de negocio.
  • Auditoría del recorrido de datos sensibles con data provenance.
  • Ingesta de datos de sensores y dispositivos en escenarios IoT.
DatIACode

Por qué elegir DatIACode

No vendemos formación: diseñamos programas que se traducen en capacidad operativa real.

Experiencia aplicada

Más de 20 años combinando consultoría, desarrollo y formación tecnológica para empresas de distintos sectores.

Visión de negocio

Cada programa parte de los objetivos del cliente. La técnica está al servicio del problema, no al revés.

Adaptación al equipo

Ajustamos profundidad, ritmo y casos de uso al nivel real del equipo tras un breve diagnóstico inicial.

Formación + consultoría

Si la formación destapa un proyecto, podemos acompañarte en su implantación. No abandonamos el resultado.

Especialización en IA

Trabajamos en IA aplicada todos los días. La formación no la imparte alguien que solo enseña, la imparte alguien que también construye.

Orientación a resultados

Entregables tangibles y métricas pactadas. Sin promesas vacías.

Preguntas frecuentes

FAQ

  • Son complementarias y el curso dedica tiempo a delimitarlo: NiFi mueve y transforma datos en flujo continuo, con back pressure y trazabilidad por dato; Airflow orquesta procesos batch programados con dependencias. Muchas plataformas usan ambos: NiFi para la ingesta y Airflow para la orquestación de transformaciones posteriores.

Solicitar información

Cuéntanos qué necesitas

Te respondemos en menos de 24h laborables con disponibilidad, opciones de modalidad y propuesta a medida si aplica.

  • Diagnóstico inicial sin compromiso.
  • Propuesta adaptada al nivel y al sector.
  • Asesoramiento sobre formación bonificada.
Modalidad de interés*
Número aproximado de alumnos*

Información básica de protección de datos. Responsable: Datiacode Tech S.L.. Finalidad: atender tu solicitud y, si lo aceptas, enviarte comunicaciones comerciales. Legitimación: consentimiento del interesado y/o medidas precontractuales. Destinatarios: encargados de tratamiento descritos en la política. Derechos: acceso, rectificación, supresión, oposición, limitación y portabilidad escribiendo a privacidad@datiacode.com. Más información en la Política de Privacidad.

  • Ver curso
    Big Data30 horas

    Apache Kafka — Data Streaming: fundamentos, producers y consumers

  • Ver curso
    Big Data20 horas

    Airflow para orquestación de pipelines de datos

  • Ver curso
    Big Data20 horas

    Fundamentos de Big Data y arquitecturas de datos modernas

Ver todos los cursos