Saltar al contenido principal
Categoría · 12 cursos disponibles

Cursos de Big Data: ingesta, procesamiento y analítica a gran escala

Forma a tu equipo en las tecnologías clave del ecosistema Big Data: streaming con Kafka, procesamiento con Spark, búsquedas con ELK y NoSQL con MongoDB.

StreamingSparkBúsquedaNoSQL
Ilustración de procesamiento de Big Data a gran escala
Sobre la categoría

¿Qué incluye esta categoría?

Big Data ya no es un proyecto aislado: es la columna sobre la que se apoyan analítica avanzada, IA y operaciones inteligentes. Construir bien esa columna evita reescrituras, costes inflados y proyectos parados a mitad de camino.

En esta categoría agrupamos cursos sobre las tecnologías que sostienen una arquitectura de datos moderna — Kafka para streaming, Spark + Databricks para procesamiento, ELK para observabilidad y búsqueda, MongoDB para almacenamiento operacional. Foco práctico, casos reales y patrones probados en producción.

Cursos disponibles (12)

Ver curso

Curso de ELK Stack — Elasticsearch, Logstash y Kibana

Domina la observabilidad y búsqueda con ELK: Elasticsearch, Logstash y Kibana en arquitecturas reales.

  • Intermedio
  • 30 horas
  • Online en directo
Ver curso
Ver curso

Apache Kafka — Data Streaming: fundamentos, producers y consumers

Aprende streaming con Apache Kafka desde fundamentos hasta despliegue en producción.

  • Intermedio
  • 30 horas
  • Online en directo
Ver curso
Ver curso

MongoDB con PyMongo

Modelado, consultas e integración Python con la base NoSQL líder.

  • Intermedio
  • 20 horas
  • Online en directo
Ver curso
Ver curso

Apache Spark con Databricks — Procesamiento a gran escala

Procesa datos a gran escala con Spark y Databricks: lakehouse moderno y rendimiento real.

  • Intermedio
  • 30 horas
  • Online en directo
Ver curso
Ver curso

Apache Spark avanzado: optimización y rendimiento

Lleva tus jobs de Spark al siguiente nivel: particionado y shuffles con criterio, Catalyst y AQE, gestión de memoria, tratamiento del skew y diagnóstico sistemático con Spark UI para reducir tiempos y costes de cluster.

  • Avanzado
  • 20 horas
  • Online en directo
Ver curso
Ver curso

Apache Kafka avanzado: arquitecturas event-driven

Da el salto de usar Kafka a diseñar con Kafka: arquitecturas orientadas a eventos con Kafka Streams y Connect, Schema Registry, garantías exactly-once, patrones event sourcing y CQRS, y operación y dimensionado de clusters.

  • Avanzado
  • 20 horas
  • Online en directo
Ver curso
Ver curso

Apache NiFi para ingesta y automatización de flujos

Domina la ingesta de datos con Apache NiFi: diseño visual de flujos, procesadores y conexiones, trazabilidad con data provenance e integración con Kafka, bases de datos y APIs, con buenas prácticas de despliegue.

  • Intermedio
  • 16 horas
  • Online en directo
Ver curso
Ver curso

Data Lakes y Lakehouse: Delta Lake y Databricks

Construye un lakehouse sobre Databricks: arquitectura medallion, Delta Lake con transacciones ACID, time travel y schema evolution, gobierno con Unity Catalog y optimización de tablas para consultas rápidas y fiables.

  • Intermedio
  • 20 horas
  • Online en directo
Ver curso
Ver curso

Procesamiento en tiempo real con Kafka y Spark Streaming

Construye pipelines de streaming de extremo a extremo: Structured Streaming sobre Kafka, ventanas y watermarks, agregaciones con estado, escritura fiable en sinks y tolerancia a fallos con checkpointing en producción.

  • Avanzado
  • 20 horas
  • Online en directo
Ver curso
Ver curso

Gobierno, calidad y linaje del dato en Big Data

Implanta gobierno del dato en tu plataforma Big Data: catálogo de datos, reglas y tests de calidad, linaje de extremo a extremo, roles y ownership, data contracts entre equipos y cumplimiento normativo aplicado.

  • Intermedio
  • 16 horas
  • Online en directo
Ver curso
Ver curso

Fundamentos de Big Data y arquitecturas de datos modernas

Entiende el ecosistema Big Data con criterio: del data warehouse al lakehouse, procesamiento batch y streaming, formatos como Parquet e Iceberg, y cómo elegir arquitectura según el caso de uso.

  • Iniciación
  • 20 horas
  • Online en directo
Ver curso
Ver curso

Airflow para orquestación de pipelines de datos

Aprende a orquestar pipelines de datos con Apache Airflow: diseño de DAGs mantenibles, scheduling, dependencias, sensores, gestión de fallos, backfills y despliegue en producción.

  • Intermedio
  • 20 horas
  • Online en directo
Ver curso

Explora otras categorías