Fundamentos de Big Data y arquitecturas de datos modernas
Entiende el ecosistema Big Data con criterio: del data warehouse al lakehouse, procesamiento batch y streaming, formatos como Parquet e Iceberg, y cómo elegir arquitectura según el caso de uso.
- Nivel
- Iniciación
- Duración
- 20 horas
- Modalidades
- Online en directo · In-company · A medida
- Dirigido a
- Perfiles técnicos y de negocio que se inician en el mundo del dato a escala.

¿Qué es este curso y por qué te interesa?
El ecosistema de datos se ha vuelto difícil de navegar: data warehouse, data lake, lakehouse, batch, streaming, decenas de herramientas y proveedores que prometen resolverlo todo. Sin un mapa conceptual claro, las organizaciones acaban eligiendo tecnología por inercia o por moda, con arquitecturas sobredimensionadas o incapaces de crecer con el negocio.
Este curso construye ese mapa. Recorre la evolución de las arquitecturas de datos, los formatos y tecnologías clave (Parquet, Iceberg, Spark, Kafka), las diferencias reales entre batch y streaming, y los criterios para dimensionar una arquitectura según volumen, latencia y equipo. El objetivo no es programar, sino entender el ecosistema completo y poder tomar o evaluar decisiones tecnológicas con fundamento.
Capacidades que adquirirás
- Situar cada pieza del ecosistema: warehouse, lake, lakehouse y cuándo encaja cada uno.
- Entender los formatos y tecnologías clave: Parquet, Iceberg, Spark, Kafka y motores SQL.
- Diferenciar procesamiento batch y streaming y elegir según latencia y caso de uso.
- Conocer el ciclo de vida del dato: ingesta, almacenamiento, transformación y consumo.
- Aplicar criterios de gobierno, calidad y coste al diseño de una plataforma de datos.
Objetivos del curso
- 01Comprender la evolución de las arquitecturas de datos y el porqué de cada paradigma.
- 02Identificar los componentes de una plataforma de datos moderna y su función.
- 03Distinguir casos de uso batch y streaming con sus tecnologías asociadas.
- 04Evaluar formatos de almacenamiento y tablas abiertas: Parquet, Iceberg, Delta.
- 05Entender los fundamentos de gobierno del dato: catálogo, calidad, linaje y acceso.
- 06Dimensionar una arquitectura según volumen, latencia, equipo y presupuesto.
¿Es este curso para ti o para tu equipo?
Perfiles técnicos y de negocio que se inician en el mundo del dato a escala.
Perfiles técnicos que entran al mundo del dato
Desarrolladores, administradores y analistas que necesitan entender el ecosistema antes de especializarse.
Responsables técnicos y de negocio
Perfiles que toman o validan decisiones de inversión en plataformas de datos y necesitan criterio propio.
Analistas de datos
Profesionales que consumen datos y quieren entender la plataforma que los produce para trabajar mejor con ingeniería.
Temario completo
Programa estructurado en módulos. Cada itinerario in-company se ajusta al nivel y a los objetivos concretos del equipo.
- Qué es Big Data realmente: volumen, velocidad y variedad en contexto.
- Evolución: del data warehouse al data lake y al lakehouse.
- Roles del dato: ingeniero, analista, científico y plataforma.
Cómo se imparte
Práctica desde la primera sesión
Cada bloque combina explicación, demostración y laboratorio. Los alumnos trabajan sobre casos reales aplicables a su contexto profesional.
Casos de cliente
En programas in-company partimos de los procesos y datos del cliente. La formación deja de sonar genérica y empieza a resolver problemas concretos.
Materiales de apoyo
Los participantes reciben código, plantillas y guías reutilizables tras la formación. Lo que se aprende se mantiene en el día a día.
Adaptación al nivel del equipo
Antes de impartir, hacemos un breve diagnóstico y ajustamos profundidad y ritmo. La formación no se queda corta ni avanza por encima del grupo.
Modalidades disponibles
Cada formato puede adaptarse al ritmo y al contexto operativo de la organización.
Online en directo
Sesiones en streaming con interacción en vivo, ejercicios guiados y resolución de dudas.
In-company
Programa diseñado a medida y impartido para un único equipo o organización.
A medida
Itinerario completamente personalizado: temario, duración, formato y casos del cliente.
¿Por qué contratar este programa para tu equipo?
La formación no se diseña contra un examen, se diseña contra un objetivo de negocio.
- Mejora de productividad real en el puesto de trabajo.
- Actualización de competencias clave para el negocio.
- Mayor autonomía técnica y reducción de dependencia externa.
- Aplicación práctica inmediata sobre procesos del cliente.
- Mejor adopción tecnológica con criterios profesionales.
- Preparación para proyectos de IA, datos, automatización o desarrollo.
¿Se puede gestionar como formación bonificada?
Este curso puede plantearse como formación para empresas y, según las condiciones de cada organización, podría gestionarse dentro de iniciativas de formación bonificada. En DatIACode te ayudamos a estructurar la propuesta formativa y la documentación necesaria para su valoración.
¿Qué necesitas saber antes de empezar?
- Conocimientos básicos de SQL recomendados.
- Familiaridad con conceptos generales de sistemas o desarrollo.
- No se requiere experiencia previa en Big Data.
Cómo se aplica lo aprendido
- Evaluación y selección de arquitecturas de datos para la organización.
- Diseño conceptual de un lakehouse sobre almacenamiento cloud.
- Definición de casos de uso batch y streaming con su tecnología adecuada.
- Interlocución informada entre negocio, ingeniería y proveedores.
- Base para especializarse en Spark, Kafka o Airflow.
Por qué elegir DatIACode
No vendemos formación: diseñamos programas que se traducen en capacidad operativa real.
Experiencia aplicada
Más de 20 años combinando consultoría, desarrollo y formación tecnológica para empresas de distintos sectores.
Visión de negocio
Cada programa parte de los objetivos del cliente. La técnica está al servicio del problema, no al revés.
Adaptación al equipo
Ajustamos profundidad, ritmo y casos de uso al nivel real del equipo tras un breve diagnóstico inicial.
Formación + consultoría
Si la formación destapa un proyecto, podemos acompañarte en su implantación. No abandonamos el resultado.
Especialización en IA
Trabajamos en IA aplicada todos los días. La formación no la imparte alguien que solo enseña, la imparte alguien que también construye.
Orientación a resultados
Entregables tangibles y métricas pactadas. Sin promesas vacías.
FAQ
Es conceptual con demostraciones técnicas. No se programa: se trabaja sobre arquitecturas reales, demos guiadas de las herramientas y casos de decisión. Si buscas implementar pipelines, los cursos de Spark, Kafka o Airflow son el siguiente paso natural.
Cuéntanos qué necesitas
Te respondemos en menos de 24h laborables con disponibilidad, opciones de modalidad y propuesta a medida si aplica.
- Diagnóstico inicial sin compromiso.
- Propuesta adaptada al nivel y al sector.
- Asesoramiento sobre formación bonificada.
Cursos relacionados
Ver todos los cursos- Ver curso
Big Data30 horasApache Spark con Databricks — Procesamiento a gran escala
- Ver curso
Big Data30 horasApache Kafka — Data Streaming: fundamentos, producers y consumers
- Ver curso
Big Data20 horasAirflow para orquestación de pipelines de datos
