Saltar al contenido principal
Ruta Certificada · DataPath

Conviértete en un
Data Engineer

Domina bases OLTP/OLAP, Python y Pandas. Crea ETLs, visualiza con Seaborn y despliega Machine Learning con Scikit-learn y FastAPI. Orquesta con Airflow para soluciones de producción real. ¡Lleva tus modelos del código al mercado!

+6320

Alumnos activos

10 sem

Duración del programa

+9

Módulos core

4.8★

Valoración

Tecnologías que dominarás

PythonPython
RR
TensorFlowTensorFlow
DockerDocker
SparkSpark
GCPGCP
AWSAWS
AzureAzure
GitGit
SQLSQL
KubernetesKubernetes
PyTorchPyTorch

Nuestros alumnos trabajan en

+1820Accenture
+640BBVA
+270Falabella
+740Santander
+530Bancolombia
+380Rappi
+290Claro
+210Ecopetrol
+160Avianca
+120Grupo Sura
+1820Accenture
+640BBVA
+270Falabella
+740Santander
+530Bancolombia
+380Rappi
+290Claro
+210Ecopetrol
+160Avianca
+120Grupo Sura
Curriculum

Ruta de Aprendizaje

9 módulos para dominar Data Engineer

10 Semanas · Ritmo Sugerido

01
1Sesión 1. Fundamentos de Ecosistemas y Arquitecturas de Datos
2Procesamiento de Datos con ETL, ELT y Real-Time
3Almacenamiento de Datos con Data Warehouse, Data Lake y Lakehouse
4Diseño de Sistemas con Arquitectura Lambda
5Estructura de Datos con Arquitectura Medallion
02
03
04
05
06
07
08
09
En vivo

Próximas fechas

6 de abril

Martes, Jueves - 7:00pm a 10:00pm, Sábado - 9:00am a 12:00pm GMT-5

Quedan 2 lugares

Inscribirme ahora

13 de junio

Martes, Jueves - 7:00am a 10:00pm, Sábado - 9:00am a 12:00pm GMT-5

Quedan 18 lugares

Inscribirme ahora
Opiniones del curso
4.8· 4.500 opiniones
Gonzalo Raúl Gutierrez Lozano

Gonzalo Raúl Gutierrez Lozano

IT Project Development Assistant

¡Buenas tardes, estimada red! 🚀 ¡Meta cumplida! Acabo de culminar con éxito mi proyecto final: "Pipeline de Datos de Ventas: Arquitectura Event-Driven con Google Cloud Platform y Apache Airflow". Recientemente finalicé el programa AI Data Engineer en Datapath y, como parte del proyecto final, diseñé e implementé un pipeline de datos de ventas "End-to-End" bajo una arquitectura orientada a eventos (Event-Driven). Este proyecto representa un hito que no solo me planteó importantes desafíos técnicos, sino que también me brindó la oportunidad de implementar soluciones escalables y resilientes en la nube. 🏗️ La Arquitectura: El flujo comienza con un Producer desarrollado en FastAPI que simula transacciones en tiempo real. Estas son enviadas a Google Cloud Pub/Sub, que actúa como el corazón de la mensajería asíncrona, para luego ser procesadas y orquestadas por Apache Airflow. Finalmente, los datos se almacenan en un Data Lake en Cloud Storage y se consolidan en BigQuery para su análisis. 🛠️ Stack Tecnológico: - Lenguajes: Python (FastAPI, Pandas). - Cloud (GCP): Pub/Sub, Cloud Storage, BigQuery, IAM. - Orquestación: Apache Airflow (Dockerizado). - Infraestructura: Docker & Docker Compose. 💡 Aptitudes y Aprendizajes clave: - Desacoplamiento de sistemas: Uso de capas de mensajería para evitar la pérdida de datos. - Orquestación Avanzada: Gestión de dependencias y comunicación mediante XComs en Airflow. - Seguridad Cloud: Implementación de Service Accounts y manejo estricto de roles IAM. - Contenedorización: Despliegue de entornos reproducibles con Docker. Un agradecimiento especial a mis profesores de datapath por su guía y enseñanza durante todo el programa. ¡Seguimos avanzando en este mundo de los datos! 🚀📈 ¿Quieres ver el código o los detalles técnicos? Te invito a leer mi artículo en Medium y revisar mi repositorio en GitHub (links en los comentarios 👇).

Imagen adjunta por Gonzalo Raúl Gutierrez Lozano

10 mar 2026

Jorge Alberto Pinilla Estupiñan

Jorge Alberto Pinilla Estupiñan

Arquitecto TI (Solutions | Software | Integration | Cloud)

🤖 La Inteligencia Artificial está redefiniendo la forma en que diseñamos soluciones, y los Large Language Models (LLMs) son el corazón de esta transformación. Acabo de culminar el curso “AI Engineer & LLM Developer”, donde profundicé en: 🔹 Fundamentos de Machine Learning y Deep Learning 🔹 Diseño y entrenamiento de Large Language Models (LLMs) 🔹 Integración de IA en aplicaciones empresariales con APIs y frameworks modernos 🔹 Buenas prácticas de ética, seguridad y despliegue responsable de modelos Este aprendizaje me permite llevar la arquitectura cloud y la ingeniería de datos a un nuevo nivel, integrando IA generativa y agentes inteligentes en soluciones que combinan innovación con gobernanza. 🚀 La gran lección: no se trata solo de entrenar modelos, sino de diseñar experiencias inteligentes que generen confianza y valor real. 💡 ¿Qué aplicaciones de IA generativa están explorando ustedes en sus proyectos actuales? hashtag#AI hashtag#LLM hashtag#MachineLearning hashtag#GenerativeAI hashtag#Innovation hashtag#ContinuousLearning datapath hashtag#datapath Gracias profesor: Kevin Inofuente Colque 💯 🤓 🦾 👌

Imagen adjunta por Jorge Alberto Pinilla Estupiñan

14 mar 2026

Ver publicación
Diego Morales Barrera

Diego Morales Barrera

Generative AI | Data Science | Machine Learning

Just completed the AI Data Engineer bootcamp from datapath (105 hours) 🎉 This training complements my generative AI expertise by deepening my understanding of the data infrastructure that powers AI systems, from ETL pipelines and real-time processing to DataOps and AI engineering fundamentals. Key areas covered: → Data architecture & SQL for data engineering → ETL processes with Python → Big data processing (Hadoop, Spark, Kafka) → Real-time data pipelines → AI engineering foundations Building AI solutions requires more than understanding models, it requires understanding how data flows, transforms, and scales. This program filled gaps in my data engineering knowledge that directly strengthen my AI delivery capabilities. hashtag#AIEngineering hashtag#DataEngineering hashtag#GenerativeAI hashtag#ContinuousLearning hashtag#AIImplementation

7 mar 2026

Ver publicación
Edgar Chávez

Edgar Chávez

Digital Marketing Specialist / Consultancy / AI

Completé un curso intensivo en hashtag#automatización con n8n en datapath. Diseñar procesos automatizados con IA bien aplicados y correctamente gobernados permite mejorar la eficiencia operativa en negocios de hospitalidad. Cuando se implementan con criterio, estas herramientas no sustituyen la experiencia humana; la potencian, al liberar tiempo que puede destinarse a un mejor trato, mayor personalización y una operación más consciente. Sigo desarrollando estas capacidades como parte de una visión estratégica de largo plazo, donde tecnología y experiencia colaboran.

Imagen adjunta por Edgar Chávez

14 mar 2026

Ver publicación
 Eladio Yovera

Eladio Yovera

Technical Lead - Data & AI | Azure | Databricks | MS Fabric

Con datapath pude obtener el certificado de Data Engineer en Azure, me aportó mucho en mi crecimiento profesional.

18 jun 2025

Ver video
Adrian Nieto Castillo

Adrian Nieto Castillo

Líder de Proyectos de Datos en DataIQ

¡Me alegra contarles que he obtenido un nuevo certificado: ESPECIALIZACIÓN IA GENERATIVA CON AZURE de datapath! Arrancamos el 2026 con nuevos logros, a seguir creciendo siempre! hashtag#Datos hashtag#IA hashtag#Azure hashtag#DataIQ

Imagen adjunta por Adrian Nieto Castillo

10 feb 2026

Ver publicación
PA

Pablo Quispe Ruiz

Azure AI Engineer

Muy buenos docentes, buenas plantillas. Aprendí mucho de arquitecturas en Azure y me ayudó mucho en mi trabajo.

14 mar 2026

Ver video
YE

Yeredith Mora Martínez

Data Engineer

Proyectos muy prácticos, aprendí mucho del programa. Me permitió contar con un ascenso.

Ver video

Elige el plan ideal para ti

Basic

Individual
$800
$600
o en 2 o 3 cuotas(con tarjeta de crédito o débito)
☀️ Promoción Verano: 25% OFF
  • Clases en vivo
  • Acceso comunidad IA
  • Acceso a recursos y materiales
  • Certificado de Finalización
  • Bono por rendimiento académico
  • Soporte
Suscríbete a Basic

Pro

Individual
$950
$712.5
o en 2 o 3 cuotas(con tarjeta de crédito o débito)
☀️ Promoción Verano: 25% OFF
  • +3 Cursos Especializados en Data Engineer
  • +16 Cursos Ondemand
  • Clases en vivo
  • Acceso comunidad IA
  • Acceso a recursos y materiales
  • Certificado de Finalización
  • Talleres exclusivos
  • Soporte
  • Acceso plataforma Intranet
  • Bono por rendimiento académico
Suscríbete a Pro
Cursos incluidos

Cursos de esta ruta

Databricks Data Engineer
On Demand
$349
Bootcamp

Databricks Data Engineer

Domina PySpark, SQL y Lakehouse. Orquesta con DLT, optimiza tablas Delta y lidera con Unity Catalog. Construye infraestructuras de datos robustas y escala tu carrera al nivel profesional que el mercado exige hoy en Data Engineering moderno.

+23h
Bootcamp GCP Data Engineer
On Demand
$349
Bootcamp

Bootcamp GCP Data Engineer

Domina GCP con BigQuery, Cloud Storage y Dataproc. Orquesta con Airflow en Cloud Composer, procesa con Dataflow y gestiona streaming con Pub/Sub. Crea soluciones batch y Real-Time de alto impacto, convirtiéndote en el experto en la nube de Google.

+22h
Bootcamp AWS Data Engineer
On Demand
$349
Bootcamp

Bootcamp AWS Data Engineer

Domina AWS con S3, Glue, Lambda y Redshift. Gestiona streaming con Kinesis, seguridad con IAM y automatiza con Step Functions. Crea soluciones escalables y eficientes, convirtiéndote en el arquitecto de datos que las empresas buscan hoy mismo.

+22h
Apache Spark Fundamentals
On Demand
$30
Curso

Apache Spark Fundamentals

Apache Spark es el motor de procesamiento distribuido más potente del mercado para análisis de Big Data a escala. En este curso dominarás la arquitectura de Spark desde cero, trabajarás con RDDs, DataFrames y Datasets, utilizarás PySpark para ingeniería de datos, ejecutarás consultas con Spark SQL y aprenderás a optimizar jobs de procesamiento batch y streaming. Integramos prácticas reales con AWS y Databricks para que apliques lo aprendido en entornos de producción.

+5h
BigQuery de Cero a Héroe
On Demand
$30
Curso

BigQuery de Cero a Héroe

Conviértete en experto de BigQuery, la plataforma de data warehouse de Google Cloud. Domina SQL avanzado, optimización de consultas, reducción de costos, ingesta y transformación de datos a escala. Aprenderás a construir pipelines analíticos, conectar con Looker Studio y diseñar arquitecturas de datos en la nube que resuelven problemas reales de negocio con grandes volúmenes de información.

+5h
Azure Synapse
On Demand
$30
Curso

Azure Synapse

Azure Synapse Analytics es la plataforma unificada de Microsoft que combina el poder del almacenamiento de datos a escala empresarial con el análisis de Big Data. En este curso aprenderás a crear y gestionar espacios de trabajo, configurar SQL Pools dedicados y serverless, ejecutar procesos de integración de datos con pipelines, trabajar con Apache Spark y conectar tus resultados directamente con Power BI y Azure Machine Learning para tomar decisiones inteligentes basadas en datos.

+2h
Construye un AI Chatbot con WhatsApp API, ChatGPT y Python
On Demand
$50
Curso

Construye un AI Chatbot con WhatsApp API, ChatGPT y Python

Construye desde cero un chatbot inteligente para WhatsApp integrando la API oficial de Meta, OpenAI con ChatGPT y Python para el backend. Este curso te guía paso a paso en la configuración del servidor, el manejo de webhooks, el procesamiento del lenguaje natural con GPT y el despliegue en producción, dándote todas las herramientas para lanzar un agente conversacional real y funcional en WhatsApp.

+4h
Análisis de Datos con Pyhton
On Demand
$30
Curso

Análisis de Datos con Pyhton

Python es la herramienta más versátil y demandada para el análisis de datos en el mercado actual. En este curso aprenderás a manipular y transformar datos con Pandas, realizar operaciones numéricas avanzadas con NumPy, crear visualizaciones impactantes con Matplotlib y Seaborn, aplicar técnicas de limpieza y exploración de datos y construir modelos analíticos que te permitan extraer información valiosa de grandes volúmenes de información para tomar decisiones basadas en datos.

+14h
Introducción a Azure
On Demand
$30
Curso

Introducción a Azure

Domina Microsoft Azure desde cero y conviértete en un profesional de la nube. En este curso aprenderás los fundamentos de Cloud Computing, los principales servicios de Azure como Virtual Machines, Blob Storage y Active Directory, además de cómo desplegar y gestionar recursos en la nube. Ideal para quienes quieren iniciar su carrera como Cloud Engineer con una de las plataformas más demandadas del mercado.

+3h
Introducción a Google Cloud Platform
On Demand
$30
Curso

Introducción a Google Cloud Platform

Inicia tu camino en la nube más poderosa del mundo con Google Cloud Platform. Este curso te lleva desde los conceptos fundamentales de infraestructura hasta los servicios más demandados del ecosistema GCP, incluyendo Compute Engine, Cloud Storage, BigQuery para análisis de datos masivos, Cloud Run para contenedores serverless y las mejores prácticas de IAM y seguridad. Aprende a diseñar arquitecturas escalables, gestionar recursos eficientemente y prepararte para certificaciones en Google Cloud.

+4h
Scala Fundamentals
On Demand
$30
Curso

Scala Fundamentals

Domina Scala desde sus fundamentos hasta su aplicación avanzada en procesamiento de datos a gran escala con Apache Spark, el framework líder en Big Data. Este curso te llevará a través de la programación funcional, el tipado estático, las estructuras de datos inmutables, el pattern matching y la concurrencia con Futures, preparándote para trabajar con entornos como Databricks y desarrollar pipelines de datos robustos y escalables en proyectos de ingeniería de datos reales.

+10h
NoSQL desde Cero
On Demand
$30
Curso

NoSQL desde Cero

Domina el ecosistema NoSQL desde cero con una visión integral de los modelos de bases de datos no relacionales más demandados en la industria. Este curso te lleva por MongoDB para documentos JSON, Redis para caché en memoria, Apache Cassandra para alta disponibilidad distribuida y DynamoDB en AWS, enseñándote a modelar datos eficientemente, elegir la tecnología correcta según tu caso de uso y construir soluciones escalables y de alto rendimiento.

+2h
Fundamentos y Construcción de API's con Python
On Demand
$30
Curso

Fundamentos y Construcción de API's con Python

Construye APIs profesionales con Python desde cero y lleva tus proyectos al siguiente nivel. Este curso te enseña a diseñar rutas, implementar operaciones CRUD, gestionar autenticación y seguridad, conectar bases de datos con SQLAlchemy y documentar con Swagger, todo usando FastAPI. Ideal para desarrolladores que quieren dominar el desarrollo backend moderno y desplegar sus APIs en entornos cloud de forma eficiente.

+1h
Azure Data Dactory Desde Cero
On Demand
$30
Curso

Azure Data Dactory Desde Cero

Aprende a diseñar y automatizar flujos de datos en la nube utilizando Azure Data Factory, una de las plataformas más demandadas en proyectos de analítica moderna. En este curso partirás desde cero para comprender cómo integrar, transformar y orquestar datos entre diferentes fuentes, construyendo pipelines robustos que soporten procesos de analítica y negocio. Al finalizar, tendrás la base necesaria para participar en proyectos reales de ingeniería de datos sobre Azure.

+1h
SQL para todos
On Demand
$30
Curso

SQL para todos

Aprende SQL desde cero y domina el lenguaje de consulta de datos más utilizado en el mundo empresarial. Este curso te guiará paso a paso a través de la creación y manipulación de bases de datos relacionales, la escritura de consultas complejas, el uso de funciones de agregación, subconsultas y joins, hasta llegar a técnicas avanzadas de optimización, preparándote para extraer información valiosa y tomar decisiones basadas en datos con total confianza profesional.

+8h
Fundamentos de Git en Cloud
On Demand
$30
Curso

Fundamentos de Git en Cloud

Domina Git y sus flujos de trabajo en entornos cloud desde cero. Aprende a gestionar repositorios, crear ramas, realizar merges y colaborar eficientemente usando GitHub y GitLab. Domina estrategias de branching, Pull Requests, revisión de código y los fundamentos de CI/CD para integrarte con éxito en equipos de desarrollo profesionales que trabajan con infraestructura en la nube.

+2h
Introducción a Amazon Web Services
On Demand
$30
Curso

Introducción a Amazon Web Services

Domina Amazon Web Services y comienza tu carrera en la nube con la plataforma líder del mercado. Este curso te guía desde los fundamentos de AWS hasta servicios clave como EC2, S3, IAM, RDS y Lambda, integrando conceptos de seguridad, cómputo, almacenamiento e inteligencia artificial. Ideal para profesionales que desean obtener experiencia práctica y construir soluciones cloud reales con AWS.

+8h
Python para todos
On Demand
$30
Curso

Python para todos

Domina Python desde cero con un enfoque práctico y orientado a datos. En este curso explorarás variables, estructuras de control, funciones, manejo de archivos, librerías esenciales y programación orientada a objetos, construyendo proyectos reales que consolidan cada concepto. Ideal para quienes quieren iniciarse en el desarrollo con Python o fortalecer sus bases antes de adentrarse en ciencia de datos, automatización e inteligencia artificial.

+9h
Azure SQL de Cero a Héroe
On Demand
$30
Curso

Azure SQL de Cero a Héroe

Domina Azure SQL desde los fundamentos hasta técnicas avanzadas de administración en la nube de Microsoft. Este curso te lleva por el diseño de bases de datos relacionales, la escritura de consultas T-SQL de alto rendimiento, la gestión de procedimientos almacenados, la optimización de índices y la implementación de soluciones de alta disponibilidad y recuperación ante desastres, todo dentro del entorno seguro y escalable de Azure SQL Database.

+5h
🗄️

¿Listo para convertirte en Data Engineer?

Accede a los 11 módulos core, 10+ electivos y 8 proyectos prácticos en una sola inversión.