El último reporte de dbt Labs —publicado en abril de 2026 con datos de más de 1,200 equipos en todo el mundo— tiene un número que debería preocupar a cualquier CTO, Head of Data o Gerente de Analytics: el 71% de los equipos de datos teme que información incorrecta o alucinada por IA llegue a sus stakeholders. Y solo el 24% tiene procesos de testing y observabilidad de IA en su roadmap.
No es un problema de herramientas. Es un problema de gobernanza. Y la mayoría de las empresas lo descubren cuando ya tienen un incidente encima.
Qué es gobernanza de datos en 2026 (ya no es solo compliance)
La definición vieja de gobernanza era clara: quién puede acceder a qué datos, dónde están almacenados y quién es el dueño. Sigue siendo válida, pero en 2026 hay una capa nueva encima. Los datos ahora alimentan modelos de IA que toman decisiones o apoyan a personas que las toman. Un dato corrupto ya no solo genera un dashboard incorrecto —puede disparar un agente que ejecuta acciones en producción, o darle números equivocados a un ejecutivo que decide presupuestos.
La prioridad de confianza en los datos subió del 66% al 83% en un año, según el mismo reporte de dbt Labs. Las empresas lo sienten. La pregunta es cómo actuar antes de que el problema sea urgente.
Las 4 capas que toda empresa necesita tener claras
No todas las empresas necesitan el mismo nivel de madurez, pero estas cuatro capas son el piso mínimo para trabajar con datos de manera confiable en la era de la IA:
- ▸Catálogo de datos: saber qué datos existen, de dónde vienen, qué significan y quién los consume
- ▸Linaje (data lineage): rastrear cómo se transformaron los datos desde la fuente hasta el dashboard o el modelo de IA
- ▸Calidad y observabilidad: detectar anomalías, datos faltantes o distribuciones anómalas antes de que lleguen a los modelos
- ▸Propiedad y acceso: quién puede usar qué datos, con qué propósito y con qué restricciones de seguridad
La capa que más empresas saltan es el linaje. Se dan cuenta de que la necesitan cuando algo falla en producción y nadie puede explicar por qué el modelo cambió de comportamiento. En ese momento ya es tarde para implementarlo con calma.
El error más común: gobernar reactivamente
La mayoría de las empresas empieza a pensar en gobernanza después de un incidente: datos incorrectos en un reporte ejecutivo, un modelo de IA que tomó una decisión que nadie puede explicar, o una auditoría que pregunta por datos que ya nadie sabe dónde están.
He visto equipos de 30 personas que llevan dos años trabajando con datos y ninguno puede decirte exactamente de dónde vienen los números del dashboard de ventas. No es negligencia —es que el sistema creció sin planificación. Y retroalimentar una arquitectura de datos sin gobernanza cuando ya hay 50 pipelines en producción es mucho más costoso que haber puesto orden desde el principio.
Cómo construir gobernanza sin frenar la velocidad del equipo
La respuesta más honesta: no intentes implementar todo de una vez. Las empresas que lo hacen suelen terminar con proyectos de gobernanza que duran 18 meses, consumen presupuesto y nunca ven la luz. Lo que funciona: empieza con catálogo y linaje en el 20% de los datos más críticos para el negocio, mide el impacto, y expande desde ahí.
Las herramientas que combinamos más seguido en implementaciones con equipos LATAM: dbt para transformaciones (documenta el linaje automáticamente como parte del código), OpenMetadata o Datahub para el catálogo, y Great Expectations o Monte Carlo para checks de calidad. Ninguna es perfecta, pero juntas cubren las cuatro capas con opciones open source y enterprise.
Por dónde empezar esta semana
Si necesitas algo concreto sin esperar al presupuesto formal de gobernanza:
- ▸Identifica tus 3 a 5 datasets más críticos para el negocio: los que usa el CEO, los que alimentan decisiones de revenue
- ▸Documenta el origen y las transformaciones de cada uno, aunque sea en un Google Doc por ahora
- ▸Define quién es el data owner de cada uno: una persona con nombre y apellido, no un equipo o área
- ▸Implementa al menos un check de calidad por dataset: valores nulos, rangos esperados, conteo de registros
Es más de lo que hace la mayoría de las empresas. Y es mucho menos de lo que necesitas a largo plazo. Pero el momentum importa más que la perfección en los primeros meses.
La brecha real: infraestructura sin equipo preparado
El reporte de dbt Labs tiene otro dato que vale la pena subrayar: el 57% de las empresas aumentó su gasto en infraestructura de datos en 2026, pero solo el 36% aumentó el presupuesto de equipo. La brecha entre lo que la infraestructura puede hacer y lo que el equipo sabe hacer es el problema real. Tener Databricks, dbt y un data lake no significa que tu empresa use los datos bien.
La solución no es solo comprar más herramientas. Es tener un equipo que sepa diseñar arquitecturas con gobernanza incorporada, implementar pipelines confiables y operar modelos de IA con criterio.
En DataPath hemos trabajado con equipos de Entel, BCP, Scotiabank y más de 30 empresas en LATAM diseñando programas de capacitación que arrancan con un diagnóstico de madurez de datos y terminan con medición de impacto. Si tu empresa necesita armar esa capacidad interna, la conversación más útil empieza en nuestra página para empresas.
Para los equipos que quieren la base técnica: el bootcamp de Data Architect cubre diseño de arquitecturas con gobernanza incorporada desde el día uno. Y el bootcamp de Data Analyst incluye los fundamentos de calidad de datos y reporting confiable. Ambos están disponibles en modalidad in-company para equipos.



