📚 Gobernanza
Catálogo de datos empresarial
"No sé qué datos tenemos ni dónde están"
Catálogo centralizado con discovery automático y linaje de datos
Dificultad
Medio
Tiempo estimado
1-2 semanas
ROI esperado
Reducción del 70% en tiempo buscando datos
Demo
Bajo petición
Componentes Azure
Microsoft Purview Data Factory Synapse
El problema
“¿Tenemos datos de X?” “¿Dónde está el dato Y?” “¿Quién es responsable de Z?” Nadie sabe qué datos existen, dónde están, si son fiables, o quién puede usarlos.
Consecuencias:
- Proyectos de datos que tardan meses en empezar (buscando datos)
- Datos sensibles expuestos sin saberlo
- Duplicación de esfuerzos
- Incumplimiento normativo (GDPR, etc.)
La solución
Un catálogo que:
- Escanea automáticamente tus fuentes de datos
- Documenta qué hay en cada tabla, campo, archivo
- Clasifica datos sensibles (PII, financieros, etc.)
- Traza el linaje de dónde viene cada dato
- Permite buscar “clientes” y encontrar todas las fuentes
Arquitectura
SQL Server, SharePoint, Data Lake... → Purview → Catálogo unificado
↓
Búsqueda, clasificación, linaje
Componentes Azure
| Componente | Función | Coste estimado |
|---|---|---|
| Microsoft Purview | Catálogo y gobernanza | Desde 0€ (Data Map) |
| Data Factory | Conexión a fuentes | Incluido |
| Synapse | Análisis opcional | Según uso |
Qué necesitas para empezar
- Lista de fuentes de datos principales (BD, SharePoint, archivos…)
- Credenciales de acceso (solo lectura)
- Dueños de datos identificados por área
- Glosario básico de términos de negocio
Personalización típica
- Clasificaciones custom: Definir tipos de datos específicos de tu sector
- Políticas de acceso: Automatizar quién puede ver qué
- Integración con pipelines: Actualizar catálogo cuando cambian los datos
- Glosario de negocio: “Cliente” significa lo mismo para todos
Resultado
En 1-2 semanas tienes:
- Inventario automático de tus datos
- Clasificación de datos sensibles
- Buscador para encontrar cualquier dato
- Base para cumplimiento normativo y proyectos de IA
¿Te identificas con este problema?
En 1-2 semanas podemos tener una primera versión funcionando en tu entorno. Cuéntanos los detalles de tu caso.
Solicitar este experimento