Introducción (EyCD)
En Exploración y Curación de Datos se identifican patrones, relaciones significativas, calidad y disponibilidad de las variables (exploración), para así poder seleccionar y transformar los datos para su experimentación (curación)
Algunos de los temas estudiados son las estructuras de datos, formatos de datos, bases de datos, entre otros.
A través de distintas herramientas podemos verificar la calidad de los datos en su:
- Completitud: saber si contamos con toda la info. necesaria o si hay valores faltantes.
- Validez: saber si el dato cumple con el formato/reglas esperadas (fechas, montos, etc.)
- Integridad: congruencia entre relaciones de datos.
- Consistencia: que no haya contradicciones/duplicados entre fuentes.
- Temporalidad: la disponibilidad de los datos en el tiempo para su análisis (si son recientes/relevantes).
Última vez actualizado el 24 de mayo de 2025