Actividad 01

Estadística: Diagnóstico de datos ordenados

Author

Edimer David Jaramillo

Published

March 13, 2025

Objetivo

Desarrollar habilidades para identificar si una base de datos cumple con los principios de “tidy data” (datos ordenados) y justificar adecuadamente el diagnóstico realizado.

Descripción

En esta actividad, usted deberá buscar y seleccionar diferentes conjuntos de datos para realizar un diagnóstico que permita determinar si cumplen con los principios de datos ordenados (tidy data) establecidos por Hadley Wickham.

  1. Selección de datos:

  2. Diagnóstico: para cada conjunto de datos, realice un diagnóstico completo respondiendo:

    1. ¿Cumple este conjunto de datos con los principios de tidy data? Justifique su respuesta.
    2. Específicamente, evalúe si:
      • Cada variable forma una columna
      • Cada observación forma una fila
      • Cada dato o valor está en una celda
    3. Identifica problemas específicos si los hay (datos anidados, variables en filas, múltiples variables en columnas, etc.)
  3. Propuesta de solución:

    • Para los conjuntos de datos que no cumplan con los principios, proponga los pasos específicos que seguiría para transformarlos en formato ordenado
    • Mencione qué funciones o herramientas utilizarías (por ejemplo, pivot_longer, pivot_wider, separate, etc.). Nota: no es necesario ejecutar los códigos en R, basta con el diagnóstico.
  4. Documentación:

    • Prepare un informe documentando sus hallazgos. Puede ser en formato HTML, PDF o Word.
    • Incluya capturas de pantalla o ejemplos visuales de los datos originales donde se puedan identificar los problemas asociados a estas bases de datos.

Fecha y de entrega

  • Máximo el 23 de marzo de 2025
  • Esta actividad podrá ser desarrollada de forma individual o máximo en parejas.