Argumentación y narrativa soportada en análisis de datos

Visualización de datos

Edimer David Jaramillo

2024-06-25

Transformar → Visualizar


“Conviva con sus datos antes de sumergirse en el modelamiento.” — Leo Breiman

Exploración de datos

“El mayor valor de un gráfico es cuando nos obliga a notar lo que nunca esperábamos ver.” — John Tukey

Diccionario de gráficos

1. Cantidades

2. Distribuciones

3. Proporciones

4. Relaciones x - y

5. Datos geoespaciales

6. Incertidumbre

Antes de hacer un gráfico…

Guías de visualización

Visualización con R

Bibliotecas para visualización

ggplot2

La gramática de gráficos en capas (artículo Hadley Wickham)

Capítulo 3 R for Data Science - Visualización de datos

¿Cómo funciona ggplot2?

Visualización con Python

Bibliotecas para visualización

plotnine

A Grammar of Graphics for Python

Tipos de gráficos: ggplot2 - plotnine

  • Una variable:
    • Variable cuantitativa:
      • Histogramas -> geom_histogram()
      • Densidades -> geom_density()
      • Cuantil-cuantil (Q-Q Norm) -> geom_qq() y geom_qq_line()
      • Boxplot -> geom_boxplot()
    • Variable cualitativa:
      • Diagrama de barras -> geom_bar()
      • Diagrama de sectores -> geom_bar()
  • Dos variables cuantitativas:
    • Diagrama de dispersión -> geom_point()
    • Tendencias -> geom_smooth()
  • Dos variables cualitativas:
    • Diagrama puntos superpuestos -> geom_count()
  • Dos variables - cuantitativa y cualitativa:
    • Diagrama de barras -> geom_col()
    • Boxplot -> geom_boxplot()
  • Dos variables - cuantitativa y tiempo:
    • Diagrama de líneas -> geom_line()
    • Diagrama de área -> geom_area()
  • Visualizando incertidumbre:
    • Barras de errores -> geom_errorbar()

Visualización interactiva

Interactividad en R y Python

Teoría del color

Paletas de colores

🤝🙂🤝