Visualización de datos con R y Python

Semillero de Ciencia de Datos

2024-07-29

Transformar → Visualizar



“Conviva con sus datos antes de sumergirse en el modelamiento.” — Leo Breiman

Exploración de datos

“El mayor valor de un gráfico es cuando nos obliga a notar lo que nunca esperábamos ver.” — John Tukey

Diccionario de gráficos


1. Cantidades

2. Distribuciones

3. Proporciones

4. Relaciones x - y

5. Datos geoespaciales

6. Incertidumbre

Antes de hacer un gráfico…


  • Importando datos:
library(readr)
creditos <- read_csv("../../Ciclo-3/03-Ejemplos/datos/colocaciones_créditos_agropecuarios_2024.csv")
  • Consultando el tipo de datos:
# Opción 1 --> Nativa con R
str(creditos)

# Opción 2 --> dplyr
library(dplyr)
glimpse(creditos)
  • Importando datos:
import pandas as pd
creditos = pd.read_csv("../../Ciclo-3/03-Ejemplos/datos/colocaciones_créditos_agropecuarios_2024.csv")
  • Consultando el tipo de datos:
creditos.info()

Tipos de datos

R Python Descripción
character object Datos relacionados con cadenas de texto
factor object - category Datos relacionados con cadenas de texto que poseen niveles
numeric - double float64 Datos continuos
integer int64 Datos discretos
POSIXct - Date datetime64 Fechas
logical bool Lógicos o booleanos

Guías de visualización


Visualización con R y Python 📈📊📉

Bibliotecas para visualización con R


ggplot2

La gramática de gráficos en capas (artículo Hadley Wickham)

Capítulo 3 R for Data Science - Visualización de datos

Bibliotecas para visualización con Python


plotnine

A Grammar of Graphics for Python

¿Cómo funcionan ggplot2 y plotnine?


Visualización interactiva

Interactividad en R y Python


Colores 🎨

Paletas de colores


¡Gracias!