Importación de datos

Estadística

Author

Edimer David Jaramillo

Published

March 4, 2025

Bibliotecas

Code
# Activación de bibliotecas
# También se puede utilizar require() en lugar de library()
library(readr)
library(readxl)

Importar datos

Excel

  • Recordar que ../ nos permite ir hacia atrás
Code
datos_excel <- read_excel("datos/ejemeplos-importacion/encuesta_excel.xlsx")

datos_excel

Planos

Separados por comas

Code
datos_comas <- read_csv("datos/ejemeplos-importacion/encuesta_comas.csv")
datos_comas

Separados por punto y comas

Code
datos_pto_comas <- read_csv2("datos/ejemeplos-importacion/encuesta_punto_coma.csv")
datos_pto_comas

Separados por tabulador

Code
datos_tabulador <- read_tsv("datos/ejemeplos-importacion/encuesta_tabular.csv")
datos_tabulador

Separados por un delimitador específico

  • En esta función especificamos el delimitador, que en este caso es |.
Code
datos_delimitador <- read_delim("datos/ejemeplos-importacion/encuesta_otro_delimitador.csv",
                                delim = "|")
datos_delimitador

Tipos de datos

  • Puedo conocer el tipo de datos haciendo uso de la función str() (estructura interna de un objeto)
  • En R los tipos de datos básicos son:
    • Numéricos: double o numeric
    • Enteros: integer
    • Texto: character
    • Fecha: Date (año, mes y día), POSIX (año, mes, día, hora, minutos, seguntos y zonas horarias)
Code
str(datos_excel)
tibble [35 × 17] (S3: tbl_df/tbl/data.frame)
 $ fecha            : chr [1:35] "2024/02/08 9:16:49 p. m. GMT-5" "2024/02/08 9:33:45 p. m. GMT-5" "2024/02/09 11:32:54 a. m. GMT-5" "2024/02/09 12:46:16 p. m. GMT-5" ...
 $ promedio_acad    : num [1:35] 4.2 3.5 3.87 3.4 3.78 3.75 4.19 3.5 3.84 3.34 ...
 $ numero_nofav     : num [1:35] 3 6 9 2 6 5 7 8 7 5 ...
 $ horas_dormir     : num [1:35] 7 6 7 5 10 6 8 8 7 6 ...
 $ redes_sociales   : num [1:35] 3 5 3 2 3 3 3 2 6 5 ...
 $ relevencia_matem : num [1:35] 9 10 8 7 10 10 10 10 8 8 ...
 $ fecha_nac        : POSIXct[1:35], format: "2004-01-22" "2003-08-24" ...
 $ asignaturas      : num [1:35] 8 7 7 8 7 7 6 8 6 8 ...
 $ num_semestre     : num [1:35] 5 5 5 5 4 5 5 5 5 5 ...
 $ trabaja          : chr [1:35] "No" "No" "No" "No" ...
 $ asignatura_prefer: chr [1:35] "Estadística" "Topografía" "Humanística" "Humanidades" ...
 $ asignatura_dific : chr [1:35] "Álgebra lineal" "Cálculo diferencial" "Cálculos" "Cálculo diferencial" ...
 $ editar_carrera   : chr [1:35] "En mi carrera profesional agregaría unas asignaturas más que tengan que ver con programación y sus fundamentos" "Yo hasta el momento lo único que agregaría es que el enfoque y la importancia en cuanto a lo que pecuario sea mayor." "Creo que el currículo de la carrera esta muy completo." "los elementos que le agregaria seria que fuera mas practica, mas de  ejercer" ...
 $ aplicacion_ia    : chr [1:35] "La IA es muy útil en mi carrera profesional, pero siento que estamos siendo muy dependientes a ella y eso puede"| __truncated__ "Creo que es muy útil el uso de la inteligencia artificial en mi ejercicio profesional ya que la inteligencia ar"| __truncated__ "Pienso que ha sido una herramienta que facilita la realización de muchos trabajos, que debe ser usada de  maner"| __truncated__ "pues personalmente yo no estoy de acuerdo con la inteligenciaartificial ya que yo considero que asi como ha log"| __truncated__ ...
 $ tiene_pc         : chr [1:35] "Sí" "No" "Sí" "Sí" ...
 $ beca             : chr [1:35] "Sí" "No" "Sí" "No" ...
 $ edad             : num [1:35] 20.1 20.5 24.7 28.4 23.6 ...