Inferencia Estadística

Diseño Experimental

Autor/a

Edimer David Jaramillo

Fecha de publicación

18 de abril de 2024

Bibliotecas

Código

library(tidyverse)
library(readxl)
library(infer)

theme_set(theme_bw())

Datos

Código

datos <- read_excel("datos/datos-encuestas-historia.xlsx")
datos

Escenarios de inferencia

Hipótesis estadística

Tipos de pruebas

Tipos de errores

Inferencia sobre una población

Inferencia sobre la media

Normalidad de la variable

Código

ggpubr::ggqqplot(datos$promedio_acad)

Juego de hipótesis

\[H_0: \mu = 3.5\]

\[H_1: \mu \neq 3.5\]

Nivel de significancia

Vamos a utilizar un nivel de significancia del 5% ($\alpha = 0.05$)

Calcular el estadístico observado

En este caso calculamos el estadístico T:

\[T = \frac{\bar{X} - \mu}{S/\sqrt{n}}\]

Código

x_barra <- mean(datos$promedio_acad, na.rm = TRUE)
mu_referencia <- 3.5
desviacion_muestral <- sd(datos$promedio_acad, na.rm = TRUE)
raiz_n <- sqrt(nrow(datos))

\[T = \frac{3.794516 - 3.5}{0.247371/9.643651} = 11.48158\]

Código

(x_barra - mu_referencia) / (desviacion_muestral / raiz_n)

[1] 11.48158

Región de rechazo

Tabla t-student
Podemos obtener los límites critícos con R:

Código

qt(p = 0.025, df = 92, lower.tail = TRUE)

[1] -1.986086

Código

qt(p = 0.025, df = 92, lower.tail = FALSE)

[1] 1.986086

Conclusión: como el estadístico calculado (11.48158) está dentro de las regiones de rechazo, existe evidencia para rechazar la hipótesis nula, es decir, que se rechaza que el promedio del promedio_académico sea igual a 3.5. Esto se concluye con un nivel de significancia del 5%.

Intervalo de confianza para $\mu$

Límite inferior del intervalo de confianza:

\[\bar{X} - t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}\]

Código

x_barra - (1.986086 * (desviacion_muestral / raiz_n))

[1] 3.743571

Límite superior del intervalo de confianza:

\[\bar{X} + t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}\]

Código

x_barra + (1.986086 * (desviacion_muestral / raiz_n))

[1] 3.845462

Conclusión: como el valor de referencia (3.5) no está dentro del intervalo de confianza, existe evidencia para rechazar la hipótesis nula, es decir, que se rechaza que el promedio del promedio_académico sea igual a 3.5. Esto se concluye con un nivel de significancia del 5%. Como el intervalo de confianza está a la derecha del valor de referencia (3.5) podemos afirmar que la media del promedio académico de los estudiantes es mayor a 3.5

Valor p

Calcular el área que deja un valor de 11.48158 a la izquierda:

Código

pt(q = -11.48158, df = 92, lower.tail = TRUE)

[1] 9.287894e-20

Calcular el área que deja un valor de 11.48158 a la derecha:

Código

pt(q = 11.48158, df = 92, lower.tail = FALSE)

[1] 9.287894e-20

El valor p es la suma de las dor áreas anteriores:

Código

9.287894e-20 + 9.287894e-20

[1] 1.857579e-19

Conclusión: como el valor p (1.857579e-19) es menor que el nivel de significancia (0.05) existe evidencia para rechazar la hipótesis nula.

Solución con R

Utilizamos la función t.test() con los siguientes argumentos:
- x: la variable sobre la cual estamos haciendo inferencia. En este caso el promedio_académico
- alternative: tipo de hipótesis alternativa. En este es una prueba bilateral usamos “two.sided”
- conf.level: nivel de confianza (1 - nivel de significancia = 1 - 0.05 = 0.95)
- mu: valor promedio de referencia. En este caso es 3.5

Código

t.test(x = datos$promedio_acad,
       alternative = "two.sided",
       conf.level = 0.95,
       mu = 3.5)


    One Sample t-test

data:  datos$promedio_acad
t = 11.482, df = 92, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 3.5
95 percent confidence interval:
 3.743571 3.845462
sample estimates:
mean of x 
 3.794516

Presentando resultados de la prueba anterior, de forma ordenada (tidy):

Código

prueba_t1 <- t.test(
  x = datos$promedio_acad,
  alternative = "two.sided",
  conf.level = 0.95,
  mu = 3.5
)

library(broom)
prueba_t1 |> tidy()

Alternativa no parámetrica 1: Test de Wilcoxon

Test de Wilcoxon

Código

wilcox.test(
  x = datos$promedio_acad,
  alternative = "two.sided",
  conf.int = TRUE,
  conf.level = 0.95,
  mu = 3.5
)


    Wilcoxon signed rank test with continuity correction

data:  datos$promedio_acad
V = 3465.5, p-value = 6.357e-14
alternative hypothesis: true location is not equal to 3.5
95 percent confidence interval:
 3.794980 3.884976
sample estimates:
(pseudo)median 
       3.84006

Alternativa no parámetrica 2: Bootstrapping

Muestreo

Código

ejemplo <- c(45, 32.5, 85.3, 74.3, 110, 26.8, 28.6)

set.seed(2024)
remuestreo1 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo2 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo3 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo4 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo5 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo6 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo7 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo8 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo9 <- sample(ejemplo, size = 100, replace = TRUE)
remuestreo10 <- sample(ejemplo, size = 100, replace = TRUE)

Calculamos el promedio de la muestra original:

Código

mean(ejemplo)

[1] 57.5

Calculamos el promedio de cada remuestreo:

Código

prom_r1 <- mean(remuestreo1)
prom_r2 <- mean(remuestreo2)
prom_r3 <- mean(remuestreo3)
prom_r4 <- mean(remuestreo4)
prom_r5 <- mean(remuestreo5)
prom_r6 <- mean(remuestreo6)
prom_r7 <- mean(remuestreo7)
prom_r8 <- mean(remuestreo8)
prom_r9 <- mean(remuestreo9)
prom_r10 <- mean(remuestreo10)

vector_promedios <- c(prom_r1, prom_r2, prom_r3, prom_r4, prom_r5,
                      prom_r6, prom_r7, prom_r8, prom_r9, prom_r10)

promedio_remuestreos <- mean(vector_promedios)

ggplot(mapping = aes(x = vector_promedios)) +
  geom_density() +
  geom_vline(xintercept = promedio_remuestreos, color = "red")

Boootstrapping

Código

ejemplo <- c(45.67, 67.87, 65, 70, 110, 35.7)

sample(ejemplo, size = 7, replace = TRUE)

[1]  45.67 110.00  70.00  45.67  35.70  70.00  45.67

Proceso con biblioteca `infer`

1. Especificar las variables con la función specify()
1. Generar réplicas (remuestreo) con la función generate()
1. Calcular la estadísticas de resumen con la función calculate()
1. Visualice los resultados con la función visualize()
1. (opcional) Construir intervalos de confianza con la función get_confidence_interval(). Nota: para mejorar la visualización de los intervalos de confianza, se puede utilizar la función shade_confidence_interval()

Código

set.seed(2024)
bootstrap_promedio_udea <- 
  datos |> 
  specify(response = promedio_acad) |> 
  generate(reps = 1000, type = "bootstrap") |> 
  calculate(stat = "mean")

bootstrap_promedio_udea

Graficamos la distribución bootstrap:

Código

bootstrap_promedio_udea |> 
  visualize()

Intervalos de confianza

{fig-align=“center” width = “70%”}

Método de percentiles

Intervalo de confianza con percentiles (95%):

Código

ic_promedio_percentil <-
  bootstrap_promedio_udea |> 
  get_confidence_interval(level = 0.95, type = "percentile")
ic_promedio_percentil

Graficamos el intervalo de confianza obtenido con el método de percentiles:

Código

bootstrap_promedio_udea |> 
  visualize() +
  shade_confidence_interval(endpoints = ic_promedio_percentil) +
  geom_vline(
    xintercept = x_barra,
    color = "red",
    lty = 2,
    size = 1.5
  ) +
  geom_vline(
    xintercept = mean(datos$promedio_acad),
    color = "black",
    lty = 2,
    size = 1.5
  )

Método de error estándar

Intervalo de confianza con método del error estándar:

Código

ic_promedio_error_est <-
  bootstrap_promedio_udea |> 
  get_confidence_interval(type = "se", point_estimate = x_barra)
ic_promedio_error_est

Graficamos el intervalo de confianza obtenido con el método de percentiles:

Código

bootstrap_promedio_udea |> 
  visualize() +
  shade_confidence_interval(endpoints = ic_promedio_error_est) +
  geom_vline(
    xintercept = x_barra,
    color = "red",
    lty = 2,
    size = 1.5
  ) +
  geom_vline(
    xintercept = mean(datos$promedio_acad),
    color = "black",
    lty = 2,
    size = 1.5
  )

:::

Referencia

Libro: Statistical Inference via Data Science: A ModernDive into R and the Tidyverse

--- title: "Inferencia Estadística" subtitle: "Diseño Experimental" author: "Edimer David Jaramillo" date: "`r Sys.Date()`" lang: es execute: eval: true echo: true warning: false format: html: page-layout: article fig-width: 6 fig-height: 4.5 toc: true toc-title: "Tabla de contenido" smooth-scroll: true code-fold: true df-print: paged toc-location: left number-depth: 4 theme: yeti code-copy: true highlight-style: github code-tools: source: true --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE, eval = TRUE, fig.align = "center", fig.width = 5.5, fig.height = 4.5, warning = FALSE, message = FALSE) ``` # Bibliotecas ```{r} library(tidyverse) library(readxl) library(infer) theme_set(theme_bw()) ``` # Datos ```{r} datos <- read_excel("datos/datos-encuestas-historia.xlsx") datos ``` # Escenarios de inferencia ![](tabla.png){fig-align="center"} # Hipótesis estadística ![](https://justtothepoint.com/library2/ProgramacionLinux/12_html_m71eebd25.gif){fig-align="center"} # Tipos de pruebas ![](https://blogs.ugto.mx/enfermeriaenlinea/wp-content/uploads/sites/43/2018/03/ESTA-UNI3-LPH-006.png){fig-align="center"} # Tipos de errores ![](https://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadInferencia/ContrasteDeHipotesis/4TiposdeErrores/img/TiposErrores.png){fig-align="center"} # Inferencia sobre una población ## Inferencia sobre la media ### Normalidad de la variable ```{r} ggpubr::ggqqplot(datos$promedio_acad) ``` ### Juego de hipótesis $$H_0: \mu = 3.5$$ $$H_1: \mu \neq 3.5$$ ### Nivel de significancia - Vamos a utilizar un nivel de significancia del 5% ($\alpha = 0.05$) ### Calcular el estadístico observado - En este caso calculamos el estadístico T: $$T = \frac{\bar{X} - \mu}{S/\sqrt{n}}$$ ```{r} x_barra <- mean(datos$promedio_acad, na.rm = TRUE) mu_referencia <- 3.5 desviacion_muestral <- sd(datos$promedio_acad, na.rm = TRUE) raiz_n <- sqrt(nrow(datos)) ``` $$T = \frac{3.794516 - 3.5}{0.247371/9.643651} = 11.48158$$ ```{r} (x_barra - mu_referencia) / (desviacion_muestral / raiz_n) ``` ### Región de rechazo ![](https://blogs.ugto.mx/enfermeriaenlinea/wp-content/uploads/sites/43/2018/03/ESTA-UNI3-LPH-001.png){fig-align="center"} - [Tabla t-student](https://cms.dm.uba.ar/academico/materias/1ercuat2015/probabilidades_y_estadistica_C/tabla_tstudent.pdf) - Podemos obtener los límites critícos con R: ```{r} qt(p = 0.025, df = 92, lower.tail = TRUE) qt(p = 0.025, df = 92, lower.tail = FALSE) ``` ![](pruebat1.png){fig-align="center"} - **Conclusión:** como el estadístico calculado (11.48158) está dentro de las regiones de rechazo, existe evidencia para rechazar la hipótesis nula, es decir, que se rechaza que el promedio del promedio_académico sea igual a 3.5. Esto se concluye con un nivel de significancia del 5%. ### Intervalo de confianza para $\mu$ - Límite inferior del intervalo de confianza: $$\bar{X} - t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}$$ ```{r} x_barra - (1.986086 * (desviacion_muestral / raiz_n)) ``` - Límite superior del intervalo de confianza: $$\bar{X} + t_{\alpha/2, n-1} \times \frac{s}{\sqrt{n}}$$ ```{r} x_barra + (1.986086 * (desviacion_muestral / raiz_n)) ``` - **Conclusión:** como el valor de referencia (3.5) no está dentro del intervalo de confianza, existe evidencia para rechazar la hipótesis nula, es decir, que se rechaza que el promedio del promedio_académico sea igual a 3.5. Esto se concluye con un nivel de significancia del 5%. Como el intervalo de confianza está a la derecha del valor de referencia (3.5) podemos afirmar que la media del promedio académico de los estudiantes es mayor a 3.5 ### Valor p - Calcular el área que deja un valor de 11.48158 a la izquierda: ```{r} pt(q = -11.48158, df = 92, lower.tail = TRUE) ``` - Calcular el área que deja un valor de 11.48158 a la derecha: ```{r} pt(q = 11.48158, df = 92, lower.tail = FALSE) ``` - El valor p es la suma de las dor áreas anteriores: ```{r} 9.287894e-20 + 9.287894e-20 ``` - **Conclusión:** como el valor p (1.857579e-19) es menor que el nivel de significancia (0.05) existe evidencia para rechazar la hipótesis nula. ### Solución con R - Utilizamos la función t.test() con los siguientes argumentos: - `x:` la variable sobre la cual estamos haciendo inferencia. En este caso el promedio_académico - `alternative`: tipo de hipótesis alternativa. En este es una prueba bilateral usamos "two.sided" - `conf.level`: nivel de confianza (1 - nivel de significancia = 1 - 0.05 = 0.95) - `mu`: valor promedio de referencia. En este caso es 3.5 ```{r} t.test(x = datos$promedio_acad, alternative = "two.sided", conf.level = 0.95, mu = 3.5) ``` - Presentando resultados de la prueba anterior, de forma ordenada (tidy): ```{r} prueba_t1 <- t.test( x = datos$promedio_acad, alternative = "two.sided", conf.level = 0.95, mu = 3.5 ) library(broom) prueba_t1 |> tidy() ``` # Alternativa no parámetrica 1: Test de Wilcoxon - [Test de Wilcoxon](https://es.wikipedia.org/wiki/Prueba_de_los_rangos_con_signo_de_Wilcoxon) ```{r} wilcox.test( x = datos$promedio_acad, alternative = "two.sided", conf.int = TRUE, conf.level = 0.95, mu = 3.5 ) ``` # Alternativa no parámetrica 2: Bootstrapping ## Muestreo ```{r} ejemplo <- c(45, 32.5, 85.3, 74.3, 110, 26.8, 28.6) set.seed(2024) remuestreo1 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo2 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo3 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo4 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo5 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo6 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo7 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo8 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo9 <- sample(ejemplo, size = 100, replace = TRUE) remuestreo10 <- sample(ejemplo, size = 100, replace = TRUE) ``` - Calculamos el promedio de la muestra original: ```{r} mean(ejemplo) ``` - Calculamos el promedio de cada remuestreo: ```{r} prom_r1 <- mean(remuestreo1) prom_r2 <- mean(remuestreo2) prom_r3 <- mean(remuestreo3) prom_r4 <- mean(remuestreo4) prom_r5 <- mean(remuestreo5) prom_r6 <- mean(remuestreo6) prom_r7 <- mean(remuestreo7) prom_r8 <- mean(remuestreo8) prom_r9 <- mean(remuestreo9) prom_r10 <- mean(remuestreo10) vector_promedios <- c(prom_r1, prom_r2, prom_r3, prom_r4, prom_r5, prom_r6, prom_r7, prom_r8, prom_r9, prom_r10) promedio_remuestreos <- mean(vector_promedios) ggplot(mapping = aes(x = vector_promedios)) + geom_density() + geom_vline(xintercept = promedio_remuestreos, color = "red") ``` ## Boootstrapping ::: {.panel-tabset} - [Fuente de imágenes: Introduction to Modern Statistics](https://openintro-ims.netlify.app/foundations-bootstrapping.html) ### Muestreo: Idea intuitiva <center> <img src = "https://cdn-images-1.medium.com/max/1000/1*lSqSQKjK7ry9sw5TqlCMbA.png" /> </center> ### Bootstrapping: Idea intuitiva ![](https://openintro-ims.netlify.app/images/boot1prop2.png){fig-align="center" width="70%"} ### Bootstrapping: aplicación práctica ![](https://openintro-ims.netlify.app/images/boot1prop4.png){fig-align="center" width="70%"} ### Muestreo con reemplazo ```{r} ejemplo <- c(45.67, 67.87, 65, 70, 110, 35.7) sample(ejemplo, size = 7, replace = TRUE) ``` ::: ## Proceso con biblioteca `infer` - 1. Especificar las variables con la función **`specify()`** - 2. Generar réplicas (remuestreo) con la función **`generate()`** - 3. Calcular la estadísticas de resumen con la función **`calculate()`** - 4. Visualice los resultados con la función **`visualize()`** - 5. (opcional) Construir intervalos de confianza con la función **` get_confidence_interval()`**. **Nota:** para mejorar la visualización de los intervalos de confianza, se puede utilizar la función **`shade_confidence_interval()`** ![](https://d33wubrfki0l68.cloudfront.net/1cd0a53125c3b7dc4b12c04780f7f5b204ecbb1e/98111/images/flowcharts/infer/visualize.png){fig-align="center" width="70%"} ```{r} set.seed(2024) bootstrap_promedio_udea <- datos |> specify(response = promedio_acad) |> generate(reps = 1000, type = "bootstrap") |> calculate(stat = "mean") bootstrap_promedio_udea ``` - Graficamos la distribución bootstrap: ```{r} bootstrap_promedio_udea |> visualize() ``` ## Intervalos de confianza ![](https://moderndive.com/images/flowcharts/infer/ci_diagram.png){fig-align="center" width = "70%"} ### Método de percentiles - Intervalo de confianza con percentiles (95%): ```{r} ic_promedio_percentil <- bootstrap_promedio_udea |> get_confidence_interval(level = 0.95, type = "percentile") ic_promedio_percentil ``` - Graficamos el intervalo de confianza obtenido con el método de percentiles: ```{r} bootstrap_promedio_udea |> visualize() + shade_confidence_interval(endpoints = ic_promedio_percentil) + geom_vline( xintercept = x_barra, color = "red", lty = 2, size = 1.5 ) + geom_vline( xintercept = mean(datos$promedio_acad), color = "black", lty = 2, size = 1.5 ) ``` ### Método de error estándar - Intervalo de confianza con método del error estándar: ```{r} ic_promedio_error_est <- bootstrap_promedio_udea |> get_confidence_interval(type = "se", point_estimate = x_barra) ic_promedio_error_est ``` - Graficamos el intervalo de confianza obtenido con el método de percentiles: ```{r} bootstrap_promedio_udea |> visualize() + shade_confidence_interval(endpoints = ic_promedio_error_est) + geom_vline( xintercept = x_barra, color = "red", lty = 2, size = 1.5 ) + geom_vline( xintercept = mean(datos$promedio_acad), color = "black", lty = 2, size = 1.5 ) ``` ::: # Referencia - Libro: [Statistical Inference via Data Science: A ModernDive into R and the Tidyverse](https://moderndive.com/) ![](https://moderndive.com/images/logos/book_cover.png){width="50%"}

Bibliotecas

Datos

Escenarios de inferencia

Hipótesis estadística

Tipos de pruebas

Tipos de errores

Inferencia sobre una población

Inferencia sobre la media

Normalidad de la variable

Juego de hipótesis

Nivel de significancia

Calcular el estadístico observado

Región de rechazo

Intervalo de confianza para \(\mu\)

Valor p

Solución con R

Alternativa no parámetrica 1: Test de Wilcoxon

Alternativa no parámetrica 2: Bootstrapping

Muestreo

Boootstrapping

Proceso con biblioteca infer

Intervalos de confianza

Método de percentiles

Método de error estándar

Referencia

Proceso con biblioteca `infer`