Taller 2
Diseño Experimental
Descripción
Este taller tiene como objetivo construir modelos que permitan hacer inferencias válidas acerca de los fenómenos bajo análisis, el proceso de inferencia puede o no ser predictivo (usted lo decide, no es estrictamente necesario). Como en cualquier análisis estadístico, la descripción y exploración de datos es fundamental para el desarrollo de su trabajo. Deberá elegir alguno de los casos de uso planteados en la descripción de las bases de datos. Recuerde que muchas veces el mejor modelo no es el que tiene más predictoras. No olvide presentar el análisis de residuales de su modelo final.
Bases de datos
Estadísticas de jugadores FIFA
- Fuente de datos: FIFA Players Dataset - Kaggle
- Descargar datos para taller
- Objetivo: constuir un modelo estadístico que permita estimar el valor (
valor_eur
) de jugadores y jugadoras de fútbol con base en métricas de desempeño, información general, atributos físicos, etc. - Algunas aplicaciones de su análisis:
- El modelo que construya debe permitir a un empresario del fútbol estimar de manera precisa el valor de un jugador o jugadora de fútbol en una liga específica, además, incluir un intervalo de confianza para dicha estimación.
- Los resultados del análisis descriptivo y exploratorio deben facilitar la comparación de ligas, posiciones, nacionalidades, etc.
- Es indispensable que muestre en sus resultados la progresión de los jugadores a través del tiempo (diferentes versiones de FIFA), por ejemplo ¿cuánto aumenta o disminuye su valor en el mercado? ¿Sus habilidades suben o bajan a qué velocidad (tasa de cambio del parámetro)?
Abejas y pesticidas neonicotinoides
- Fuente de datos: Abejas y pesticidas neonicotinoides - Kaggle
- Descargar datos para taller
- Objetivo: el objetivo con este conjunto de datos es construir un modelo estadístico que permita entender si existe alguna relación entre la cantidad de insecticidas y el rendimiento (
rto_colonia
). - Algunas aplicaciones de su análisis:
- Su modelo debe habilitar la opción de estimar el rendimiento en función de la cantidad de insecticida que se usa.
- Su análisis descriptivo y exploratorio debe proporcionar elementos para responder a esta pregunta: “¿Por qué los neonicotinoides parecen causar daños tan graves en algunos lugares (por ejemplo, Dakota del Norte) pero no tanto en otros?”
- Muestre cómo ha sido el comportamiento temporal de la cantidad de insecticidad aplicado y cuál es la relación con el precio de la miel.
Descripción de variables
- estado: estado
- nombre_estado: nombre del estado
- year_es: año de registro
- numcol: Número de colonias productoras de miel. Las colonias productoras de miel son el número máximo de colonias de las cuales se extrajo miel durante el año. Es posible extraer miel de colonias que no sobrevivieron todo el año.
- rto_colonia: Rendimiento de miel por colonia. La unidad es libras.
- producción_total: Producción total (numcol x rto_colonia). La unidad es libras.
- inventario: Se refiere a las existencias mantenidas por los productores. La unidad es libras.
- precio_libra: Se refiere al precio promedio por libra basado en ventas ampliadas. La unidad es dólares.
- valor_producción: Valor de la producción (producción_total x precio_por_libra). La unidad es dólares.
- nCLOTHIANIDIN: La cantidad en kg de CLOTHIANIDIN aplicada.
- nIMIDACLOPRID: La cantidad en kg de IMIDACLOPRID aplicada.
- nTHIAMETHOXAM: La cantidad en kg de THIAMETHOXAM aplicada.
- nACETAMIPRID: La cantidad en kg de ACETAMIPRID aplicada.
- nTHIACLOPRID: La cantidad en kg de THIACLOPRID aplicada.
- nTodos_Neónicos: La cantidad en kg de todos los Neónicos aplicados = (nCLOTHIANIDIN + nIMIDACLOPRID + nTHIAMETHOXAM + nACETAMIPRID + nTHIACLOPRID).
Base de datos libre
Si no quiere trabajar con ninguna de las dos bases de datos anteriores siéntase libre de buscar alguna de su interés, los siguientes son recursos donde podrá encontrar bases de datos, sin embargo, no es estrictamente obligatorio que sea obtenida en alguno de estos, si tiene una base de datos que desee trabajar en el taller la puede utilizar. Nota importante: la base de datos que seleccione debe ser de utilidad para construir modelos estadísticos y realizar inferencias, usted mismo (a) deberá definir el objetivo.
Fecha de entrega
- Máximo el domingo 10 de noviembre de 2024.
- El entregable de este taller es un documento pdf de máximo 3 páginas y debe incluir como mínimo lo siguiente:
- Resumen
- Introducción
- Metodología
- Interpretación y análisis de resultados
- Conclusiones
- La actividad podrá ser desarrollada de forma individual o máximo en parejas.