miércoles, 13 de noviembre de 2024

R - Estadística | Diferencia significativa de un grupo sobre otro

En los últimos días hemos visto la forma de realizar pruebas estadísticas para demostrar diferencias significativas (o no) entre dos grupos teniendo en cuenta una variable dependiente. Puedes hacer clic en los siguientes botones para acceder a las entradas para recordar estas pruebas. 






En esencia con estas pruebas estadísticas contrastamos dos hipótesis.

En el caso de las pruebas paramétricas:

  • Ho | Las medias de los dos grupos (a y b) son iguales | Xa = Xb
  • H1 | Las medias de los dos grupos (a y b) no son iguales | Xa ≠ Xb


En el caso de las pruebas no paramétricas:
  • Ho | Las medianas de los dos grupos (a y b) son iguales | Ma = Mb
  • H1 | Las medianas de los dos grupos (a y b) no son iguales | Ma ≠ Mb


Contraste de un grupo distinto a otro (Ya > Yb)

En las cuatro entradas anteriores hemos aprendido que si hacemos estos test por defecto en el entorno de R, verificaremos si hay que aceptar la hipótesis nula (Ho) o aceptar la hipótesis alternativa (H1). Pero este test solo nos da información sobre igualdad o desigualdad significativa (entre los dos grupos).

Para saber qué grupo es superior (o inferior) podemos extraer las medias y las cuasidesviaciones típicas de ambos grupos en el entorno R. Sin embargo, también se puede añadir una instrucción dentro de las funciones del test seleccionado. Entonces, cuando queramos verificar que la media (o la mediana) del grupo A es superior a la media (o mediana) del grupo B [Grupo A > Grupo B], esta la colocaremos como hipótesis alternativa (H1) ya que es lo deseable. Por tanto, debemos convertir el contraste de hipótesis que acabamos de ver a:
  • Ho | La medida (media o mediana) del grupo a es inferior a la del grupo b | Ya ≤ Yb
  • H1 | La medida del grupo a es inferior a la del grupo b | Ya > Yb

En este caso la instrucción que se debe integrar dentro de la función de los test ya aprendidos es alternative = "greater"Vamos a recuperar un ejemplo de los vistos anteriormente para ver cómo se puede efectuar este contraste.


Caso práctico

Una residencia universitaria ha analizado la velocidad en la que sus residentes comen (medido en minutos). En concreto, quieren saber si hay diferencias significativas entre la velocidad en la que comen los chicos y la velocidad en la que lo hacen las chicas. A los alumnos se les pidió permiso para analizar las cámaras de seguridad del comedor y medir el tiempo en el que cogen la bandeja, comen y la vuelven a dejar para evitar la medida in situ no sesgue los resultados. Los resultados de velocidad son los siguientes:
    - Chicos: 5,3; 6,3; 7,8; 8,6; 8,9; 10,3; 11,5; 12,1; 13,3; 17,6; 14,3
    - Chicas: 11,5; 12,1; 16,3; 17,8; 24; 28,9; 40,6; 34,3; 33

Ya vimos este ejemplo en la entrada correspondiente al test de Welch. Puedes hacer clic en el botón verde correspondiente indicado anteriormente para acceder al procedimiento completo. Se recuerda que para este tipo de prueba tenemos que verificar el supuesto de normalidad; cuestión que aquí no se mostrará.

Para este ejemplo, se empleará directamente el entorno R (versión 4.3.1) en un ordenador MacBook Pro (con sistema operativo MacOS Ventura). Este mismo proceso se puede hacer en un ordenador con sistema operativo Windows. Por supuesto, este mismo proceso se puede ejecutar en RStudio. Los datos se introducirán directamente en la consola de R mediante dos variables vectoriales con los nombres del sexo de los residentes.


Procedimiento

En primer lugar, se introducirán los datos en modo de variable vectorial. En concreto, se crearán dos variables poniendo los datos separados por comas. En este caso, el orden de los datos no importan.

> Chicos = c(5.3, 6.3, 7.8, 8.6, 8.9, 10.3, 11.5, 12.1, 13.3, 17.6, 14.3)

> Chicas = c(11.5, 12.1, 16.3, 17.8, 24, 28.9, 40.6, 34.3, 33)

Recordemos que nuestro contraste de hipótesis establece que:
  •  Ho: Chicos ≤ Chicas | p-valor > 0,050
  •  H1: Chicos > Chicas | p-valor < 0,050

La función del test de Welch para este contraste de hipótesis quedará, por tanto de esta forma:

t.test (Chicos, Chicas, var.equal = F, alternative = "greater")


Resultados e interpretación

El resultado que deberemos mirar es el p-valor de esta prueba. Nos tenemos que dar cuenta si es mayor a 0,050 (en tal caso las chicas tienen una media significativamente mayor) o si es menor a 0,050 (en tal caso, los chicos tienen una media significativamente mayor). Esto mismo se puede verificar solicitando las medias de ambos grupos, mediante mean (Nombre de la variable vectorial del grupo) tal y como se muestra en la siguiente imagen: 


  • Se tienen suficientes evidencias como para mantener la hipótesis alternativa (Ho) de que el grupo de chicas tiene una media significativamente mayor de la velocidad de comida que los chicos.


Seguir aprendiendo

A continuación,




Jacob Sierra Díaz y Alti

No hay comentarios:

Publicar un comentario