martes, 11 de junio de 2024

Jamovi | Introducción a la prueba t de Welch

Anteriormente hemos visto el procedimiento tanto paramétrico (T de Student) como no paramétrico (U de Mann-Whitney) para analizar las diferencias significativas entre dos grupos con respecto a una o varias variables dependientes. Sin embargo, existe una tercera prueba que es interesante conocer: la t de Welch

Prueba t de Welch

En términos coloquiales, la t de Welch (Welch's t-test en inglés) es la "hermana" de la prueba T de Student, es decir, son estadísticos que forman parte del grupo de procedimientos paramétricos (que los datos muestrales de las variables dependientes proceden de poblaciones que siguen una distribución normal). Diferenciaremos a ambas en función de la letra mayúscula o minúscula. 

La diferencia más importante entre la t de Welch y la T de Student es que la primera puede "funcionar" sin necesidad de asumir la igualdad de varianzas. La siguiente ilustración muestra los supuestos que se deben cumplir para la familia de estadísticos de las pruebas t para muestras independientes (independent t-test en inglés):



En efecto, la única diferencia que existe entre la T de Student y la t de Welch es el supuesto de homogeneidad de varianzas, que se puede examinar mediante el test de Levene. Ahora bien, antes de estudiar la homogeneidad de varianzas se deberá determinar la idoneidad entre la estadística paramétrica o la no paramétrica. Para ello, primeramente, deberemos analizar la distribución de la variable dependiente, con el objetivo de ver si esta sigue una distribución normal. Haz clic en el siguiente botón para recordar el análisis de los supuestos que normalidad que no se reiterarán en esta entrada para no hacerla más densa:



En definitiva, usaremos la t de Welch cuando queramos comprobar las diferencias entre dos grupos independientes con respecto a una variable dependiente cuantitativa continua siempre y cuando siga una distribución normal pero no se pueda garantizar la homogeneidad de varianzas.



Caso práctico

Una humilde investigación pretende analizar la cantidad de libros que se han leído en el último año teniendo en cuenta la mayoría de edad. Para ello, se ha preguntado al azar a 8 personas (4 menores de edad y 4 mayores de edad) por los libros que leyeron durante el año pasado. Con ello, se pretende averiguar si hay una diferencia estadísticamente significativa entre la cantidad de libros leídos por las personas mayores de edad con respecto a las personas menores de edad.

Estos datos ficticios se introdujeron en una base de datos de Jamovi (formato .omv) para su posterior análisis estadístico. Para este ejemplo se empleó la la versión 2.3.287 en un ordenador Windows 10. Se recuerda que el procedimiento que se va a mostrar a continuación en un ordenador Mac es idéntico. Puedes hacer clic en el siguiente botón para acceder a la base de datos cuyo nombre es Lectura y practicar la ejecución de la prueba t de Welch.




Procedimiento

Se debe recordar que para proceder con esta prueba, previamente se debe haber analizado la distribución normal de la variable dependiente objeto de estudio (en este caso libros leídos en un año). Puedes hacer clic en el botón verde anterior para recordar cómo se realiza este procedimiento con Jamovi. Nótese que esta misma prueba se puede hacer a continuación en el apartado de Comprobaciones de Supuestos

Ahora, en el menú Análisis pulsamos sobre Pruebas T y, a continuación, sobre Prueba T para muestras independientes. A continuación, introduciremos la variable dependiente (en este caso Libros) en su espacio correspondiente y la variable de agrupación de dos categorías (en este caso Mayor_Edad; con los valores Sí y No) en su casilla correspondiente. Anteriormente, como ya habíamos analizado el supuesto de normalidad, sabíamos qué prueba seleccionar. En este caso, y en otros similares en los que no tenemos ni idea de la naturaleza de la distribución, se recomienda realizar las pruebas de homogeneidad y de normalidad antes de seleccionar la prueba estadística adecuada en el apartado correspondiente. 

Ya sabemos que los datos de la variable dependiente se distribuyen normalmente (puesto que se ha realizado previamente la prueba de Shapiro-Wilk --no expuesta en esta entrada--). Ahora, debemos confirmar que la homogeneidad de varianza sea similar para determinar si se realiza la prueba T de Student o la prueba t de Welch. Para ello, tendremos que invocar el test de Levene seleccionando, en el apartado de Comprobaciones de supuestos,  la Prueba de Homogeneidad.
  • En resumidas cuentas, para que se cumpla el supuesto de homogeneidad de variables con el test de Levene la significación debe ser mayor que 0,050 (p-valor > 0,050).

Cuando ya sepamos esta información, siguiendo con la ilustración anterior, deberemos seleccionar la prueba correspondiente en el apartado de Prueba (en este caso, según los supuestos, la prueba t de Welch). Además, será interesante seleccionar la diferencia de medias, el tamaño del efecto y las estadísticas descriptivas del apartado Estadísticas Adicionales que se mostrarán en la ventana de resultados; tal y como se muestra en la siguiente imagen:




Resultados

La interpretación de la prueba t de Welch es muy similar a la de la prueba T de Student y U de Mann-Whitney. Simplemente, debemos mirar el p-valor para determinar si hay diferencias estadísticamente significativas (p-valor < 0,050) en las medias de los dos grupos, tal y como se muestra en la siguiente imagen:



En este ejemplo, se observa que el p-valor es mayor a 0,050. Por tanto, tenemos evidencias suficientes para respaldar hipótesis nula y asegurar que las medias de los grupos son similares. Por tanto, no hay diferencias estadísticamente significativas entre los libros leídos por personas mayores de edad (M = 2; DT = 0) y los libros leídos por menores de edad (M = 3; DT = 1,15) [t(3) = -1,73; p = 0,182; d = -1.22]. No obstante, nuevas evidencias son necesarias para confirmar esta tendencia puesto que el tamaño muestral (n = 8) es extremadamente bajo. 



Redacción e interpretación final

La redacción de los resultados es similar a las pruebas de esta misma familia vistas anteriormente. Sencillamente tendremos que reportar el estadístico t junto con los grados de libertad, seguido del p-valor y del valor del tamaño del efecto.

A continuación se muestra una propuesta de redacción tanto en español como en inglés. En azul todos aquellos elementos que se deben sustituir en función de los resultados particulares.
  • Mediante la prueba estadística t de Welch, (no) se aprecia una diferencia estadísticamente significativa en la variable dependiente objeto de estudio entre el grupo A (Media; Desviación Típica) y el grupo B (Media; Desviación Típica) [t(grados de libertad) = Estadístico; p-valor; tamaño del efecto d].
  • Using a Welch's t-test, there was (not) a statistically significant difference in the dependent variable between group A (Mean; Standard Deviation) and group B (Mean; Standard Deviation) [t(degrees of freedom) = Statistic; p-value; d-effect size].


Seguir aprendiendo

Lo siguiente que vamos a ver es un análisis similar a los tres que hemos visto en estas últimas entradas pero teniendo en cuenta que la variable independiente puede tener tres o más grupos. Haz clic en el siguiente botón para acceder al procedimiento para calcular un ANOVA de un factor:



Jacob Sierra Díaz y Alti

No hay comentarios:

Publicar un comentario