domingo, 16 de junio de 2024

Jamovi | Introducción a la prueba de bondad de ajuste Chi-cuadrado

La prueba de bondad de ajuste Chi-cuadrado (X2; Chi-square Goodness-of-fit en inglés) sirve para verificar si la distribución observada de las variables independientes nominales (por ejemplo, color favorito) coincide con las distribución de frecuencias esperadas. En esencia, estamos hablando de un contraste de hipótesis:

  • Hipótesis nula [Ho]. Las frecuencias observadas son coincidentes con las frecuencias esperadas. Esto quiere decir que las frecuencias de las categorías de la(s) variable(s) independiente(s) son como se esperaban.
  • Hipótesis alternativa [H1]. Al menos una frecuencia observada no encaja con la frecuencia esperada. Esto quiere decir que las frecuencias de, por lo menos, una categoría de la variable independiente, no es como se esperaba.
Es recomendable que estas hipótesis se adapten a la naturaleza de nuestros datos específicos. Al no haber direccionalidad en este test, no podemos hablar de hipótesis de una cola o hipótesis de dos colas. Por tanto, tal y como se muestra en la siguiente imagen, lo único que necesitamos para hacer esta prueba es una variable nominal divida por categorías.




Caso práctico

Hoy hemos pedido a diez personas diferentes que sacasen una carta de una baraja de póker francés. Hemos apuntado simplemente los palos: corazones, diamantes, tréboles o picas. En la base de datos simplemente hemos puesto el identificador de cada persona (que corresponde al orden en el que ha sacado la carta con respecto al resto de personas) junto con el palo extraído. 
Los datos que se han extraído son los siguientes: el sujeto 1 ha extraído diamante, el 2 diamante, el 3 picas, el 4 corazones, el 5 trébol, el 6 corazones, el 7 picas, el 8 diamantes, el 9 picas, el 10 corazones, el 11 diamantes, el 12 tréboles, el 13 picas, el 14 corazones, el 15 tréboles, el 16 corazones, el 17 picas, el 18 diamantes, el 19 picas, el 20 corazones, el 21 tréboles, el 22 diamantes, el 23 picas, el 24 corazones, el 25 trébol, el 26 corazones, el 27 picas, el 28 tréboles, el 29 picas y el 30 corazones. Se desea conocer si los sujetos han elegido sus cartas de una manera aleatoria. 

Sabemos que un mazo de cartas de póker se suele componer de 52 cartas, de las cuales 13 son de cada palo. Al haber cuatro palos, un cuarto (1/4) es el 25% de extraer aleatoriamente cada palo de la mesa. Por tanto, esta información nos ayudará a configura la hipótesis de partida.

Estos datos ficticios se van a introducir en una base de datos de Jamovi (versión 2.3.287) para su posterior análisis. En concreto tendrá dos variables: ID y Palo. Todo este procedimiento se realizará en un ordenador con sistema operativo Windows 10. No obstante, este mismo procedimiento será idéntico en un ordenador Mac.



Procedimiento

Lo primero que tenemos que hacer, una vez conocido la naturaleza del experimento o investigación así como su finalidad, es configurar la hipótesis de investigación.

  • Hipótesis nula [Ho]. Esta es la que deseamos que se cumpla en la mayoría de los casos (al contrario que otras pruebas de contraste de hipótesis). Los participantes extraen las cartas de manera aleatoria del mazo. Esto significa que debe haber un 25% de probabilidades de extraer cada uno de los palos. 
  • Hipótesis alternativa [H1]. Los participantes no extraen las cartas de manera aleatoria. Esto significa que hay una probabilidad distinta al 25% de extraer cada uno de los palos.

Para poder realizar adecuadamente esta prueba se deber verificar simplemente un supuesto: que las frecuencias esperadas sean lo suficientemente grandes (esto es mayores que 5). Tal y como se muestra en la siguiente ilustración, este supuesto se verifica en la tabla de la Prueba de proporciones que se habilita en la opción de Frecuencias esperadas dentro de N Resultados (Chi-cuadrado de bondad de ajuste) en el menú Frecuencias, que está en el menú Análisis. Efectivamente, debemos verificar que las frecuencias esperadas sean mayores que 5 para poder dar por válido y continuar con esta prueba estadística.


Si hemos hecho el procedimiento anterior, de manera paralela hemos realizado el análisis de bondad de ajuste Chi-cuadrado. Recordemos que esto se habilita desde el menú Análisis, Frecuencias y N Resultados (Chi-cuadrado de bondad de ajuste). A continuación, introduciremos nuestra variable nominal objeto de estudio en su casilla correspondiente. Automáticamente se muestran los resultados en la parte derecha.



Resultados

Tenemos dos tablas como resultados. La que primero interesa ver es, curiosamente, la segunda. En concreto debemos ver si el p-valor es significativo o no para determinar la hipótesis que debemos apoyar. En este ejemplo, el p-valor de la prueba es 0,753 (muy superior a 0,050). Por tanto, debemos aceptar la hipótesis nula de que las frecuencias observadas coinciden con las frecuencias esperadas.

La primera tabla muestra las frecuencias observadas (de nuestra base de datos) y las frecuencias esperadas. Estas últimas frecuencias se calculan dividiendo la muestra entre las categorías de la variable (n/k). Por último, cabe destacar que esta prueba no contiene tamaños de efecto. 




Redacción e interpretación final

Este tipo de prueba requiere una explicación de las frecuencias junto con una justificación específica del valor que se le ha dado al contraste de hipótesis. Simplemente, recordar que el Chi-cuadrado se expresa con los grados de libertad entre paréntesis y el p-valor. A continuación se muestra el ejemplo de este caso práctico:
  • De los 30 participantes del experimento, 6 han escogido una carta del palo diamantes, 9 del palo picas, 9 del palo de corazones y 6 del palo de tréboles. Se deseaba conocer si verdaderamente estas extracciones han sido puramente aleatorias. Por tanto, se ha efectuado la prueba de bondad de ajuste chi-cuadrado para verificar que la probabilidades de elección fuesen iguales o similares en los cuatro palos. Dicho contraste no muestran una significación estadística (X(3) = 1,20; p = 0,753), sugiriendo la posibilidad de que los participantes seleccionaron sus cartas y palos de manera puramente aleatoria. Específicamente, se observa que tanto las picas como los corazones fueron extraído en un 30% cada uno; mientras que los diamantes y tréboles fueron extraídos en un 20% cada uno. 


Seguir aprendiendo

A continuación, aprenderemos a realizar una prueba Chi-cuadrado de independencia o Chi-cuadrado de Pearson que sirve para analizar la relación entre dos variables nominales. Haz cli en el siguiente botón para acceder al contenido.



Jacob Sierra Díaz y Alti

No hay comentarios:

Publicar un comentario