En las dos últimas entradas se mostró la forma de realizar en el entorno R la prueba T de Student y el test de Welch. Ambos procedimientos requieren que los datos objeto de estudio procedan de una distribución normal. A continuación, en caso de que la igualdad de varianzas no sea posible (p < 0,050), se deberá hacer el test de Welch. Puedes hacer clic en los siguientes botones para recordar ambos procedimientos:
Cuando las muestras objeto de estudio son lo suficientemente grandes (la suma de los dos grupos debe ser superior al menos a 30 sujetos; García-Pérez, 2015) y se verifica el supuesto de normalidad de los datos, se recomienda efectuar una prueba de contraste de hipótesis basada en la distribución normal.
- Hoy mostraremos cómo se realiza esta prueba y descubriremos la manera en la que se realizaba de manera manual con la ayuda de una tabla de referencia de la distribución normal.
Supuestos previos
Para realizar esta prueba básica únicamente se requiere que la muestra sea grande. Como se ha visto anteriormente la suma de ambos grupos debe ser igual o superior a 30 [n1 + n2 > 30]. Por esta misma razón, no se requerirá el supuesto de normalidad en las distribuciones objeto de estudio (García-Pérez, 2015).
Caso práctico
En una empresa privada de construcción se ha hecho un estudio a lo largo de 24 meses en el que se recogieron datos sobre el estrés sufrido por sus trabajadores. Esta empresa tiene dos grupos de trabajadores: el grupo de mañana y el grupo de tardes. Se desea saber si hay diferencias significativas sobre el nivel de estrés entre ambos grupos a un nivel de alfa igual a 0,05. Los datos que la empresa ha aportado una vez tabulado los datos en un Excel son:
- Grupo de mañanas (n = 313): media = 9,43; S2 = 32,4616
- Grupo de tardes (n = 303): media = 9,14; S2 = 26,2455
Si nos fijamos en la naturaleza de la muestra, nos daremos cuenta que tenemos dos grupos a comparar y una variable dependiente (nivel de estrés). Puesto que la muestra total es superior a 30, las varianzas poblacionales no se conocen y únicamente tenemos tres datos en cada grupo, lo conveniente es hacer el test basado en la normal. Para ello, vamos a tener en cuenta el contraste de hipótesis que debemos hacer:
Para este ejemplo emplearemos el entorno R únicamente como apoyo. Es decir, este ejemplo lo vamos a realizar con la tabla de referencia de la distribución normal. También se usará una calculadora científica; en concreto se usará la CASIO FX-991 SP CW Iberia. Por supuesto, cualquier tipo o modelo calculadora se podrá usar para este ejemplo.
Procedimiento
En primer lugar, sustituiremos la fórmula del contraste de hipótesis vista arriba con los datos de nuestro ejemplo. Con una calculadora científica se podrá realizar esta operación de una manera muy rápida.
Recordemos que para este contexto, alfa es el nivel de significación (alfa = 0,050) y que el nivel de confianza será 1 - alfa (1 - 0,050 = 0,95). A continuación, debemos de calcular el valor Z alfa/2 que consistirá en sustituir el alfa por el valor elegido (0,050 en este caso) y dividirlo entre dos. Entonces, el valor Z es 0,025. Con esto, sabemos que a la izquierda del área que describe la campana de distribución normal tenemos el resto: 1 - alfa/2; 1 - 0,025 = 0,975.
Ahora tenemos que buscar el valor Z. Para ello, tenemos que irnos a la tabla de distribución normal y encontrar ese valor dentro de la misma (no en la primera fila o columna). El valor Z surgirá de sumar la primera fila y la primera columna de nuestro número anterior, tal y como se muestra en la siguiente imagen:
Por tanto, Z alfa/2 ó Z 0,025 es igual a 1,96.
Entonces, deberemos comparar el resultado de la fórmula del contraste de hipótesis con el valor Z 0,025 que, en este caso es 1,96. Tal y como aparece en la imagen del contraste de hipótesis de arriba, si el valor Z 0,025 (es decir, 1,96) es mayor que el resultado obtenido, debemos aceptar la hipótesis nula de igualdad de medias. Si, por el contrario, el resultado obtenido es mayor que el valor Z 0,025 (es decir, 1,96) tenemos evidencias suficientes para rechazar la hipótesis nula y aceptar la hipótesis alternativa.
Con R podemos sustituir la labor de consultar la tabla de la distribución normal y obtener directamente el valor Z 0,025 aplicando la siguiente función:
> qnorm (0.975)
[1] 1.959964
Resultado e interpretación
Para llegar al resultado debemos tener el número que hemos extraído de la fórmula del contraste y el valor de Z alfa/2. En este caso observamos que el valor de la fórmula (0,1221) es inferior al valor de Z alfa/2 (1,96).
- 0,1221 < 1,96
Entonces, recurriendo a la primera ilustración de esta entrada, veremos como en este caso debemos aceptar la hipótesis nula o Ho. Por tanto, no podemos inferir una diferencia significativa entre ambos grupos. En otras palabras, debemos aceptar la no existencia de diferencias significativas.
Fuente bibliográfica
Referencia en estilo APA-7:
- García-Pérez, A. (2015). La interpretación de los dato: una introducción a la Estadística Aplicada. Librería UNED.
Seguir aprendiendo
En
Jacob Sierra Díaz y Alti
No hay comentarios:
Publicar un comentario