sábado, 10 de febrero de 2024

Mplus | Primer análisis de regresión múltiple

¿Qué sentido tiene hacer un análisis de regresión en un programa como Mplus cuando, precisamente, hay otros programas estadísticos que hacen este proceso de una manera más intuitiva para el usuario? Debemos pensar que un análisis de regresión múltiple estándar (standard multiple regression analysis en inglés) no es ni más ni mino que un tipo de modelo de ecuación estructural (structural equation model en inglés). De hecho, los modelos de regresión son, como su propio nombre indica, modelos saturados que no tienen grados de libertad porque ofrecen un ajuste perfecto de los datos

El motivo de por qué vamos a realizar un análisis de regresión con Mplus es más bien para ir cogiendo soltura con la interfaz del programa y así, interiorizar pasos que serán muy importantes para otros análisis más complejos. Y para ello, la mejor forma de hacerlo es a través de un ejemplo.


Caso práctico

El objetivo principal de una investigación es analizar las relaciones existentes que hay en las calificaciones de algunas asignaturas de alumnos de 2º de Bachillerato [17-18 años]. En concreto, queremos analizar la relación que hay entre la calificación de Matemáticas con el resto de asignaturas científicas (Física, Biología y Química). Para ello, tenemos una base de 21 alumnos que contiene las calificaciones de Matemáticas, Física, Biología, Química, Lengua Castellana y Literatura e Historia del Arte. El equipo directivo quiere saber el porcentaje de la variación de la nota de Matemáticas que puede explicarse por su relación lineal con el resto de asignaturas científicas (Física, Biología y Química).

Para este ejemplo, se usará el programa Mplus7 empleando la base de datos que se puede descargar pulsando el siguiente botón y que tiene como título asignatura.dat



En efecto, date cuenta que vamos a tener que hacer análisis únicamente con algunas variables; en concreto con Matemáticas, Física, Biología y Química. Por tanto, deberemos usar el comando usevariable para que el programa ignore el resto de variables (Lengua e Historia del Arte). Para más información sobre este comando, haz clic en el siguiente botón.




Procedimiento

En primer lugar, debemos elaborar el input file (fichero de entrada) con toda la información necesaria para abrir la base de datos, numerar las variables y realizar los análisis pertinentes. Para ello, podemos escribir en Mplus la siguiente sintaxis [en rojo se marca lo que seguramente sea distinto en otros ordenadores]:

Title:
    Modelo de regresión de asignaturas

Data:
    File is "C:/Users/JSD/Mplus/Asignatura.dat";

Variable:
    Names are Mat Fis Bio Quim  LCL HisA;
    Usevariable are Mat Fis Bio Quim;

Model:
    Mat ON Fis Bio Quim;

Output:
    sampstat standardized modindices (all);


En primer lugar, en Title:, pondremos un título a nuestro análisis. A continuación, en Data:, especificaremos el lugar en el que se encuentra la base de datos en formato .dat. Para ello, tendremos que usar el directorio de Windows (cambiando las barras de "\" a "/"). La dirección que ves arriba será distinta en tu caso. Después, en Variable:, nombraremos todas las variables (names are) y con el comando usevariable citaremos solamente aquellas objeto de estudio. A continuación, en Model:, especificaremos el modelo de regresión, que consiste en usar la palabra clave ON entre medias de las variables predictoras (Física, Biología y Química) y la variable predicha o dependiente (Matemáticas). Por último, en Output:, especificaremos la forma en la que se obtendrán los resultados. En este caso pediremos estadística muestral (sampstat), soluciones estandarizadas (standardized) y modificaciones de índices (modindices) en todas las variables objeto de estudio (all).

Finalmente, tal y como se muestra en la siguiente ilustración, haremos clic en la tecla RUN para que se realice el análisis que hemos indicado en la sintaxis.



Resultados e interpretación

Como será poco habitual realizar un modelo de regresión con Mplus (recordemos que esto se puede realizar de manera más intuitiva en otros programas estadísticos como SPSS), hemos aglutinado los resultados y su interpretación en una misma sección.

En primer lugar, en la ventana de resultados encontraremos un resumen global del modelo (no tiene mucha relevancia en la interpretación de los resultados). Simplemente cabe destacar que el estadístico que se emplea en este modelo es el de máxima verosimilitud



Bajando por la hoja de resultados, tras el resumen del procedimiento, nos encontraremos con las medias, la tabla de covarianzas y la matriz de correlaciones. Esta última, es la que programas como SPSS también puede generar. Es aquí donde habrá que mirar el valor del coeficiente de correlación (r) y su interpretación. En concreto, la matriz de correlaciones ofrece el conocido como coeficiente de correlación de Pearson (r) [nótese en la siguiente imagen que los resultados de las tablas de correlación en Mplus y en SPSS coinciden]. 
  • Recordemos que r puede tomar valores entre -1 a 1 y que el 0 indica la ausencia de relación entre las dos variables objeto de estudio.


A continuación, tenemos la información de los estadísticos de ajuste del modelo. Con este modelo no tiene mucho sentido analizarlo puesto que, sin ánimos de entrar en detalles matemáticos, los modelos de regresiones siempre se ajustan a la perfección.


Tras la información de los ajuste de modelos, nos encontraremos las tablas de los pesos de las regresiones. En esta parte encontraremos cuatro tablas similares. Comenzamos viendo la tabla de la regresión no estandarizada. Por otro lado, veremos tres tablas estandarizadas: STDYX, STDY y STD. Si observamos rápidamente las cuatro tablas (en la siguiente ilustración solo se muestran las dos primeras), veremos que a penas hay diferencias en los resultados. Cuando trabajamos con modelos de regresión múltiple en Mplus, es indiferente la tabla que se elija en este apartado (puesto que las conclusiones son similares). Esto no pasa así cuando estamos realizando otro tipo de análisis más complejo. 
  • Independientemente de la tabla elegida, la primera columna contiene el nombre de nuestras variables predictoras (Física, Biología y Química). Nótese que en la parte de arriba tenemos el nombre de la variable predicha seguido de un ON (regresión según Mplus; Matemáticas ON).
  • El la siguiente ilustración se explica lo que significa cada columna. Las columnas más importantes para este análisis (independientemente de si se elije la tabla no estandarizada, la STDYX, la STDY o la STD) es el valor beta (Estimate) y su correspondiente signficatividad (Two-Tailed p-Value).
    • Deberemos ver qué variable predictora es significativa (p < 0.050). En nuestro ejemplo, solamente la calificación de Física es una predictor significativo de la calificación de matemáticas (B = 0,879; p < 0,001).



En la siguiente imagen, observamos las dos tablas restantes estandarizadas (STDY y STD), así como la información sobre la R al cuadrado. Esta información es una de las más importantes del análisis. El coeficiente de determinación (R al cuadrado) representa el porcentaje de variabilidad de la variable dependiente (Matemáticas en este caso) explicada por el modelo de regresión. A diferencia del coeficiente de correlación visto más arriba, esta toma valores entre 0 y 1. Simplemente deberemos multiplicar el valor de esta tabla por 100 para obtener el porcentaje de variación de los resultados. En este caso, el 85% de la variación de la calificación en Matemáticas se puede explicar por su relación lineal con la calificación en el resto de asignaturas científicas. Con esta interpretación, hemos dado respuesta a la pregunta que se planteaba el equipo directivo del centro.



En definitiva, toda esta información es la que si reiteramos el análisis en otro programa estadístico (pongamos SPSS) será similar a los resultados e interpretación que acabamos de hacer en Mplus. Como ya hemos dicho en la introducción, este análisis tan sencillo puede ser útil para comenzar a familiarizarse con las posibilidades de Mplus para cuando realicemos análisis mucho más complejo y más común para este tipo de software.


Seguir aprendiendo

Haz clic en el siguiente botón para seguir aprendiendo sobre otros análisis en Mplus:



Jacob Sierra Díaz y Alti

No hay comentarios:

Publicar un comentario