miércoles, 14 de febrero de 2024

Mplus | Análisis Factorial Exploratorio Básico

El Análisis Factorial Exploratorio (AFE; Exploratory Factor Analysis en inglés) es uno de los motivos principales por el que muchos investigadores emplean el software Mplus. De hecho, con este programa podemos efectuar ciertos análisis que con otros sería imposible realizarlos (por lo menos hasta el momento de la creación de esta entrada) tales como incluir valores perdidos en el análisis o incluso hacer un análisis con variables categóricas.

En esta entrada simplemente vamos a aprender los pasos esenciales para hacer este análisis, dejando para otro momento procedimientos o interpretaciones más complejas que pueden entorpecer a todos aquellos que estén empezando a familiarizarse con Mplus. Por supuesto, la mejor forma de aprenderlo de una manera rápida y precisa es a través de un ejemplo.


Caso práctico

Una investigación pretende elaborar un cuestionario que analice los motivos principales por los que los deportista jóvenes de entre 18 y 25 años dejan la práctica de actividad físico-deportiva. Para ello, se han redactado una serie de ítems que el encuestado debe marcar su grado de acuerdo o desacuerdo en una escala Likert de 4 puntos (donde el 1 expresa un desacuerdo total y el 4 expresa un acuerdo total). La elaboración de estos ítems han surgido de reuniones con paneles de expertos y revisión de la literatura e incluyen una gran cantidad de información incluyendo motivos familiares, personales y sociales.


Una vez redactado el cuestionario, se ha procedido a realizar un estudio piloto con 100 participantes de entre 18 y 25 años. Se pretende saber si los ítems que forman el cuestionario se pueden agrupar en algún factor relativo a los motivos de abandono deportivo.


Para este ejemplo, se usarán las siguiente base de datos con la respuesta ficticia de 100 jóvenes. El cuestionario piloto se compone originalmente de 10 ítems, que son cada una de las columnas que formarán parte de esta base de datos. Puedes descargar la base de datos haciendo clic en el próximo botón.

Para este ejemplo se usará la versión Mplus7 en un ordenador Windows 10 empleando la base de datos que se puede descargar pulsando el siguiente botón y que tiene como título Abandono.dat




Procedimiento

En primer lugar, y como ya es habitual en el procedimiento con Mplus, debemos elaborar el input file con aquella información relevante para nuestro análisis. Para ello, dividiremos este archivo en varias secciones: TitleDataVariable Analysis. En este caso en concreto solicitaremos un análisis factorial exploratorio que contemple de entre 1 a 4 factores. A continuación, completaremos toda la información pertinente en cada una de las secciones quedando un archivo similar al siguiente:

Title:
    Análisis Factorial Exploratorio - Abandono

Data:
    File is "C:/Mplus/Abandono.dat";

Variable:
    Names are Item1-Item10;

Analysis:
    Type is EFA 1 4;


  • En Title: pondremos un título a nuestro análisis (esto solo es para que el usuario sepa el nombre del análisis). 
  • A continuación, en Data: especificaremos el lugar en el que se encuentra la base de datos en formato .dat. Para ello, tendremos que usar el directorio de Windows (cambiando las barras de "\" a "/"). La dirección que ves arriba será distinta en tu caso. 
  • Después, en Variable: nombraremos todas las variables (names are). Puesto que en este caso las variables se llaman similar salvo el número del ítem podemos usar la función elemento inicial-elemento final (Item1-Item4) para indicarle cómo las debe nombrar automáticamente siguiendo el orden de aparición en la base de datos.
  • Para un análisis básico simplemente en Analysis: especificaremos el tipo de análisis. En este momento debemos indicar cuántos factores queremos tener en cuenta. En este ejemplo, estimamos la generación de cuatro factores puesto que los abandonos pueden deberse por causas sociales, lesiones, esfuerzo, problemas u otras actividades más llamativas; y los ítems van encaminados a abordar todos estos factores
Podríamos meter más información como por ejemplo la orden de rotación varimax (ortogonal) en el apartado de Analysis. Por defecto, si no indicamos nada, se realiza una rotación geomin. Sin embargo, al ser un análisis básico solo solicitaremos lo imprescindible. 

Una vez introducida la sintaxis podremos hacer clic sobre el botón RUN




Resultados

Vamos a dividir esta sección en varias tablas que aparecerán en una nueva ventana de Mplus. Aquí nos centraremos en un pequeño resumen de los resultados y simplemente se mencionará lo más básico.

- La primera tabla, después de repetir lo que se le ha introducido a Mplus (input), corresponde con un pequeño resumen de lo que se ha ejecutado. Aquí, lo interesante sería ver si el tamaño muestral (n) coincide con nuestra base de datos y si el nombre de las variables es el correcto. 



- La segunda tabla corresponde con los autovalores de las variables introducidas, esto nos indica la varianza de cada factor y no suele ser tan imprescindible para un análisis factorial básico.



A partir de esta parte comienza lo más importante que habrá que mirar. Démonos cuenta que lo que primero que saldrá será un modelo exploratorio teniendo en cuenta un solo factor. Estas tablas se irán reiterando dependiendo de los factores que hayamos sugerido al programa en el input: en este caso de 1 al 4 (EFA 1 4;), es decir, comenzará con el análisis de un solo factor y continuará, hasta que estime adecuado hasta el análisis con cuatro factores.

- Model Fit information. En la primera parte de estas tablas tenemos los índices del modelo de ajuste. Lo práctico y relevante es mirar los valores del Root Mean Square Error of Approximation (RMSEA; cuanto más pequeño mejor), el Comparative Fit Index / Tuckey Lewis Index (CFI / TLI; cuanto más cercano a uno mejor) y el Standardized Root Mean Residual (SRMR; cuanto más pequeño mejor).


En este caso los índices no son los mejores que nos podremos encontrar. Por tanto, lo recomendable es bajar a las parte en la que comienza el análisis con 2 factores (Exploratory Factor Analysis with 2 Factor(s)) y ver si mejoran mencionados índices. No obstante, para explicar todos los resultados que contiene Mplus, vamos a seguir con el de un factor. 


- Geomin Rotated Loadings. La siguiente parte de los resultados que nos encontraremos debajo de lo que acabamos de ver son las famosas cargas factoriales rotadas junto con sus correspondientes correlaciones factoriales. Esto es lo que se suele poner en los informes estadísticos o en las publicaciones. En este caso, como estamos en el análisis de un solo factor, solo tendremos una única columna con un único factor. Lo más rápido será ver dónde tiene cada ítem un peso mayor (acompañado de un asterisco), puesto que nos indicará que el ítem mide adecuadamente bien el determinado factor. A continuación, se muestran los errores estándar de las cargas factoriales. 



- La siguiente y última tabla de este apartado (análisis exploratorio de un solo factor) nos indica la carga factorial teniendo en cuenta la estandarización de las medidas. A veces, en los artículos se hace referencia a esta tabla en lugar de la anterior, pero su interpretación es la misma que antes salvo que aquí está todo estandarizado.



Tal y como ya hemos mencionado, si vamos bajando por los resultados, nos encontraremos una estructura muy similar a la que acabamos de ver, sin embargo, esta vez será teniendo en cuenta dos o más factores. Cuando tenemos dos o más factores, además, de las secciones anteriores aparecerá una tabla de la estructura factorial. La siguiente imagen, que procede de un análisis factorial exploratorio, contiene una explicación al respecto.  





SINTETIZANDO LO ESENCIAL:

Vamos a ver un resumen de lo que deberíamos ver en los resultados de Mplus para gente con prisas. Para ello, debemos ir a la sección que tenga por título EXPLORATORY FACTOR ANALYSIS WITH X FACTOR(S):
  • En primer lugar, miramos los valores de Model Fit Information. Si hay algún valor que no cumpla los siguientes supuestos, deberíamos ir a mirar otra estructura con más o menos factores.
      • RMSEA debe ser menor que 0,050
      • CFI/TLI debe ser mayor que 0,900
      • SRMR debe ser menor que 0,050
      • ¡Ojo! Hay otros índices (como el Chi-Square) que también merece la pena observar, aunque para un análisis básico son suficiente esos tres).

    • Observar los  la carga factorial de GEOMIN FACTOR LOADINGS y ver en qué factor tiene cada ítem una carga mayor (vendrá con un asterisco). Esto significará que el ítem mide lo que implique el factor en el que esté. 

    • Observar la correlación de factores en GEOMIN FACTOR CORRELATION y ver la correlación entre los factores del estudio.


    Interpretación

    Una vez analizado los modelos factoriales exploratorios, se puede llegar a la conclusión de que el cuestionario planteado no es adecuado para poder analizar los motivos de abandono de la práctica deportiva puesto que los índices de ajuste del modelo no son adecuados. No obstante, si observamos las cargas factoriales, el cuestionario se estructura mejor para dos factores que para uno solo. 


    En definitiva, o bien se recomienda incrementar el número de encuestados para ver si los datos mejoran o bien se debería volver a redactar de otra forma los ítems del cuestionario atendiendo a un panel de expertos. 



    Seguir aprendiendo

    Haz clic en el siguiente botón para seguir aprendiendo sobre la realización del Análisis Factorial Confirmatorio:




    Jacob Sierra Díaz y Alti

    No hay comentarios:

    Publicar un comentario