Introducción a la analítica de factores

Factor Analytics es una técnica especial que reduce la gran cantidad de variables en unas pocas cantidades de factores que se conoce como factorización de los datos, y administrar qué datos estarán presentes en la hoja se incluye en el análisis factorial. Es completamente un enfoque estadístico que también se utiliza para describir las fluctuaciones entre las variables observadas y correlacionadas en términos de un número potencialmente menor de variables no observadas llamadas factores .

La técnica de análisis factorial extrae la varianza común máxima de todas las variables y las coloca en una puntuación común. Es una teoría que se utiliza para entrenar el modelo de aprendizaje automático y, por lo tanto, está bastante relacionada con la minería de datos. La creencia detrás de las técnicas de análisis factorial es que la información obtenida sobre las interdependencias entre las variables observadas se puede usar más tarde para reducir el conjunto de variables en un conjunto de datos.

El análisis factorial es una herramienta muy eficaz para inspeccionar las relaciones cambiantes de conceptos complejos como el estatus social, el estatus económico, los patrones dietéticos, las escalas psicológicas, la biología, la psicometría, las teorías de la personalidad, el marketing, la gestión de productos, la investigación de operaciones, las finanzas, etc. Puede ayudar un investigador para investigar los conceptos que no se miden fácilmente de una manera mucho más fácil y rápida directamente por la cueva en un gran número de variables en unos pocos factores fundamentales fácilmente interpretables.

Tipos de análisis factorial:

  1. Análisis factorial exploratorio (AFE):
    se utiliza para identificar interrelaciones compuestas entre elementos y agrupar elementos que forman parte de los conceptos de unión. El analista no puede hacer suposiciones previas sobre las relaciones entre los factores. También se utiliza para encontrar la estructura fundamental de un gran conjunto de variables. Reduce los datos grandes a un conjunto mucho más pequeño de variables de resumen. Es casi similar al Análisis Factorial Confirmatorio (CFA).

    Las similitudes son:

    • Evaluar la confiabilidad interna de una cantidad.
    • Examinar los factores representados por conjuntos de elementos. Suponen que los factores no están correlacionados.
    • Investigue el grado/clase de cada elemento.

     
    Sin embargo, algunas diferencias comunes, la mayoría de ellas se refieren a cómo se utilizan los factores. Básicamente, EFA es un enfoque basado en datos, que permite que todos los elementos se carguen en todos los factores, mientras que en CFA debe especificar qué factores se requieren para cargar. EFA es realmente una buena opción si no tiene idea de qué factores comunes pueden existir. EFA es capaz de generar una gran cantidad de modelos posibles para sus datos, algo que no es posible si un investigador tiene que especificar factores. Si tiene una pequeña idea de cómo se ven realmente los modelos, y luego quiere probar sus hipótesis sobre la estructura de datos, en ese caso, el CFA es un mejor enfoque.

  2. Análisis factorial confirmatorio (CFA):
    es un enfoque más complejo (compuesto) que prueba la teoría de que los elementos están asociados con factores específicos. El análisis factorial confirmatorio utiliza un modelo de ecuación debidamente estructurado para probar un modelo de medición mediante el cual la carga en los factores permite la evaluación de las relaciones entre las variables observadas y las variables no observadas.
    Como sabemos, los enfoques de modelado de ecuaciones estructurales pueden abordar el error de medición fácilmente, y son mucho menos restrictivos que la estimación de mínimos cuadrados, por lo que brindan más exposición para acomodar los errores. Los modelos hipotéticos se contrastan con los datos reales y el análisis demostraría las cargas de las variables observadas sobre las variables latentes (factores), así como la correlación entre las variables latentes.
    El análisis factorial confirmatorio permite a un analista e investigador determinar si existe una relación entre un conjunto de variables observadas (también conocidas como variables manifiestas) y sus construcciones subyacentes. Es similar al Análisis Factorial Exploratorio.

    La principal diferencia entre los dos es:

    • Simplemente use el análisis factorial exploratorio para explorar el patrón.
    • Utilice el análisis factorial confirmatorio para realizar pruebas de hipótesis.

     
    El análisis factorial confirmatorio proporciona información sobre la calidad estándar del número de factores que se requieren para representar el conjunto de datos. Mediante el análisis factorial confirmatorio, puede definir el número total de factores necesarios. Por ejemplo, el análisis factorial confirmatorio puede responder preguntas como ¿Mi encuesta de mil preguntas puede medir con precisión el factor específico ? Si bien es técnicamente aplicable a cualquier tipo de disciplina, se suele utilizar en las ciencias sociales.

  3. Análisis factorial múltiple:
    este tipo de análisis factorial se utiliza cuando sus variables están estructuradas en grupos cambiables. Por ejemplo, puede tener un cuestionario de salud de un adolescente con varios puntos como patrones de sueño, adicciones incorrectas, salud psicológica, adicción al teléfono móvil o problemas de aprendizaje.

    El análisis de factores múltiples se realiza en dos pasos que son: –

    • En primer lugar, el Análisis de componentes principales se realizará en todas y cada una de las secciones de los datos. Además, esto puede dar un valor propio útil, que en realidad se usa para normalizar los conjuntos de datos para su uso posterior.
    • Los conjuntos de datos recién formados se fusionarán en una array distintiva y luego se realizará un PCA global.

     

  4. Análisis de Procrustes generalizado (GPA):
    el análisis de Procrustes es en realidad una forma sugerida de comparar los dos conjuntos aproximados de configuraciones y formas, que se desarrollaron originalmente para ser equivalentes a las dos soluciones del análisis factorial. Esta técnica se usó para extender el GP. Análisis para que más de dos formas puedan compararse de muchas maneras. Las formas están correctamente alineadas para lograr la forma deseada. Principalmente GPA (Análisis Generalizado de Procrustes) utiliza transformaciones geométricas.

    Las progresiones geométricas son:

    • reescalado isotrópico,
    • Reflexión,
    • Rotación,
    • Traducción de arrays para comparar los conjuntos de datos.
  5.  

    Valores propios
    Cuando el análisis factorial va a generar los factores, todos y cada uno de los factores tienen un valor propio asociado que dará la varianza total explicada por cada factor.
    Por lo general, los factores que tienen valores propios mayores que 1 son útiles:

    Percentage of variation explained by F1   =   Eigenvalue of Factor 1/No. of Variables
     
    Percentage of variation explained by F2   =   Eigenvalue of Factor 2/No. of Variables
    

    # ¿X? vector = ? ? el vector
    X es una array general como antes, que se multiplica por algún vector, y ? es un valor característico. Mire la ecuación y observe que cuando multiplica la array por el vector, el efecto es reproducir el mismo vector simplemente multiplicado por el valor ?. Este es un comportamiento inusual y gana el vector y la cantidad? nombres especiales: el vector propio y el valor propio.
     

    Cargas factoriales
    Además, los factores se crean con igualdad; algunos factores tienen más peso, algunos tienen bajo. En un ejemplo simple, imagine que su compañía de automóviles dice que Maruti Suzuki está realizando una encuesta que incluye: encuesta telefónica, encuesta física, formularios de Google, etc. para la satisfacción del cliente y los resultados muestran las siguientes cargas de factores:

    VARIABLE         |      F1         |      F2         |     F3
                     |                 |                 |
    Problem 1        |    0.985        |    0.111        |    -0.032
    Problem 2        |    0.724        |    0.008        |    0.167
    Problem 3        |    0.798        |    0.180        |    0.345
    
    

    Aquí –
    F1 – Factor 1
    F2 – Factor 2
    F3 – Factor 3
    Los factores que más afectan la pregunta (y por lo tanto tienen las cargas factoriales más altas) están en negrita. Las cargas factoriales son similares a los coeficientes de correlación en que pueden variar de -1 a 1. Cuanto más cerca estén los factores de -1 o 1, más afectan a la variable.
    Nota: Una carga factorial de 0 indica que no hay efecto.

Publicación traducida automáticamente

Artículo escrito por DivyankSinghSikarwar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *