Principal Otro Análisis factorial exploratorio

Análisis factorial exploratorio

Descripción general

Software

Descripción

Sitios web

Lecturas

Cursos

Descripción general

Esta página describe brevemente los métodos de Análisis de factores exploratorios (EFA) y proporciona una lista de recursos anotada.

[La narrativa a continuación se basa en gran medida en James Neill (2013) y Tucker y MacCallum (1997) , pero fue destilado para estudiantes de doctorado e investigadores junior de Epi.]

Descripción

El análisis factorial es una familia de técnicas de 100 años que se utiliza para identificar la estructura / dimensionalidad de los datos observados y revelar los constructos subyacentes que dan lugar a los fenómenos observados. Las técnicas identifican y examinan grupos de variables interrelacionadas; estos conglomerados se denominan factores o variables latentes (ver Figura 1). En términos estadísticos, el análisis factorial es un método para modelar la matriz de covarianza poblacional de un conjunto de variables utilizando datos de muestra. El análisis factorial se utiliza para el desarrollo de teorías, el desarrollo de instrumentos psicométricos y la reducción de datos.


Figura 1. Ejemplo de estructura factorial de trastornos psiquiátricos comunes. Los trastornos comunes parecen representar dos dimensiones latentes, trastornos internalizantes y externalizantes. De Krueger, R. F., 1999, La estructura de los trastornos mentales comunes. Archivos de Psiquiatría General. 56: 921-926.

que puedo hacer con una mph

El análisis factorial fue iniciado por el psicólogo y estadístico Charles Spearman (famoso por el coeficiente de correlación de Spearman) en 1904 en su trabajo sobre las dimensiones subyacentes de la inteligencia. Su uso se vio obstaculizado por onerosos cálculos manuales hasta la introducción de la computación estadística; desde entonces la técnica ha florecido.

Hay dos tipos principales de análisis factorial: exploratorio y confirmatorio. En el análisis factorial exploratorio (EFA, el enfoque de esta página de recursos), cada variable observada es potencialmente una medida de cada factor, y el objetivo es determinar que las relaciones (entre las variables y los factores observados) son más fuertes. En el análisis factorial confirmatorio (AFC), se postula una estructura factorial simple, cada variable puede ser una medida de un solo factor, y la estructura de correlación de los datos se prueba con la estructura hipotética mediante pruebas de bondad de ajuste. La Figura 2 es una representación gráfica de EFA y CFA.


Figura 2. EFA (izquierda) y CFA (derecha). Adaptado de Wall, M., 20 de septiembre de 2012, conferencia invitada de la sesión 3 sobre Epidemiología de los problemas de drogas y alcohol, Hassin, D., Escuela de Salud Pública Mailman de la Universidad de Columbia

Existen diferentes técnicas de análisis de factores para diferentes escenarios de medición y datos:

  1. Las variables observadas son continuas, las variables latentes se hipotetizan como continuas

  2. Observados son continuos, latentes son categóricos

  3. Los observados son categóricos, los latentes son continuos

  4. Los observados son categóricos, los latentes son categóricos

Esta página de recursos se centrará en los escenarios 1 y 3.

Las figuras 3 y 4 a continuación ilustran algunas premisas básicas de la teoría de la medición en relación con el análisis factorial:

  1. Los factores, o variables latentes, influyen sistemáticamente en las variables observadas (es decir, cuando medimos las variables observadas, esas mediciones / observaciones son causadas, al menos en parte, por variables latentes)

  2. Las diferencias interindividuales (es decir, la varianza) en las variables observadas se deben a variables latentes y errores de medición

  3. Cada tipo de factor (común, específico, ver más abajo) además del error de medición contribuye a una parte de la varianza.


Figura 3. Elementos que influyen en las variables observadas. Figura adaptada de Tucker, LR y MacCallum, RC. 1997, Análisis de factores exploratorios: http://www.unc.edu/~rcm/book/factornew.htm

La Figura 3 muestra que tres cosas influyen en las variables observadas. Dos son tipos de variables o factores latentes. Los primeros son factores comunes, que dan lugar a más de una de las variables observadas (p. Ej., La habilidad matemática puede dar lugar a la puntuación de la prueba de suma, la puntuación de la prueba de multiplicación y la puntuación de la prueba de división). Los segundos son factores específicos, que dan lugar a solo una de las variables observadas (un factor común puede convertirse en un factor específico si se eliminan todas menos una de las variables observadas a las que dan lugar). La tercera cosa que influye en las variables observadas es el error de medición, que no está latente, pero que a menudo se debe a eventos no sistemáticos que influyen en la medición. El error de medición está estrechamente relacionado con la confiabilidad.

Cada uno de los elementos que influyen en las variables observadas también contribuye a la varianza de esas variables. La Figura 4 muestra que la varianza de una variable observada dada se debe en parte a factores que influyen en otras variables observadas, factores que influyen solo en la variable observada dada y error de medición. La varianza común a veces se denomina comunalidad, y la varianza específica y la varianza del error a menudo se combinan y se denominan unicidad.


Figura 4. Estructura de varianza de las variables observadas. Figura de James Neill, 2013, Análisis factorial exploratorio, Conferencia 5, Investigación y diseño de encuestas en psicología. http://www.slideshare.net/jtneill/exploratory-factor-analysis

La figura también muestra una diferencia clave entre el análisis factorial yanálisis de componentes principales. En el análisis de componentes principales, el objetivo es dar cuenta de la mayor parte posible de la varianza total en las variables observadas; Se utilizan combinaciones lineales de variables observadas para crear componentes. En el análisis factorial, el objetivo es explicar la covarianza entre variables; las variables observadas se definen como combinaciones lineales de los factores.

El punto principal es que la teoría analítica factorial trata de explicar la covariación entre las variables observadas. Cuando las variables observadas se correlacionan entre sí, la teoría analítica factorial dice que la correlación se debe, al menos en parte, a la influencia de variables latentes comunes.

Supuestos

El análisis factorial tiene los siguientes supuestos, que se pueden explorar con más detalle en los recursos vinculados a continuación:

  1. Tamaño de la muestra (por ejemplo, 20 observaciones por variable)

  2. Nivel de medición (por ejemplo, los escenarios de medición / datos anteriores)

  3. Normalidad

  4. Linealidad

  5. Valores atípicos (el análisis factorial es sensible a los valores atípicos)

  6. Factorabilidad

    new york times co. v. estados unidos

Autovalores y cargas factoriales

[Nota: esta revisión de álgebra matricial puede ayudarlo a comprender lo que está sucediendo bajo el capó con valores propios y cargas factoriales, pero no es completamente necesario para interpretar los resultados del análisis factorial.]

Los factores se extraen de las matrices de correlación transformando dichas matrices por autovectores. Un vector propio de una matriz cuadrada es un vector que, cuando se premultiplica por la matriz cuadrada, produce un vector que es un múltiplo entero del vector original. Ese múltiplo entero es un valor propio.

El valor propio representa la cantidad de varianza que representa cada factor. Cada factor extraído tendrá un valor propio (el múltiplo entero del vector original). El primer factor extraído intentará absorber la mayor cantidad de varianza posible, por lo que los valores propios sucesivos serán más bajos que el primero. Los valores propios superiores a 1 son estables. El total de todos los valores propios es el número de variables observadas en el modelo.


Figura 5. Diagrama de pantalla, de James Neill, 2013, Análisis factorial exploratorio, Clase 5, Investigación y diseño de encuestas en psicología. http://www.slideshare.net/jtneill/exploratory-factor-analysis

programa de doctorado en salud pública

Cada variable contribuye con una varianza de 1. Luego, los valores propios se asignan a factores de acuerdo con la cantidad de varianza explicada. Los gráficos de pantalla (Figura 5 a continuación) son resultados comunes en el software de análisis de factores y son gráficos de líneas de valores propios. Representan la cantidad de varianza explicada por cada factor, y el corte es el número de factores justo antes de la curva en el diagrama de pedregal, por ejemplo, alrededor de 2 o 3 factores en la Figura 5. Los valores propios y los diagramas de pedregal pueden guiarlo para determinar cómo muchos factores son los que mejor se adaptan a sus datos.

Las cargas factoriales son una matriz de cómo las variables observadas se relacionan con los factores que ha especificado. En términos geométricos, las cargas son los coeficientes numéricos correspondientes a las trayectorias direccionales que conectan los factores comunes con las variables observadas. Proporcionan la base para interpretar las variables latentes. Cargas más altas significan que la variable observada está más fuertemente relacionada con el factor. Una regla general es considerar cargas superiores a 0,3.

Rotaciones

Los factores se rotan (literalmente, en el espacio geométrico) para ayudar en la interpretación. Hay dos tipos de rotación: ortogonal (perpendicular), en la que los factores no pueden correlacionarse entre sí, y oblicua, en la que los factores son libres de tomar cualquier posición en el espacio de factores y pueden correlacionarse entre sí. Los ejemplos de rotación ortogonal incluyen varimax, quartimax y equamax. Los ejemplos de rotación oblicua incluyen oblimin, promax y geomin. Consulte los recursos a continuación para saber cómo elegir un método de rotación.

Después de la rotación, los factores se reorganizan para pasar de manera óptima a través de grupos de varianza compartida, de modo que los factores se puedan interpretar más fácilmente. Esto es similar a elegir un grupo de referencia en regresión. La Figura 6 ilustra una rotación de factores utilizando varimax, pero solo tiene fines conceptuales. Las rotaciones ocurren bajo el capó de su software.


Figura 6. Ejemplo de una rotación varimax ortogonal. Las variables observadas fueron para las características del vino. De Abdi, Hervé. http://www.utdallas.edu/~herve/Abdi-rotations-pretty.pdf

EFA con ítems dicotómicos

Una matriz de correlación de Pearson no es apropiada para ítems categóricos o dicotómicos, por lo que para realizar EFA en dichos datos, necesita crear una matriz de correlación apropiada, llamada tetrachórica (para ítems dicotómicos) o policórica (para otros ítems categóricos). Una matriz de correlación tetracorica es la correlación de Pearson inferida de una tabla de 2 × 2 con el supuesto de normalidad bivariada. Polychoric generaliza esto a una tabla n x m.

La idea, ilustrada en la Figura 7, es que los elementos dicotómicos representan
constructos continuos subyacentes. Al crear una matriz de correlación tetracorica, básicamente está estimando un modelo basado en proporciones que caen en cada área de la esquina inferior derecha de la Figura 7. La computadora prueba numerosos umbrales y combinaciones.


Figura 7. Representación de la variable dicotómica observada (deprimida sí / no) y un constructo latente continuo. La esquina inferior muestra cómo este último es modelado por el primero.

A partir de la primavera de 2013, MPlus es el estándar de oro para realizar EFA en elementos dicotómicos, pero también es posible implementarlo en R. Consulte los recursos a continuación, en particular, la documentación del paquete Psych.

Lecturas

Libros de texto y capítulos

Artículos metodológicos

Metodológico (teoría y antecedentes)

Metodológico (aplicado)

descargas de microsoft office suite

Artículos de aplicación

Software

install.packages (psicológico)
biblioteca (psiquiatra)

?fa

# demostración rápida del análisis factorial exploratorio

datos (Harman)

cuando se descubrió la penicilina

head (Harman.Holzinger) # 9 × 9 matriz de correlación de pruebas de capacidad cognitiva, N = 696

cor.plot (Harman.Holzinger)

Pensilvania<- fa(Harman.Holzinger, 4, fm=pa, rotate=varimax, SMC=FALSE)
# Existen otros métodos de factorización para diferentes escenarios: residuo mínimo (minres), # ejes principales (como arriba), mínimos cuadrados ponderados o máxima verosimilitud. Ver argumentos #sección de? Fa y detalles.
print (pa, sort = TRUE)

# imprime los resultados, sort = TRUE muestra las cargas por valor absoluto. u ^ 2 es unicidad y h ^ 2 es # confiabilidad. Consulte los valores en? Fa para saber cómo llamar a resultados específicos

scree (Harman.Holzinger, factores = VERDADERO, pc = VERDADERO, principal = gráfico de Scree, hline = NULL, agregar = FALSO)

# crea una gráfica de pantalla: una gráfica lineal de valores propios. Representan la cantidad de varianza # explicada por cada factor, y el corte es el número de factores justo antes de la curva # en el gráfico de pedregal, p. Ej., Alrededor de 2 o 3 factores en la Figura 5. Los valores propios y los gráficos de arrastre pueden # guiarlo para determinar cuántos factores se ajustan mejor a sus datos.
fa.plot (pa, labels = TRUE) #una gráfica de cargas factoriales
fa.diagram (pa, sort = TRUE, cut = .3, simple = TRUE, errors = FALSE, digits = 1, e.size = .05, rsize = 0.15)

# un diagrama de apariencia familiar de la relación entre factores y variables observadas
#code para elementos dicotómicos

your.data<-read.csv(, header=TRUE, stringsAsFactors=FALSE)
your.fa<-fa.poly(your.data, nfactors=3, n.obs = 184, n.iter=1, rotate=geominQ, scores=tenBerge, SMC=TRUE, symmetric=TRUE, warnings=TRUE, fm=wls,
alpha = .1, p = .05, oblique.scores = TRUE)

#la principal diferencia aquí es la rotación (debe elegir un método oblicuo: geominQ es # más cercano a lo que hace MPlus), el método de factorización (mínimos cuadrados ponderados, o wls, es más cercano a #MPlus pero no exacto) y puntajes = tenBerge.

# si desea hacer usted mismo la matriz de correlación tetracorica, use el paquete policor

install.packages (polycor)
biblioteca (polycor)

? hetcor

Cursos

Artículos De Interés

La Elección Del Editor

Blog de la biblioteca de periodismo
Blog de la biblioteca de periodismo
Facultad de la Universidad de Columbia - Galardonados con el Premio Nobel de Ciencias Económicas
Facultad de la Universidad de Columbia - Galardonados con el Premio Nobel de Ciencias Económicas
Demandante X v. PrimaDaNoi
Demandante X v. PrimaDaNoi
Columbia Global Freedom of Expression busca promover la comprensión de las normas e instituciones nacionales e internacionales que mejor protegen el libre flujo de información y expresión en una comunidad global interconectada con importantes desafíos comunes que abordar. Para lograr su misión, Global Freedom of Expression emprende y encarga proyectos de investigación y políticas, organiza eventos y conferencias, y participa y contribuye a los debates globales sobre la protección de la libertad de expresión e información en el siglo XXI.
El IRS advierte a los estudiantes universitarios y al personal sobre una estafa por correo electrónico de suplantación de identidad
El IRS advierte a los estudiantes universitarios y al personal sobre una estafa por correo electrónico de suplantación de identidad
Teachers College, de la Universidad de Columbia, es la primera y más grande escuela de posgrado de educación en los Estados Unidos, y también está constantemente clasificada entre las mejores del país.
E. Jean Carroll contra Donald J. Trump
E. Jean Carroll contra Donald J. Trump
Columbia Global Freedom of Expression busca promover la comprensión de las normas e instituciones nacionales e internacionales que mejor protegen el libre flujo de información y expresión en una comunidad global interconectada con importantes desafíos comunes que abordar. Para lograr su misión, Global Freedom of Expression emprende y encarga proyectos de investigación y políticas, organiza eventos y conferencias, y participa y contribuye a los debates globales sobre la protección de la libertad de expresión e información en el siglo XXI.
George P. Fletcher
George P. Fletcher
George P. Fletcher, reconocido como uno de los más destacados académicos de los Estados Unidos en los campos del derecho penal comparado e internacional, se unió a la facultad en 1983. Imparte cursos que exploran la jurisprudencia de la guerra, la Biblia, el crimen y los derechos de las víctimas. . Fletcher ha escrito más de 150 artículos de revisión de leyes, incluido el citado a menudo Equidad y utilidad en la teoría del agravio. También ha escrito un escrito amicus de la Corte Suprema, para Hamdan v. Rumsfield en el que argumentó que un prisionero posterior al 11 de septiembre en Guantánamo que fue acusado de conspiración debe ser juzgado en un tribunal penal federal y no por una comisión militar. Al argumento de Fletcher se le atribuyó el mérito de dar forma a la opinión mayoritaria del juez John Paul Stevens, que derribó los tribunales militares utilizados durante la llamada Guerra contra el Terrorismo. Los 20 libros de Fletcher incluyen una memoria, una novela y tomos académicos. Incluyen responsabilidad extracontractual por abusos a los derechos humanos, que analiza la responsabilidad extracontractual en casos internacionales; Defender a la humanidad: cuándo se justifica la fuerza y ​​por qué, que explora las analogías entre la autodefensa en el derecho nacional e internacional; y La gramática del derecho penal: estadounidense, comparado e internacional, que investiga la estructura básica y el lenguaje de diversos sistemas de castigo penal. También ha escrito decenas de artículos de opinión y artículos más extensos para The New York Times, The New Republic, The New York Review of Books y The Washington Post. Fletcher, que habla siete idiomas extranjeros, ha impartido conferencias y ha realizado entrevistas con los medios de comunicación en ruso, francés, alemán, hebreo, español, húngaro e italiano. Es el único académico que escribe en inglés que ha sido citado por la Corte Penal Internacional. Recibió el Premio Internacional Silvio Sandano de derechos humanos en una ceremonia en el Senado de la República Italiana en 2015. Es miembro de la Academia Estadounidense de Artes y Ciencias.
La investigación apoya la prohibición de los cigarrillos mentolados
La investigación apoya la prohibición de los cigarrillos mentolados
Los cigarrillos aromatizados han estado prohibidos en los Estados Unidos durante más de una década, con una flagrante excepción: los cigarrillos mentolados, que se consumen en tasas sustancialmente más altas entre los afroamericanos. A pesar de la abrumadora investigación sobre los riesgos para la salud del mentol, la Administración de Drogas y Alimentos de los EE. UU. (FDA) y muchos gobiernos estatales y locales no han logrado eliminar este sabor de