analisis factorial

34
Diseños Alternativos en el Análisis Factorial y Interpretación y aplicación de los resultados del análisis factorial Estadistica Avanzada Norlan Rodríguez Héctor Rodríguez

Upload: norlan9886

Post on 14-Jun-2015

504 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Analisis factorial

Diseños Alternativos en el Análisis Factorial y

Interpretación y aplicaciónde los resultados

del análisis factorial

Estadistica Avanzada

Norlan RodríguezHéctor Rodríguez

Page 2: Analisis factorial

Análisis Factorial • Definición es una técnica estadística de reducción de datos usada

para explicar la variabilidad entre las variables observadas en términos de un número menor de variables no observadas llamadas factores. Las variables observadas se modelan como combinaciones lineales de factores más expresiones de error. El análisis factorial se originó en psicometría, y se usa en las ciencias del comportamiento tales como ciencias sociales, mercadeo, gestión de productos, investigación de operaciones y otras ciencias aplicadas que tratan con grandes cantidades de datos.

Page 3: Analisis factorial

Diseño Tradicional de análisis factorial

• Técnica Q• Técnica P• Técnica O• Técnica S• Técnica T

Page 4: Analisis factorial

Técnica Q

• La alternativa al análisis factorial mediante la técnica R más frecuente cosiste es la técnica Q a la que se denomina a veces análisis factorial “inverso “. Una diferencia entre la técnica q y R queda, es en la fórmula de correlación de cada una, para una matriz típica. Hay N datos o sujetos, tanto como fila en la matriz de datos Z. Cada columna z consta de una puntuación típica para un dato o persona para cada una de las n variables.

Page 5: Analisis factorial
Page 6: Analisis factorial

• La diferencia estriba en que la técnica R toma la correlación con las filas y la técnica Q toma las columnas.

• Ambas formulas son promedios de productos cruzados de puntuaciones típicas. Si se correlacionan las puntuaciones originales en lugar de las puntuaciones típicas, la fórmula de correlación de puntuaciones originales tiene en si misma el efecto de reducir las puntuaciones a puntuaciones típicas antes del cálculo de la correlación. Por tanto el análisis por la técnica R las diferencias en medias de desviaciones típicas entre las dos variables correlacionadas no tiene ningún efecto en el coeficiente de correlación, ya que ambas variables se ajustan automáticamente a variables con media cero y varianza unidad. Cuando se correlacionan dos individuos a través de dos puntuaciones de las variables, en el análisis por la técnica Q, mostrado por dos columnas de la matriz de datos, se da una transformación de las medias y desviaciones típicas de los dos individuos a 0 y 1, respectivamente. Si las puntuaciones están en el mismo orden de rango, con aproximadamente igual espacio entre las puntuaciones para ambos individuos, la correlación entre ellos será muy alta, incluso si las puntuaciones de una persona son considerablemente más altas y más dispersas que las puntuaciones de la otra persona.

Page 7: Analisis factorial

• La técnica R se hace totalmente evidente en este punto de datos se obtiene todos en la misma escala de medida. Con la técnica Q sin embargo no ocurre así. Los elementos de una columna de la matriz de datos se obtienen generalmente a partir de diferentes escalas de medida, ya que cada fila de la matriz de datos se obtiene por un mecanismo de medición diferente.

Page 8: Analisis factorial
Page 9: Analisis factorial

• El uso de puntuaciones originales para correlacionar personas en el análisis factorial por la técnica Q aumenta de forma incorrecta las correlaciones, aprovechando el hecho de que las escalas de medida diferentes de fila a fila en la matriz de datos. Los datos pueden ser tipificados para una media y desviaciones típicas distintas de 0 y 1.

• Si las medias y la desviaciones típicas de las filas no influyen demasiado hay que ajustarlas las filas de la matriz de correlación para el análisis factorial con la técnica Q.

Page 10: Analisis factorial

• El hecho de calcula el coeficiente de correlación de dos individuos, con todas sus variables, automáticamente se ajusta los dos conjuntos de puntuaciones de los dos individuos a la misma media y desviación típica.

• Por tanto si los dos individuos tiene una alta correlación, tiene el mismo patrón de puntuaciones altas y bajas al margen del nivel absoluto de sus puntuaciones. Esto significa que los individuos tiene perfiles similares.

Page 11: Analisis factorial

• La estabilidad del coeficiente de correlación depende de que se tome una muestra grande y representada de casos de la población. En la técnica Q significa que ordinariamente tomar un gran número de observaciones para un número limitado de personas u objetos.

• En la técnica Q la correlación entre dos individuos está también sujeta a distorsión por una muestra de variables sesgada sobre la que se calcula la correlación.

Page 12: Analisis factorial

• Si deseamos conocer la correlación de dos individuos, la correlación debería calcularse sobre una muestra representativa de todas las variables posibles.

• Los análisis mediante la técnica Q deben basarse en un subconjunto limitado y usualmente no representativo del universo de todas las variables de la muestra.

Page 13: Analisis factorial

Problema de la rotación en el análisis mediante la técnica Q

• La tendencia de los criterios de rotación tradicional , son inapropiados.

• Si los sujetos y las variables se seleccionas para el análisis por técnica Q, sin plantearse los problemas de rotación de los resultados factoriales, es probable que los sujetos no formen grupos muy distintos.

• El análisis por la técnica Q no suele ser un vehículo de rescate muy fructífero para salvar del desastre de investigaciones no planificadas.

Page 14: Analisis factorial

Pasos que tiene que seguir el investigador para utilizar la

técnica Q: 1. Definir el dominio de las variables sobre las cuales se

van a correlacionar los individuos. 2. Seleccionar un conjunto de variables en el que los

individuos han de ser medios, de tal forma que le dominio definido en el punto 1 esté adecuadamente representado. El conjunto de variables debe contener suficiente elementos para proporcionar correlaciones estables entre los individuos. Sería deseable algunos cientos de elementos.

3. Seleccionar varios individuos para representar cada “tipo “puro que se supone hipotéticamente que existe. Al menos una media docena, más si fuera posible, debería incluirse para cada tipo.

Page 15: Analisis factorial

• Si la hipótesis de que un tipo determinado existe es correcta y si los individuos seleccionados para representarlo son ejemplos de ese tipo respecto al conjunto de variables sobre el que se calculan las correlaciones entre los individuos, debe aparecer un factor por la técnica Q en el que todos estos individuos tengan pesos sustanciales. Estos individuos seleccionaos para representar un tipo dado deben correlacionarse más entre ellos que con los individuos seleccionado para representar otros tipos.

Page 16: Analisis factorial

• Los individuos que no representan tipos puros tienen el mismo status en el análisis factorial por la técnica Q que las variables complejas tienen en el análisis factorial por la técnica R. Estos individuos no proporcionan mucha ayuda para ubicar los factores. Estos tiene un magnitud moderada en los factores de la técnica Q.

• El individuo tipo puro tiene en análisis factorial por la técnica Q el mismo carácter que la variable de factor puro que tiene en el análisis factorial por técnica R.

• Los tipos puros son la excepción más que la regla, una muestra al azar de individuos en más probable que contenga una fuerte preponderancia de individuos que no son tipos puros.

Page 17: Analisis factorial

• Esto hace que los sujetos deben ser cuidadosamente seleccionados para obtener resultados factoriales significativas por la técnica Q.

• Esta técnica en muy útil para la explicación científica en aquellas ares en las que se dispone de muchos datos para relativamente pocos sujetos.

Page 18: Analisis factorial

Técnica P • La técnica P se utiliza más para el estudio clínico del

caso individual. Los investigadores que más influyentes, Cattell, y Rhymer

• Para esta técnica la correlación se calcula entre los pares de variables sobre N ocasiones.

• En el análisis por la técnica P, por tanto, el tema de estudio es una única persona, u objeto de observaciones. Se obtiene una medición de cada variable en la primera ocasión.

• Las ocasiones podrían ser ensayos repetidos con intervalos de tiempo muy pequeños o grandes entre ellos.

• No es necesario de establecer la puntuación para calcular la matriz de correlación, ya que la correlación se calcula entre variables como la técnica R.

Page 19: Analisis factorial

• La fórmula de coeficiente de correlación ajusta automática mente las diferencias de medias y desviaciones típicas, entre variables.

• Los factores derivados por la técnica P, como en la técnica R, representan grupos de variables sustancialmente correlacionadas. Sin embargo, el significado de la correlación entre variable es diferente en las dos técnicas.

• En la técnica R, si están altamente correlacionado y aparecen en el mismo factor, significa que si el sujeto tiene una puntuación alta en uno de estos dos test, tenderá también a tener una puntuación alta en el otro y viceversa.

• En la técnica P, si está altamente correlacionada entre variables, significa que según unas variables suba o baje, la otra variable se mueve con ella a lo largo de la serie de acontecimientos.

Page 20: Analisis factorial

• El análisis por la técnica P, es apropiado solo para ciertas clases de variables. Debe haber variaciones medibles fiables en las puntuaciones de la variable a lo largo de la serie de ocasiones.

• El análisis por la técnica P porque puede ser medida con precisión y fluctúa entre los limites amplios en función de acontecimientos en el medio externo o interno del individuo, llegando periódicamente a un estado estable.

• El análisis por la técnica P tiene el mayor potencial en la investigación clínica que comprende variables que exhiben fluctuaciones reales sustanciales en el individuo a lo largo del tiempo.

Page 21: Analisis factorial

Diseño de tecnicas menos conocidos

Con sujeto, variable y ocasiones representando tres dimensiones es posible obtener tres matrices de datos bidimensionales, ofreciendo cada una de ellas dos formas de calcular las correlaciones.

Page 22: Analisis factorial

Técnica O• de datos de la que se obtienen los diseños de las

técnicas R y Q. La matriz de datos para técnica P da el diseño de la técnica P. Entonces sería posible calcular la correlación de la matriz de datos para técnica P tomando pares de columnas en lugar de pares de filas.

• Al correlacionar las columnas de la matriz de datos de la matriz de datos para la técnica P se obtiene una matriz de correlación que puede factorizarse.

• Los factores derivados de un análisis por la técnica O muestra que acontecimientos están agrupados. Tal análisis podría revelar la presencia, por ejemplo de uno o más estados periódicos en un individuo dado.

Page 23: Analisis factorial

Técnica T

• Cuando se calcula la correlaciones entre ocasiones sobre una muestra de individuos.

• Los factores derivados representan grupos de ocasiones en que los individuos se han comportado de una forma similar

Page 24: Analisis factorial

Técnica S

• En esta técnica se correlaciona dos individuos sobre la serie de acontecimientos en los que se toman medidas de variables que se investigan.

• Se utiliza para agrupar personas que responden de la misma forma en una serie de situaciones sociales cambiantes en las que todas las medias se toman sobre una única variable.

Page 25: Analisis factorial

Kaiser-Meyer-Olkin (KMO)

Es la medida de adecuacidad de muestreo. Este índice nos muestra cuán apropiado es nuestro análisis factorial. Valores altos (0.5 – 1.0) indican que el análisis es apropiado. Valores menores a 0.5 implican que el análisis no es apropiado y no debemos aceptarlo.

25

Page 26: Analisis factorial

Bartlett’s test of sphericity

Es un estadístico de prueba usado para examinar la hipótesis de que las variables no están correlacionadas en la población. En otras palabras, la matriz de correlaciones de la población es una matriz identidad; cada variable correlaciona perfectamente consigo misma (r=1) pero no tiene correlación con las otras variables (r=0). Su valor debe ser menor de 0.05

26

Page 27: Analisis factorial

The Correlation Matrix

La matriz de correlación muestra que hay dos grupos de alta correlación entre unas pruebas que se administraron a unos estudiantes. Un grupo lo forman: French, German and Latin.

El otro lo forman: Music, Maths and Mapwork. Estos grupos correlacionan entre si pero no el uno con el otro. Los estudiantes muestran dos dimensiones independientes de habilidades.

27

Page 28: Analisis factorial

Total Variance Explained

Esta tabla muestra información sobre los factores que han sido extraidos. En esta tabla los componentes escogidos son aquellos cuyo valor propio sea mayor de 1.0

28

Page 29: Analisis factorial

Scree Plot

Escogemos los puntos cuyo valor propio sea mayor de 1.0

29

Page 30: Analisis factorial

Component Matrix Esta tabla muestra la matriz de componentes (factores) con

los loadings (correlaciones parciales) de los seis examenes tomados, con dos factores extraidos. En otras palabras la tabla muestra como cada examen se correlaciona con cada componente.

30

Page 31: Analisis factorial

Rotated Component Matrix El propósito de la rotación es darle una nueva posición a los

ejes de tal forma que nos permita ver mejor las correlaciones y asignar la variable al componente con el cual se correlaciona más fuertemente.

31

Page 32: Analisis factorial

32

Aplicaciones del Análisis Factorial

Una representación más concisa de la situación y por ende una mejor comunicación.

Ayuda a tener una mejor comprensión del proceso y a determinar un menor número de preguntas para la próxima encuesta.

Ayuda a develar las variables escondidas cuyo efecto sobre el comportamiento de la data es muy importante.

Permite que los mapas perceptuales sean posibles.

Muestra el comportamiento de

las variables que estudiamos.

Page 33: Analisis factorial

33

Mapas perceptuales

Page 34: Analisis factorial

Bibliografía

• http://en.wikipedia.org/wiki/Q_methodology

• http://www.ansys.stuba.sk/html/guide_55/g-str/GSTR13.htm

• http://es.wikipedia.org/wiki/An%C3%A1lisis_factorial

• “Manual De Analisis Factorial”, A. L. Comrey, Editorial Catedra, 1985

34