1 semana analisis multivariante
TRANSCRIPT
![Page 1: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/1.jpg)
UNIVERSIDAD NACIONAL UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOSMAYOR DE SAN MARCOS
FACULTAD DE CIENCIAS MATEMÁTICASFACULTAD DE CIENCIAS MATEMÁTICAS
((Universidad del Perú, DECANA DE AMERICA)Universidad del Perú, DECANA DE AMERICA)
Mg. María Estela Ponce AruneriMg. María Estela Ponce Aruneri
ESCUELA ACADÉMICO PROFESIONAL DE ESTADÍSTICA ACADÉMICO PROFESIONAL DE ESTADÍSTICA
DEPARTAMENTO ACADÉMICO DE ESTADÍSTICADEPARTAMENTO ACADÉMICO DE ESTADÍSTICA
SEMESTRE 2009-II
![Page 2: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/2.jpg)
QUÉ ES EL ANÁLISIS MULTIVARIANTE?
Es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo ú objeto estudiado.Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo información que los métodos estadísticos univariantes y bivariantes no pueden proporcionar.
![Page 3: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/3.jpg)
Así, como Hair et al. (1999) dicen:“Las mujeres y hombres de negocios de hoy no pueden seguir aproximaciones ya pasadas en las que los consumidores eran considerados homogéneos y caracterizados por un número pequeño de variables demográficas. En su lugar, deben desarrollar estrategias que atraigan a numerosos segmentos de clientes con características demográficas y psicográficas diversas en un mercado con múltiples restricciones (legales, económicas, competitivas, tecnológicas, etc). Sólo a través del análisis multivariante las relaciones múltiples de este tipo podrán ser examinadas adecuadamente para obtener un entendimiento más completo y real del entorno que permita tomar las decisiónes más adecuadas.”
![Page 4: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/4.jpg)
Es una metodología estadística sofisticada, mucho más potente, que utiliza los métodos del álgebra lineal, matricial, cálculo numérico, geometría lineal, entre otras.
Los métodos de análisis multivariante se diferencian unos de otros, según su área de aplicación se refiera a una o más problemas y según se requiera uno o más grupo de variables.
![Page 5: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/5.jpg)
Objetivos del Análisis Multivariante
Pueden sintetizarse en dos:1) Proporcionar métodos cuya finalidad es
el estudio conjunto de datos multivariantes que el análisis estadístico uni y bidimensional no pueden conseguir.
2) Ayudar al analista o investigador a tomar decisiones óptimas en el contexto en el que se encuentre teniendo en cuenta la información disponible por el conjunto de datos analizado.
![Page 6: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/6.jpg)
TIPOS DE TECNICAS MULTIVARIANTES
Se pueden clasificar en tres grandes grupos:
1) Métodos de dependencia Suponen que las variables analizadas están divididas en dos
grupos: las variables dependientes y las variables independientes. El objetivo de los métodos de dependencia consiste en determinar si el conjunto de variables independientes afecta al conjunto de variables dependientes y de qué forma.
2) Métodos de interdependencia Estos métodos no distinguen entre variables dependientes e
independientes y su objetivo consiste en identificar qué variables están relacionadas, cómo lo están y por qué.
3) Métodos estructurales Suponen que las variables están divididas en dos grupos: el
de las variables dependientes y el de las independientes. El objetivo de estos métodos es análizar, no sólo como las variables independientes afectan a las variables dependientes, sino también cómo están relacionadas las variables de los dos grupos entre sí.
![Page 7: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/7.jpg)
CLASIFICACIÓN DE LAS TÉCNICAS MULTIVARIANTESCLASIFICACIÓN DE LAS TÉCNICAS MULTIVARIANTES
El tipo de relación que está siendo examinadas es de:
Dependencia Interdependencia.La estructura de la relación es entre:
Variables.C.P.
Análisis FactorialModelos loglineal.
Casos.Análisis Cluster
Objetos.Escalamiento
multidimensional.Análisis de
Corresponden -cias
una Variabledependiente
Varias Variablesdependientes
Métrica. Regresión Múltiple.
Análisis de supervivencia.
No métrica.Análisis Discriminante.Modelos de Regresión
Logística.Análisis Conjunto.
Métricas.Manova.
Correlación Canónica.
![Page 8: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/8.jpg)
FASES PRINCIPALES DE UNA INVESTIGACIÓN MULTIVARIANTEFASES PRINCIPALES DE UNA INVESTIGACIÓN MULTIVARIANTE
• Definir el problema de Investigación• Objetivos; diseño e hipótesis• Técnica Multivariante a utilizar.
Desarrollo del Proyecto de Análisis
Evaluación de los supuestos de la Técnica Multivariante
• Estimación del modelo Multivariante.• Valoración del Ajuste del Modelo.
Interpretación de los valores Teóricos
Validación del Modelo Multivariante
![Page 9: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/9.jpg)
APLICACIONES DE LAS TÉCNICAS MULTIVARIANTES
MedicinaMedicina• Evaluar la presencia o ausencia de determinados síntomas Evaluar la presencia o ausencia de determinados síntomas
clínicos para diagnosticar la enfermedad de un paciente clínicos para diagnosticar la enfermedad de un paciente (análisis discriminante).(análisis discriminante).
• Para estimar la probabilidad de que la sintomatología de una Para estimar la probabilidad de que la sintomatología de una determinada enfermedad reaparezca antes de un período determinada enfermedad reaparezca antes de un período determinado, conocidos el tiempo de respuesta al tratamiento determinado, conocidos el tiempo de respuesta al tratamiento y los distintos hábitos del paciente, (Regresión logística).y los distintos hábitos del paciente, (Regresión logística).
• Se tabula las frecuencias de ciertos estímulos y sus respuestas. Se tabula las frecuencias de ciertos estímulos y sus respuestas. Interesa obtener una representación bidimensional de las Interesa obtener una representación bidimensional de las correspondencias entre estímulos y respuestas (Análisis correspondencias entre estímulos y respuestas (Análisis Factorial de Correspondencia).Factorial de Correspondencia).
![Page 10: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/10.jpg)
BiologíaBiología::
Se miden diferentes variables biométricas en los individuos de una misma especie. Se desea detectar componentes de tamaño y forma (Análisis de Componentes Principales).
Las observaciones de “p” variables biométricas representativas de los individuos de una especie, se obtienen para estudiar la variabilidad entre diferentes especies o razas geográficas (Análisis Canónicos).
![Page 11: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/11.jpg)
Sociología:
Con referencia a determinadas características sociales, políticas y geográficas se mide la similaridad de un grupo de naciones. (Escalamiento Multdimensional).
Psicología:
Los resultados de un test de inteligencia de “n” ítems basados en una muestra. Para detectar los factores de la inteligencia (Análisis Factorial).
![Page 12: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/12.jpg)
Investigación de Mercados:
1.Se quiere determinar los beneficios subyacentes que buscan los consumidores en la compra de una pasta dental. (Análisis Factorial).
2. Para el análisis de percepciones y preferencias del consumidor (Escalamiento Multidimensional).
![Page 13: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/13.jpg)
TAREA
El estudiante realizará un resumen sobre las clases de variable y los tipos de escala de medida, con sus respectivos ejemplos.
![Page 14: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/14.jpg)
MATRIZ DE DATOS
x
x x x
11 12 1p
21 22 2p
npn1 n2
x x x
x x
..........
...........
. . ........... .
...........
'1'2
'n
X
X
.
X
X
Llamaremos X a la matriz de datos y xij a su elemento genérico que representa el valor de la variable j sobre el individuo i. donde i = 1, ..., n y j = 1, ..., p.La matriz de datos X tendrá dimensiones n × p y puede representarse de dos formas distintas. Por filas como:
donde cada variable X’i es un vector fila p ×1 que representa los valores de las p variables sobre el individuo “i”.
![Page 15: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/15.jpg)
Alternativamente podemos representar la matriz X por columnas:
donde ahora cada variable Xj es un vector columna n × 1 que representa la variable “j”, medida en los n elementos de la población.
1 2 pX = X X ....... X
![Page 16: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/16.jpg)
ESTADÍSTICOS MULTIVARIADOS
Vector de Medias muestralEs la medida de centralización más utilizada para describir datos multivariantes, tiene dimensión p y recoge las medias de cada una de las p variables.Se calcula fácilmente mediante:
'1
p
n
1
2
X
XX X 1
.
X
![Page 17: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/17.jpg)
Ejemplo: Se obtuvo la siguiente información de un grupo de PEC que atienden a niños y niñas de cero a dos años, mediante una ficha de observación de desempeño en el aula en la región de Apurimac.
ESTADÍSTICAS
6 6 6 6 6 6 6
11,00 7,67 6,67 21,17 13,67 11,00 8,00
11,00 8,00 5,50 21,50 14,50 11,00 8,00
n
Media
Mediana
PUNTAJE DEESTRATEGIAS
METODOLÓGICAS
PUNTAJE DEPROTAGONISMOY PARTICIPACIÓN
PUNTAJE DEDIVERSIDADCULTURAL Y
LINGÜÍSTICA ENLOS PROCESOSPEDAGÓGICOS
PUNTAJE DERECURSOSINSUMO YESPACIOS
PUNTAJE DEACTITUDES
EN SULABOR
COTIDIANA
PUNTAJE DECAPACIDADES
DECOMUNICACIÓN
PUNTAJE DEEMPATÍA Y
RESOLUCIÓNDE
PROBLEMAS
![Page 18: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/18.jpg)
![Page 19: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/19.jpg)
Matriz de varianzas-covarianzas muestral, es una medida de dispersión
La variabilidad de los datos y la información relativa a las relaciones lineales entre las variables se resumen en la matriz de varianzas y covarianzas. Esta matriz es cuadrada y simétrica de orden p, donde los términos diagonales son las varianzas y los no diagonales, las covarianzas entre las variables. Llamando S a esta matriz, tendremos que, por definición:
21
22
2
s
s p
12 1p
21 2p
p1 p2
s s
s
s
s ..........
s ...........
. . ........... .
........... s
S
![Page 20: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/20.jpg)
Se calcula: '
1
1 n
in
i iS X - X X - X
MATRIZ DE VARIANZAS-COVARIANZAS
9,200 9,000 8,000 14,000 10,800 8,000 5,200
9,000 10,667 6,867 14,067 12,867 7,000 6,800
8,000 6,867 10,267 15,667 11,667 7,600 5,800
14,000 14,067 15,667 31,367 27,667 13,800 10,000
10,800 12,867 11,667 27,667 28,267 10,000 9,600
8,000 7,000 7,600 13,800 10,000 8,000 3,600
5,200 6,800 5,800 10,000 9,600 3,600 6,400
PUNTAJE DE ESTRATEGIASMETODOLÓGICAS
PUNTAJE DE PROTAGONISMO YPARTICIPACIÓN
PUNTAJE DE DIVERSIDAD CULTURAL YLINGÜÍSTICA EN LOS PROCESOSPEDAGÓGICOS
PUNTAJE DE RECURSOS INSUMO YESPACIOS
PUNTAJE DE ACTITUDES EN SU LABORCOTIDIANAPUNTAJE DE CAPACIDADES DECOMUNICACIÓNPUNTAJE DE EMPATÍA Y RESOLUCIÓN DEPROBLEMAS
PUNTAJE DEESTRATEGIAS
METODOLÓGICAS
PUNTAJE DEPROTAGONISMO
YPARTICIPACIÓN
PUNTAJE DEDIVERSIDADCULTURAL YLINGÜÍSTICA
EN LOSPROCESOS
PEDAGÓGICOS
PUNTAJE DERECURSOSINSUMO YESPACIOS
PUNTAJE DEACTITUDES
EN SULABOR
COTIDIANA
PUNTAJE DECAPACIDADES
DECOMUNICACIÓN
PUNTAJE DEEMPATÍA Y
RESOLUCIÓNDE
PROBLEMAS
EJEMPLO:
Tarea: ¿Qué es una matriz definida positiva?
![Page 21: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/21.jpg)
MEDIDAS GLOBALES DE VARIABILIDAD
1)Varianza Total, es una medida global de dispersión para un conjunto de variables medidas en escala métrica.
2
1
( )p
jj
VT tr s
S
2 2
1
1 p
ji
S sp
2)Varianza media, es una medida de dispersión promedio de un conjunto de variables medidas en escala métrica.
Inconveniente: no considera la estructura de dependencia de las variables y las unidades de medida de las variables.
![Page 22: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/22.jpg)
Ejemplos
72
1
( ) 104.168jj
VT tr s
S
2 2
1
114.88
p
ji
S sp
![Page 23: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/23.jpg)
3) Varianza Generalizada
Una medida global escalar de la variabilidad conjunta de k variables es la varianza generalizada, que es el determinante de la matriz de varianzas y covarianzas. Su raíz cuadrada se denomina desviación típica generalizada, y tiene las propiedades siguientes:
(i) Está bien definida, ya que el determinante de la
matriz de varianzas y covarianzas es siempre mayor o igual que 0.
(ii) Es una medida del área (para p = 2), volumen (para p = 3) o hipervolumen (para k > 3) ocupado por el conjunto de datos.
VG S
![Page 24: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/24.jpg)
Interpretación geométrica:
21 12 1 2
212 1 2 2
s r s s
r s s s
S
2 2 21 2 12
21 2 12
1
(1
( )
)
VG s s r
DTG VG s s r
2 2 2 2 2 21 2 1 2 1 2 12( 1) ( 1) 11 cos ( ) (1 )n n nArea d d sen s s s s r
Cuando p =2
![Page 25: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/25.jpg)
212
22 21 2 1
( )( )
( 1)r
Areas s
n
S
2
11( ) p
Volumen
n
S
La varianza generalizada en p
Observación:
No es útil para comparar conjuntos de datos con diferentes números de variables.
Debido a que la VG se incrementa o decrece monótonamente al incrementar el número de variables.
![Page 26: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/26.jpg)
4) Varianza Efectiva, Peña y Rodríguez (2003) propusieron la siguiente medida global de variabilidad:
1/1/ ppVE VG S
1/ 21/ 2 ppDE VG S
No presenta los inconvenientes de la varianza generalizada.
![Page 27: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/27.jpg)
30.1340
10.0447
48.2671
= 3.6410
=1.9081
VT
VM
VG
VE
DE
MATRIZ DE VARIANZAS-COVARIANZAS
9,200 9,000 8,000
9,000 10,667 6,867
8,000 6,867 10,267
PUNTAJE DEESTRATEGIASMETODOLÓGICAS
PUNTAJE DEPROTAGONISMO YPARTICIPACIÓN
PUNTAJE DE DIVERSIDADCULTURAL YLINGÜÍSTICA EN LOSPROCESOSPEDAGÓGICOS
PUNTAJE DEESTRATEGIAS
METODOLÓGICAS
PUNTAJE DEPROTAGONISMOY PARTICIPACIÓN
PUNTAJE DEDIVERSIDADCULTURAL Y
LINGÜÍSTICA ENLOS
PROCESOSPEDAGÓGICOS
EJEMPLO
![Page 28: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/28.jpg)
Variabilidad y Distancias
Dados dos vectores xk , xl p , la función “d” es una distancia o métrica con las siguientes propiedades:i) d: p x p + ; es decir d(xk , xl )0
ii) d(xk , xk )= 0
iii) d(xk , xl ) = d(xl , xk )
iv) d(xk , xl ) = d(xk , xm ) + d(xm , xl ) (desigualdad triangular)
y
x
yx y
x
yx yxyxd ),(
![Page 29: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/29.jpg)
Una familia de medidas de distancias muy conocidas en p son las distancias de Minkowski:
1/
( )
1
1/ 2
(2) 2
1
2
( )
( )
rp
r rkl kj lj
j
p
kl kj ljj
r
d x x
d x x
Cuando r =2 se tiene la distancia euclídea, que es la más utilizada, pero depende de las unidades de medida.
Ejemplo: Para los datos de las PEC
![Page 30: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/30.jpg)
Proximity Matrix
,000 12,530 6,928 7,483 14,000 11,576
12,530 ,000 10,050 16,155 26,134 22,605
6,928 10,050 ,000 8,602 17,664 15,362
7,483 16,155 8,602 ,000 12,884 11,136
14,000 26,134 17,664 12,884 ,000 8,124
11,576 22,605 15,362 11,136 8,124 ,000
1
2
3
4
5
6
1 2 3 4 5 6
Euclidean Distance
This is a dissimilarity matrix
Para eliminar el efecto de las unidades de medida de las variables se utiliza la familia de métricas euclídeas ponderadas:
1/ 2(2) 1( ) ( )kl k l k ld 'x x M x x
![Page 31: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/31.jpg)
M es una matriz diagonal, aunque no es necesario, pero debe ser no singular y definida positiva.
1) Distancia de Mahalanobis, se define como:
1/ 21( ) ( ) 1,2,...i i id i n 'x x S x x
Esta libre de unidades de medidas y mide la distancia de cada individuo con respecto a su vector de medias.
EJEMPLO:
Consideremos las primeras cuatro variables de las PEC
![Page 32: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/32.jpg)
MATRIZ DE VARIANZAS-COVARIANZAS
9,200 9,000 8,000 14,000
9,000 10,667 6,867 14,067
8,000 6,867 10,267 15,667
14,000 14,067 15,667 31,367
PUNTAJE DEESTRATEGIASMETODOLÓGICAS
PUNTAJE DEPROTAGONISMO YPARTICIPACIÓN
PUNTAJE DE DIVERSIDADCULTURAL YLINGÜÍSTICA EN LOSPROCESOSPEDAGÓGICOS
PUNTAJE DE RECURSOSINSUMO Y ESPACIOS
PUNTAJE DEESTRATEGIAS
METODOLÓGICAS
PUNTAJE DEPROTAGONISMO
YPARTICIPACIÓN
PUNTAJE DEDIVERSIDADCULTURAL Y
LINGÜÍSTICA ENLOS
PROCESOSPEDAGÓGICOS
PUNTAJE DERECURSOSINSUMO YESPACIOS
61.5
15.3750
249.3765
= 3.9739
= 1.9935
VT
VM
VG
VE
DE
![Page 33: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/33.jpg)
d1 = 1,3128d2 =1,7670d3 = 1,9849d4 =1,9535d5=1,8501d6 =1,9939
Los resultados de las
Distancias de mahalanobis son:
![Page 34: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/34.jpg)
Medidas de Dependencia linealPermite evaluar la estructura de dependencia entre las variables bajo estudio.Matriz de Correlación; el grado de asociación lineal entre dos variables se estudia mediante el coeficiente de correlación simple.
2 21 1
jkjk jk
j k
r rs
s s
12 1
21 2
1 2
1
1,
1
p
p
p p
r r
r rR
r r
R es una matriz simétrica, cuadrada y definida positiva.
![Page 35: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/35.jpg)
Ejemplo:
MATRIZ DE CORRELACIONES
1 ,909 ,823 ,824
,909 1 ,656 ,769
,823 ,656 1 ,873
,824 ,769 ,873 1
PUNTAJE DE ESTRATEGIAS METODOLÓGICAS
PUNTAJE DE PROTAGONISMO Y PARTICIPACIÓN
PUNTAJE DE DIVERSIDAD CULTURAL YLINGÜÍSTICA EN LOS PROCESOS PEDAGÓGICOSPUNTAJE DE RECURSOS INSUMO Y ESPACIOS
PUNTAJE DEESTRATEGIAS
METODOLÓGICAS
PUNTAJE DEPROTAGONISMOY PARTICIPACIÓN
PUNTAJE DEDIVERSIDADCULTURAL Y
LINGÜÍSTICA ENLOS PROCESOSPEDAGÓGICOS
PUNTAJE DERECURSOSINSUMO YESPACIOS
![Page 36: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/36.jpg)
2) Correlación Múltiple, permite evaluar el grado de asociación de una variable “j” con el resto de variables.
Para calcular, seguir los siguientes pasos:• Tomar el j-ésimo elemento de la diagonal de la matriz de
varianza-covarianzas, al que se denotara por sjj.
• Tomar el j-ésimo elemento de la diagonal de la inversa de la matriz de varianza-covarianzas, al que se denotara por sjj.
11j jj
jj
Rs s
R1 = 0.9584R2 =0.9379R3 = 0.9263 R4=0.9139
![Page 37: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/37.jpg)
3) Correlaciones Parciales; mide el grado de asociación entre dos variables controlando el efecto de las otras variables.Trabajamos con la matriz inversa de la matriz de varianzas-covarianzas.
.1,2,....,
jk
jk p jj kk
sr
s s 11/ 2 1/ 2
1 1( ) ( )1)( D D
S SP S
-1.0000 0.8394 0.6339 -0.1789
0.8394 -1.0000 -0.5526 0.4352
0.6339 -0.5526 -1.0000 0.6946
-0.1789 0.4352 0.6946 -1.0000
P
EJEMPLO:
![Page 38: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/38.jpg)
4)Coeficiente de Dependencia efectiva; es una medida global de la dependencia de los datos:
1
11 ppCDE R
Si las variables están todas incorrelacionadas, se tiene que R= 1 y si las variables están correlacionadas R= 0
Ejemplo: Para las 4 variables medidas a las PEC, se tiene :
CDE = 0.8009
Globalmente la dependencia lineal explica el 80.09% de la variabilidad de los puntajes de las variables consideradas.
![Page 39: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/39.jpg)
5) Matriz de precisión, es la inversa de la matriz de varianzas-covarianzas, y contiene la siguiente información:
•Los elementos fuera de la diagonal (sij) son los elementos de esta matriz.; y es el cociente del coeficiente de regresión de la variable “j” para explicar “i” y la varianza residual de la regresión.
•En la diagonal se encuentran las inversas de las varianzas residuales de la regresión de cada variable conel resto de ellas.
•Si se estandarizan los elementos de esta matriz , los elementos fuera de la diagonal son las correlaciones parciales.
.2 2
ˆ 1
( ) ( )
ijijij ii
ij R ii jjr r
ss s r
s i s i s s
![Page 40: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/40.jpg)
1
1.3353 -0.8560 -0.6068 0.0909
-0.8560 0.7787 0.4040 -0.1689
-0.6068 0.4040 0.6863 -0.2531
0.0909 -0.1689 -0.2531 0.1935
S
Ejemplo:
![Page 41: 1 Semana Analisis Multivariante](https://reader030.vdocuments.mx/reader030/viewer/2022012304/557ac13fd8b42ad81b8b51eb/html5/thumbnails/41.jpg)
Bibliografía [1] ANDERSON T.W.: An Introduction to Multivariate Analysis. 2nd Edition.
John Wiley & Sons.[2] BERNARD FLURY. 1997. A First Course in Multivariate Statistics.
Editorial Springer – Verlag. New York Inc.[3] CASTRO POSADA. 2000. Estadística Multivariante. Análisis de
Correlaciones Amaru Ediciones Melendez 21. Salamanca. España.[4] CARLES M. CUADRAS, 2007. Nuevos Métodos de Análisis
Multivariante . CMC EDITIONS. España [5] DANIEL PEÑA, 2002. Análisis de Datos Multivariados. McGRAW-HILL/
Interamericana de España. [6] URIEL, EZEQUIEL, ALDAS JOAQUIN. 2005 Análisis Multivariante
Aplicado. Editorial Thompson Editores. España. 7] JOHNSON, R.; WICHERN, D. 1982. Applied Multivariate Statistical
Analysis. Editorial Prentice – Hall Inc.Englewood Cliffs. New Jersey. [8] MARDIA, KENT AND BIBBY. 1982. Multivariate Analysis. Academic
Press. London.
Textos de Consulta:
[1] DALLAS E. JOHNSON. 2000. Métodos Multivariados Aplicados al Análisis de Datos. International Thomson Editores.
[2] HAIR J., ANDERSON R., TATHAM R., BLACK W. 2001. Análisis Multivariante. Prentice Hall.