analisis multivariante (presentación)
TRANSCRIPT
-
8/13/2019 Analisis Multivariante (Presentacin)
1/291
1
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
2/291
2
Anlisis Multivariante
El desarrollo de la tecnologa informtica disponible hoyen da ha hecho posible avances extraordinarios en elanlisis de datos.
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
3/291
3
El desarrollo de la tecnologa informtica disponible hoyen da ha hecho posible avances extraordinarios en elanlisis de datos.
Gran parte de la creciente comprensin y pericia en elanlisis de datos se debe al desarrollo de la estadstica y lainferencia estadstica, en particular de un grupo de tcnicas
conocidas como anlisis multivariante.
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
4/291
4
El desarrollo de la tecnologa informtica disponible hoyen da ha hecho posible avances extraordinarios en elanlisis de datos.
Gran parte de la creciente comprensin y pericia en elanlisis de datos se debe al desarrollo de la estadstica y lainferencia estadstica, en particular de un grupo de tcnicas
conocidas comoanlisis multivariante
. Las tcnicas del anlisis multivariante estn siendoaplicadas a la industria, administracin y centros deinvestigacin del mbito universitario.
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
5/291
5
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
6/291
6
Segn los estadsticos Hardyck y Petrinovich:Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
7/291
7
Segn los estadsticos Hardyck y Petrinovich:
Elanlisis de datos multivariante predominar en el futuroy dar por resultado cambios drsticos en el modo en que
los investigadores piensan sobre los problemas y en cmodisean sus investigaciones. Esos mtodos hacen posibleplantear preguntas especficas y precisas de considerablecomplejidad lo que posibilita evaluar los efectos de las
variaciones paramtricas ocurridas de forma natural en elcontexto en el que normalmente ocurren se puedenpreservar las correlaciones naturales entre las mltiplesinfluencias sobre el comportamientosin provocar el tpico
aislamiento de esos individuos o variables.
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
8/291
8
Qu es Anlisis Multivariante?
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
9/291
9
En un sentido amplio, se refiere a todos los mtodosestadsticos que analizan simultneamente medidas
mltiples de cada individuo u objeto sometido ainvestigacin. Cualquier anlisis simultneo de dos variablespuede ser considerado aproximadamente como un anlisismultivariante.
Qu es Anlisis Multivariante?
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
10/291
10
En un sentido amplio, se refiere a todos los mtodosestadsticos que analizan simultneamente medidas
mltiples de cada individuo u objeto sometido ainvestigacin. Cualquier anlisis simultneo de dos variablespuede ser considerado aproximadamente como un anlisismultivariante.
En sentido estricto, muchas tcnicas multivariantes sonextensiones del anlisis univariante (anlisis dedistribuciones de una sola variable) y del anlisis bivariante(clasificaciones cruzadas, correlacin, anlisis de varianza yregresiones simples para analizar dos variables).
Qu es Anlisis Multivariante?
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
11/291
11
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
12/291
12
VALOR TERICOAlgunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
13/291
13
VALOR TERICO
Es el elemento esencial del anlisis mutivariante, es unacombinacin lineal de variables con ponderaciones
determinadas empricamente.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
14/291
14
VALOR TERICO
Es el elemento esencial del anlisis mutivariante, es unacombinacin lineal de variables con ponderaciones
determinadas empricamente.
El investigador especifica las variables, mientras que lasponderaciones son objeto especfico de determinacin porparte de la tcnica multivariante.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
15/291
15
VALOR TERICO
Es el elemento esencial del anlisis mutivariante, es unacombinacin lineal de variables con ponderaciones
determinadas empricamente.
El investigador especifica las variables, mientras que lasponderaciones son objeto especfico de determinacin porparte de la tcnica multivariante.
Un valor torico de n variables ponderadas X1a Xnpuedeexpresarse matemticamente as:
valor terico = w1X1+ w2X2+ wnXn
donde Xies la variable observada y wila ponderacin
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
16/291
16
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
17/291
17
ESCALA DE MEDIDAAlgunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
18/291
18
ESCALA DE MEDIDA
El anlisis de los datos implica la separacin, identificacin ymedida de la variacin en un conjunto de variables, tanto
entre ellas mismas como entre una variable dependiente yuna o ms variables independientes. No es posible separaro identificar una variacin a menos que sea mesurable.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
19/291
19
ESCALA DE MEDIDA
El anlisis de los datos implica la separacin, identificacin ymedida de la variacin en un conjunto de variables, tanto
entre ellas mismas como entre una variable dependiente yuna o ms variables independientes. No es posible separaro identificar una variacin a menos que sea mesurable.
Existe dos tipos bsicos de datos: no mtricos
(cualitativos) y mtricos(cuantitativos).
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
20/291
20
ESCALA DE MEDIDA
El anlisis de los datos implica la separacin, identificacin ymedida de la variacin en un conjunto de variables, tanto
entre ellas mismas como entre una variable dependiente yuna o ms variables independientes. No es posible separaro identificar una variacin a menos que sea mesurable.
Existe dos tipos bsicos de datos: no mtricos
(cualitativos) y mtricos(cuantitativos).Los datos no mtricos son atributos, caractersticas opropiedades categricas. Las variables medidasmtricamente reflejan cantidades relativas o grado.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
21/291
21
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
22/291
22
ERROR DE MEDIDAAlgunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
23/291
23
ERROR DE MEDIDA
Es el grado en que los valores observados no sonrepresentativos de los valoresverdaderos.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
24/291
24
ERROR DE MEDIDA
Es el grado en que los valores observados no sonrepresentativos de los valoresverdaderos.
Tiene mltiples fuentes, que van desde errores en laentrada de datos a la imprecisin en la medicin, pasandopor la incapacidad de los encuestados a proporcionainformacin precisa.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
25/291
25
ERROR DE MEDIDA
Es el grado en que los valores observados no sonrepresentativos de los valoresverdaderos.
Tiene mltiples fuentes, que van desde errores en laentrada de datos a la imprecisin en la medicin, pasandopor la incapacidad de los encuestados a proporcionainformacin precisa.
Se debe asumir que todas las variables usadas en tcnicasmultivariantes tienen algn grado de error de medida.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
26/291
26
ERROR DE MEDIDA
Es el grado en que los valores observados no sonrepresentativos de los valoresverdaderos.
Tiene mltiples fuentes, que van desde errores en laentrada de datos a la imprecisin en la medicin, pasandopor la incapacidad de los encuestados a proporcionainformacin precisa.
Se debe asumir que todas las variables usadas en tcnicasmultivariantes tienen algn grado de error de medida.
El error de medida aade ruido. El valor observadorepresenta tanto elefectoverdaderocomo elruido.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
27/291
27
ERROR DE MEDIDA
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
28/291
28
ERROR DE MEDIDA
Para reducir el error de medida se pueden seguir varioscaminos:
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
29/291
29
ERROR DE MEDIDA
Para reducir el error de medida se pueden seguir varioscaminos:
En cualquier medicin debe considerarse la validez y lafiabilidad. Si la primera est asegurada, el investigadordebe considerar la fiabilidad de las medidas.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
30/291
30
ERROR DE MEDIDA
Para reducir el error de medida se pueden seguir varioscaminos:
En cualquier medicin debe considerarse la validez y lafiabilidad. Si la primera est asegurada, el investigadordebe considerar la fiabilidad de las medidas.
Desarrollar mediciones multivariantes tambinconocidas como escalas sumadas, donde diversasvariables se unen en una medida compuesta pararepresentar un concepto. Se trata de evitar que una nicavariable represente un concepto y usar varias variables
como indicadores.
Algunos conceptos bsicos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
31/291
31
Significacin estadsticafrente a Potencia estadstica
-
8/13/2019 Analisis Multivariante (Presentacin)
32/291
32
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
33/291
33
Todas las tcnicas multivariantes (excepto el anlisiscluster y el anlisis multidimensional) se basan en lainferencia estadstica de los valores de una poblacin o larelacin entre variables a partir de muestras.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
34/291
34
Todas las tcnicas multivariantes (excepto el anlisiscluster y el anlisis multidimensional) se basan en lainferencia estadstica de los valores de una poblacin o larelacin entre variables a partir de muestras.
Para interpretar las inferencias estadsticas se debenespecificar los niveles aceptables de error estadstico.
Significacin versus Potencia
Anlisis Multivariante
A li i M l i i
-
8/13/2019 Analisis Multivariante (Presentacin)
35/291
35
Todas las tcnicas multivariantes (excepto el anlisiscluster y el anlisis multidimensional) se basan en lainferencia estadstica de los valores de una poblacin o larelacin entre variables a partir de muestras.
Para interpretar las inferencias estadsticas se debenespecificar los niveles aceptables de error estadstico.
El modo de aproximacin ms comn es determinar elnivel de error de tipo I, tambin conocido como alfa().
Significacin versus Potencia
Anlisis Multivariante
A li i M lti i t
-
8/13/2019 Analisis Multivariante (Presentacin)
36/291
36
Todas las tcnicas multivariantes (excepto el anlisiscluster y el anlisis multidimensional) se basan en lainferencia estadstica de los valores de una poblacin o larelacin entre variables a partir de muestras.
Para interpretar las inferencias estadsticas se debenespecificar los niveles aceptables de error estadstico.
El modo de aproximacin ms comn es determinar elnivel de error de tipo I, tambin conocido como alfa().
El error de tipo I es la probabilidad de rechazar lahiptesis nula cuando es cierta.
Significacin versus Potencia
Anlisis Multivariante
A li i M lti i t
-
8/13/2019 Analisis Multivariante (Presentacin)
37/291
37
Significacin versus Potencia
Anlisis Multivariante
Anlisis M lti a iante
-
8/13/2019 Analisis Multivariante (Presentacin)
38/291
38
El error de tipo I es, sencillamente, la posibilidad de que laprueba muestre significacin estadstica cuando enrealidad no est presente (unfalsopositivo).
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
39/291
39
El error de tipo I es, sencillamente, la posibilidad de que laprueba muestre significacin estadstica cuando enrealidad no est presente (unfalsopositivo).
Al especificar un nivel alfa se fijan los mrgenes admisiblesde error especificando la probabilidad de concluir que lasignificacin existe cuando en realidad no existe.
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
40/291
40
El error de tipo I es, sencillamente, la posibilidad de que laprueba muestre significacin estadstica cuando enrealidad no est presente (unfalsopositivo).
Al especificar un nivel alfa se fijan los mrgenes admisiblesde error especificando la probabilidad de concluir que lasignificacin existe cuando en realidad no existe.
Cuando se especifica el nivel de error de tipo I tambin sedetermina un error asociado, el error de tipo II o beta().
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
41/291
41
El error de tipo I es, sencillamente, la posibilidad de que laprueba muestre significacin estadstica cuando enrealidad no est presente (unfalsopositivo).
Al especificar un nivel alfa se fijan los mrgenes admisiblesde error especificando la probabilidad de concluir que lasignificacin existe cuando en realidad no existe.
Cuando se especifica el nivel de error de tipo I tambin sedetermina un error asociado, el error de tipo II o beta().
El error de tipo II es la probabilidad de no rechazar lahiptesis nula cuando es realmente falsa.
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
42/291
42
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
43/291
43
Una probabilidad ms interesante es 1 - , que sedenomina potenciadel test de inferencia estadstica.
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
44/291
44
Una probabilidad ms interesante es 1 - , que sedenomina potenciadel test de inferencia estadstica.
Potencia es la probabilidad de rechazar correctamente lahiptesis nula cuando debe ser rechazada.
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
45/291
45
Una probabilidad ms interesante es 1 - , que sedenomina potenciadel test de inferencia estadstica.
Potencia es la probabilidad de rechazar correctamente lahiptesis nula cuando debe ser rechazada.
Es la probabilidad de que la inferencia estadstica seindique cuando est presente.
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
46/291
46
Significacin versus Potencia
Anlisis Multivariante
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
47/291
47
Significacin versus Potencia
Anlisis Multivariante
Realidad
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
48/291
48
Significacin versus Potencia
s s u a a e
Realidad
Ho es cierta
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
49/291
49
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
50/291
50
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Decisin
estadstica
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
51/291
51
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Decisin
estadstica
Aceptar Ho
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
52/291
52
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Decisin
estadstica
Aceptar Ho
No aceptar Ho
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
53/291
53
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Decisin
estadstica
Aceptar Ho 1-
No aceptar Ho
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
54/291
54
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Decisin
estadstica
Aceptar Ho 1-
No aceptar Ho (error Tipo I)
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
55/291
55
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Decisin
estadstica
Aceptar Ho 1- (error Tipo II)
No aceptar Ho (error Tipo I)
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
56/291
56
Significacin versus Potencia
Realidad
Ho es cierta Ho es falsa
Decisin
estadstica
Aceptar Ho 1- (error Tipo II)
No aceptar Ho (error Tipo I)1-
Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
57/291
57
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
58/291
58
Aunque alfa establece el nivel de significacinestadsticaaceptable, es el nivel de potencia el que dicta la probabilidad
dexitoen la bsqueda de diferencias si es que realmenteexisten.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
59/291
59
Aunque alfa establece el nivel de significacinestadsticaaceptable, es el nivel de potencia el que dicta la probabilidad
dexitoen la bsqueda de diferencias si es que realmenteexisten.
Los errores Tipo I y Tipo II estn inversamenterelacionados, a medida que el error de Tipo I se acerca a
cero el de Tipo II aumenta.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
60/291
60
Aunque alfa establece el nivel de significacinestadsticaaceptable, es el nivel de potencia el que dicta la probabilidad
dexitoen la bsqueda de diferencias si es que realmenteexisten.
Los errores Tipo I y Tipo II estn inversamenterelacionados, a medida que el error de Tipo I se acerca a
cero el de Tipo II aumenta. Al disminuir el error Tipo I tambin se reduce la potenciade la prueba estadstica.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
61/291
61
La potencia est determinada por tres factores:
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
62/291
62
La potencia est determinada por tres factores:
Efecto tamao: Un efecto grande es ms probable deencontrar que un efecto pequeo. Los efectos de tamaose miden en trminos estandarizados. Ej: diferencia demedias entre dos grupos o correlacin entre variables.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
63/291
63
La potencia est determinada por tres factores:
Efecto tamao: Un efecto grande es ms probable deencontrar que un efecto pequeo. Los efectos de tamaose miden en trminos estandarizados. Ej: diferencia demedias entre dos grupos o correlacin entre variables.
Alfa: Cuando alfa disminuye la potencia decrece. Losniveles de significacin convencionales son 0.05 0.01.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
64/291
64
La potencia est determinada por tres factores:
Efecto tamao: Un efecto grande es ms probable deencontrar que un efecto pequeo. Los efectos de tamaose miden en trminos estandarizados. Ej: diferencia demedias entre dos grupos o correlacin entre variables.
Alfa: Cuando alfa disminuye la potencia decrece. Losniveles de significacin convencionales son 0.05 0.01.
Tamao de la muestra: Para cualquier nivel de alfadado, el aumento de la muestra siempre produce unamayor potencia. Pero puede producirse demasiadapotencia (cualquier efecto es significativo).
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
65/291
65
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
66/291
66
Las relaciones entre alfa, tamao de la muestra, efectotamao y potencia son bastante complicadas.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
67/291
67
Las relaciones entre alfa, tamao de la muestra, efectotamao y potencia son bastante complicadas.
Cohen (1977) ha examinado la potencia para la mayorade las pruebas de inferencia estadstica y ha proporcionadopautas para los niveles aceptables de potencia.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
68/291
68
Las relaciones entre alfa, tamao de la muestra, efectotamao y potencia son bastante complicadas.
Cohen (1977) ha examinado la potencia para la mayorade las pruebas de inferencia estadstica y ha proporcionadopautas para los niveles aceptables de potencia.
Sugiere que los estudios deben disearse para conseguir
niveles de alfa de 0.05 o menos, con niveles de potencia del80 porciento.
Significacin versus Potencia
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
69/291
69
Niveles de potencia para la comparacin de medias: variaciones por eltamao de la muestra, el nivel de significacin y el efecto tamao.
Significacin versus Potencia
alfa = 0.05Efecto tamao
alfa = 0.01Efecto tamao
Tamaomuestral
Pequeo(0.2)
Moderado(0.5)
Pequeo(0.2)
Moderado(0.5)
20 0.095 0.338 0.025 0.144
40 0.143 0.598 0.045 0.349
60 0.192 0.775 0.067 0.54980 0.242 0.882 0.092 0.709
100 0.290 0.940 0.120 0.823
150 0.411 0.990 0.201 0.959
200 0.516 0.998 0.284 0.992
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
70/291
70
Impacto del tamao de la muestra en la potencia de algunos niveles alfa
(0.01, 0.05, 0.10) con efecto tamao de 0.35 (entre pequeo y moderado).
Significacin versus Potencia
-
8/13/2019 Analisis Multivariante (Presentacin)
71/291
71
Tipos de tcnicas
multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
72/291
72
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
73/291
73
Se consideran tres juicios que el analista debe considerarsobre el objeto a investigar y la naturaleza de los datos:
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
74/291
74
Se consideran tres juicios que el analista debe considerarsobre el objeto a investigar y la naturaleza de los datos:
Pueden dividirse las variables en dependientes oindependientes?
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
75/291
75
Se consideran tres juicios que el analista debe considerarsobre el objeto a investigar y la naturaleza de los datos:
Pueden dividirse las variables en dependientes oindependientes?
Si lo anterior es posible, cuntas de estas variables sontratadas como dependientes en un anlisis simple?
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
76/291
76
Se consideran tres juicios que el analista debe considerarsobre el objeto a investigar y la naturaleza de los datos:
Pueden dividirse las variables en dependientes oindependientes?
Si lo anterior es posible, cuntas de estas variables sontratadas como dependientes en un anlisis simple?
Cmo son medidas las variables?
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
77/291
77
Pueden dividirse las variables en dependientes oindependientes?
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
78/291
78
Pueden dividirse las variables en dependientes oindependientes?
La respuesta a esta pregunta indica si debera usarse un anlisis dedependenciao un anlisis de interdependencia.
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
79/291
79
Pueden dividirse las variables en dependientes oindependientes?
La respuesta a esta pregunta indica si debera usarse un anlisis dedependenciao un anlisis de interdependencia.
Anlisis de dependencia: una variable o conjunto de variables esidentificado como la variable dependiente y va a ser explicado por otrasvariables conocidas como independientes.
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
80/291
80
Pueden dividirse las variables en dependientes oindependientes?
La respuesta a esta pregunta indica si debera usarse un anlisis dedependenciao un anlisis de interdependencia.
Anlisis de dependencia: una variable o conjunto de variables esidentificado como la variable dependiente y va a ser explicado por otrasvariables conocidas como independientes.
Anlisis de interdependencia: Ninguna variable o grupo de variableses definido como independiente o dependiente. Se analizan todas lasvariables simultneamente.
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
81/291
81
Cuntas de estas variables son tratadas comodependientes en un anlisis simple?
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
82/291
82
Cuntas de estas variables son tratadas comodependientes en un anlisis simple?
En el anlisis de dependencia puede haber nicamente unavariable dependiente, varias variables dependientes o inclusovarias relaciones de dependencia/independencia.
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
83/291
83
Cmo son medidas las variables?
Clasificacin de la tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
84/291
84
Cmo son medidas las variables?
El anlisis de dependencia puede ser clasificado en
funcin del tipo de escala de la variable con variablesmtricas (numricas/cuantitativas) o no mtricas(cualitativas/categricas).
Clasificacin de la tcnicas multivariantes
Seleccin de una tcnica multivarianteAnlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
85/291
85
Seleccin de una tcnica multivariante
Seleccin de una tcnica multivarianteAnlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
86/291
86
Relacin dedependencia
Seleccin de una tcnica multivariante
Una variabledependiente
en unarelacinnica
Variable dependientemtrica
Variable dependiente nomtrica
Regresin mltipleAnlisis conjunto
Anlisis discriminante mltiple Modelos de probabilidad lineal
Varias variablesdependientes en
una relacinnica
Variable dependientemtrica
Variableindependiente
mtrica
Variableindependiente
no mtrica
Anlisis de correlacincannica
Anlisis multivariantede la varianza
Variable dependienteno mtrica
Anlisis de correlacincannica con variables ficticias
Mltiples relacionesde variables
dependientes eindependientes
Modelo de ecuaciones estructurales
Seleccin de una tcnica multivarianteAnlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
87/291
87
Relacin deinterdependencia
Seleccin de una tcnica multivariante
Relacionesentre
Variables Anlisis factorial
Relaciones entreCasos/Encuestados
Atributos mtricos
Anlisis cluster
Anlisis multidimensional
Atributos no mtricos Anlisis de correspondencias
Relaciones entreObjetos
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
88/291
88
Regresin mltiple
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
89/291
89
Regresin mltiple
Mtodo apropiado cuando el problema incluye una nicavariable mtrica dependiente que se supone est
relacionada con una o ms variables mtricasindependientes.
Su objetivo es predecir los cambios en la variabledependiente en respuesta a cambios en varias variables
independientes.
Ejemplos: prediccin de los gastos mensuales de cenarfuera de casa con informacin referente a la renta familiar,su tamao y la edad del cabeza de familia.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
90/291
90
Anlisis conjunto
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
91/291
91
Anlisis conjunto
Tcnica que se utiliza especficamente para entender cmolos encuestados desarrollan preferencias acerca de
productos o servicios. Se basa en la premisa de que losconsumidores evalan el valor de un producto o serviciocombinando cantidades separadas de valor que proporcionacada atributo.
Ejemplo: El nombre de la marca y el precio pueden ser dosfactores del anlisis conjunto. La marca puede tener dosniveles (X e Y) y el precio cuatro (39, 49, 59 y 69). En lugarde evaluar todas las combinaciones posibles se pueden
evaluar un subconjunto de estas.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
92/291
92
Anlisis discriminante mltiple
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
93/291
93
Anlisis discriminante mltiple
Se emplea cuando la nica variable dependiente esdicotmica (compradorno comprador) o multidicotmica
(alto-medio-bajo). Como en la regresin lineal las variablesindependientes se suponen mtricas.
Ejemplos: Para distinguir innovadores de no innovadores deacuerdo a sus perfiles demogrficos y psicogrficos. Para
distinguir entre usuarios habituales u ocasionales,compradores de marcas de mbito nacional o restringido yel riesgo de crdito bueno del riesgo de crdito malo.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
94/291
94
Modelos de probabilidad lineal
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
95/291
95
Modelos de probabilidad lineal
Son llamados a menudo anlisis logit. Consisten en unacombinacin de regresin mltiple y anlisis discriminante
mltiple. Es similar a la regresin mltiple en que una ovarias variables independientes se usan para predecir unavariable dependiente. Pero la variable dependiente es nomtrica.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
96/291
96
Correlacin cannica
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
97/291
97
Correlacin cannica
Puede verse como una extensin lgica del anlisis deregresin mltiple.
Su objetivo es correlacionar simultneamente variasvariables dependientes mtricas y varias variablesindependientes mtricas.
El principio subyacente es desarrollar una combinacinlineal de cada conjunto de variables (tanto independientescomo dependientes) para maximizar la correlacin entre losdos conjuntos, o sea obtener un conjunto de ponderacionespara las variables que maximice la correlacin.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
98/291
98
Anlisis multivariante de la varianza
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
99/291
99
Anlisis multivariante de la varianza
El anlisis multivariante de la varianza (MANOVA) es unatcnica que puede ser usada para explorar las relaciones
entre diversas categoras de variables independientes(tratamientos) y dos o ms variables mtricasdependientes. Representa una extensin del anlisisunivariante de la varianza (ANOVA).
Es til cuando cuando se disea una situacin experimental(manipulacin de varias variables no mtricas) paracomprobar hiptesis concernientes a la varianza derespuestas de grupos sobre dos o ms variables mtricas
dependientes.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
100/291
100
Concepto de VARIABLE FICTICIA
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
101/291
101
Concepto de VARIABLE FICTICIA
Variable independiente usada para explicar el efecto quetienen los diferentes niveles de una variable no mtrica en
la prediccin de la variable criterio (variable criterio:variable a predecir o explicar por el conjunto de variablesindependientes) .
El nmero de variables ficticias es uno menos que el
nmero de niveles de la variable no mtrica.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
102/291
102
Modelo de ecuaciones estructurales
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
103/291
103
Modelo de ecuaciones estructurales
Es a menudo llamado como LISREL (nombre de uno de lospaquetes informticos ms populares). Esta tcnica nos
permite separar las relaciones para cada conjunto devariables dependientes. Proporciona la tcnica de estimacinms adecuada y eficiente para series de estimaciones deecuaciones simultneas mediante regresiones mltiples.
Se caracteriza por dos componentes bsicos: el modeloestructural y el modelo de medida. El primero es el modelogua. El segundo pemite usar varias variables (indicadores)para una nica variable dependiente o independiente.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
104/291
104
Modelo de ecuaciones estructurales
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
105/291
105
Modelo de ecuaciones estructurales
Ejemplo: la variable dependiente puede ser un conceptorepresentado en una escala aditiva, como el amor propio. En
el modelo de medida se puede evaluar la contribucin decada tem de la escala as como incorporar cmo la escalamide el concepto (fiabilidad) en la estimacin de lasvariables dependientes e independientes.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
106/291
106
Anlisis factorial
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
107/291
107
Anlisis factorial
Es una aproximacin estadstica que puede utilizarse paraanalizar interrelaciones entre un gran nmero de variables y
explicar estas variables en trminos de sus dimensionessubyacentes comunes (factores).
El objetivo es encontrar un modo de condensar la informacincontenida en un nmero de variables originales en un
conjunto ms pequeo de variables (factores) con unaprdida mnima de informacin.
Con una estimacin emprica de la estructura de la variablesconsideradas es una base objetiva para crear escalas aditivas.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
108/291
108
Anlisis cluster
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
109/291
109
Anlisis cluster
Es una tcnica analtica para desarrollar subgrupossignificativos de individuos u objetos. Su objetivo es clasificar
una muestra de entidades (personas u objetos) en un nmeropequeo de grupos mutuamente excluyentes basados ensimilitudes entre las entidades. A diferencia del anlisisdiscriminante, los grupos no estn predefinidos. La tcnica se
usa para identificar grupos.Implica al menos dos etapas. La primera es medir similitudespara determinar la cantidad de grupos. La segunda esdescribir a las personas o variables para determinar su
composicin.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
110/291
110
Anlisis multidimensional
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
111/291
111
Anlisis multidimensional
El objetivo es transformar los juicios de los consumidores (porejemplo, preferencias por tiendas o marcas comerciales) en
distancias representadas en un espacio multidimensional.
Si los objetos A y B son en opinin de los encuestados mssimilares que otros, las tcnicas de anlisis multidimensionallos situarn de manera que la distancia entre ellos en un
espacio multidimensional es menor que la distancia entrecualquier otro par de objetos. El mapa perceptual resultantemuestra el posicionamiento relativo entre los objetos, pero senecesita un anlisis adicional para evaluar qu atributos
predicen la posicin de cada objeto.
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
112/291
112
Anlisis de correspondencias
Tcnicas multivariantes
Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
113/291
113
Anlisis de correspondencias
Es una tcnica de interdependencia que facilita la reduccindimensional de una clasificacin de objetos (por ejemplo,
personas, productos, etc) sobre un conjunto de atributos y elmapa perceptual (o mapa espacial) de objetos relativos aestos atributos. Difiere de otras tcnicas en su capacidad paraacomodar tanto datos no mtricos como relaciones no
lineales.Emplea una tabla de contingencia de dos variablescategricas, transforma los datos no mtricos a un nivelmtrico y realiza una reduccin dimensional y un mapa
perceptual.
Tcnicas multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
114/291
114
Diseo de modelos
multivariantes
Diseo de modelos multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
115/291
115
Primer paso: Definir el problema de investigacin, objetivosy tcnica multivariante conveniente.
Segundo paso: Desarrollo del proyecto de anlisis.
Tercer paso: Evaluacin de los supuestos bsicos de latcnica multivariante.
Cuarto paso: Estimacin del modelo multivariante y
valoracin del ajuste del modelo.Quinto paso: Interpretar el valor terico.
Sexto paso: Validacin del modelo multivariante.
Una aproximacin al Anlisis Multivariante
Diseo de modelos multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
116/291
116
Primer paso: Definir el problema de investigacin, objetivosy tcnica multivariante conveniente.
Ver el problema en trminos conceptuales, definiendo los
conceptos e identificar las relaciones fundamentales ainvestigar.
El modelo conceptual no necesita ser complejo y detallado,es una simple representacin de relaciones a estudiar.
Con los objetivos y el modelo conceptual especificados solohay que elegir la tcnica multivariante apropiada. Lasvariables se pueden especificar antes o despus de recogerlos datos.
Una aproximacin al Anlisis Multivariante
Diseo de modelos multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
117/291
117
Segundo paso: Desarrollo del proyecto de anlisis.
Para cada tcnica se debe desarrollar un plan de anlisisespecfico. Con el modelo conceptual establecido la atencin
se dirige a la puesta en prctica de la tcnica elegida.
Una aproximacin al Anlisis Multivariante
Diseo de modelos multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
118/291
118
Tercer paso: Evaluacin de los supuestos bsicos de latcnica multivariante.
Con la recogida de datos el primer anlisis no es estimar el
modelo multivariante sino evaluar los supuestos bsicos.
Evaluar los supuestos subyacentes, tanto estadsticos comoconceptuales, que afectan sustancialmente a su capacidadpara representar relaciones multivariantes.
Cada tcnica tiene una serie de supuestos, se debeasegurar que estos se cumplen.
Una aproximacin al Anlisis Multivariante
Diseo de modelos multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
119/291
119
Cuarto paso: Estimacin del modelo multivariante yvaloracin del ajuste del modelo.
Una vez satisfechos los modelos, se procede a la estimacin
efectiva del modelo multivariante y a una valoracin globaldel ajuste del modelo.
En ocasiones el modelo se debe volver a especificar paraconseguir mejorar los niveles de ajuste.
Una aproximacin al Anlisis Multivariante
Diseo de modelos multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
120/291
120
Quinto paso: Interpretar el valor terico.
Con un nivel aceptable de ajuste del modelo, al interpretarel valor o valores tericos se revela la naturaleza de las
relaciones multivariantes.
La interpretacin de los efectos para las variablesindividuales se realiza examinando los coeficientes estimados(ponderaciones) para cada variable en el valor terico.
Puede conducir a re-especificaciones adicionales de lasvariables y/o formulacin del modelo.
Una aproximacin al Anlisis Multivariante
Diseo de modelos multivariantes
-
8/13/2019 Analisis Multivariante (Presentacin)
121/291
121
Sexto paso: Validacin del modelo multivariante.
Antes de aceptar los resultados, estos deben ser sometidosa un conjunto final de diagnsticos que aseguran el grado de
generalidad de los resultados por los mtodos de validacindisponibles.
Se trata de demostrar la generalidad de los resultados alconjunto de poblacin.
Sirven para asegurar los resultados ms descriptivos de losdatos.
Una aproximacin al Anlisis Multivariante
-
8/13/2019 Analisis Multivariante (Presentacin)
122/291
122
Anlisis Discriminante de dos
grupos
Anlisis Discriminante de dos grupos
-
8/13/2019 Analisis Multivariante (Presentacin)
123/291
123
Es una tcnica apropiada cuando la variable dependiente escategrica (nominal o no mtrica) y las variablesindependientes son mtricas.
En muchos casos la variable dependiente consta de dosgrupos o clasificaciones. En otras situaciones, se incluyenms de dos casos.
Cuando son dos grupos se habla de anlisis discriminante
de dos grupos. Cuando se identifican tres o ms la tcnicaes conocida como anlisis discriminante mltiple.
Anlisis Discriminante
Anlisis Discriminante de dos grupos
-
8/13/2019 Analisis Multivariante (Presentacin)
124/291
124
Esta tcnica implica obtener un valor terico, es decir, unacombinacin lineal de las variables independientes quediscrimine mejor entre los grupos definidos a priori.
La discriminacin se realiza estableciendo las ponderacionesdel valor terico para cada variable de tal forma quemaximicen la varianza entre grupos frente a la varianzaintragrupos.
La combinacin lineal para el anlisis discriminante sedenomina funcin discriminante.
Anlisis Discriminante
Anlisis Discriminante de dos grupos
-
8/13/2019 Analisis Multivariante (Presentacin)
125/291
125
La funcin discriminanteadopta la siguiente forma:
Zjk= + W1X1K+ W2X2K+ W3X3K+ + WnXnK
donde
Zjk = puntuacin Z discriminante de la funcin discriminante jpara el objeto k
= constante
Wk = ponderacin discriminante para la variableindependiente k
Xik= variable independiente i para el objeto k
Anlisis Discriminante
Anlisis Discriminante de dos grupos
-
8/13/2019 Analisis Multivariante (Presentacin)
126/291
126
Es la tcnica apropiada para contrastar la hiptesis de que lasmedias de los grupos de un conjunto de variablesindependientes para dos o ms grupos son iguales.
Para hacerlo, el anlisis discriminante multiplica cada variableindependiente por su correspondiente ponderacin y sumaestos productos. El resultado es una nica puntuacin Zdiscriminantecompuesta para cada individuo en el anlisis.
Promediando las puntuaciones Z discriminantes para todos losindividuos dentro de un grupo particular se obtiene la mediadel grupo o centroide.
Anlisis Discriminante
Anlisis Discriminante de dos grupos
-
8/13/2019 Analisis Multivariante (Presentacin)
127/291
127
Cuando el anlisis engloba dos grupos hay dos centroides,con tres grupos hay tres centroides y as sucesivamente.
Los centroides indican la situacin ms comn de cualquier
individuo de un determinado grupo. Una comparacin de loscentroides de los grupos muestra lo apartados que seencuentran los grupos a lo largo de la dimensin que se estcontrastando.
El contraste para la significacin estadstica de la funcindiscriminante es una medida generalizada de la distanciaentre los centroides de los grupos. Se calcula comparando lasdistribuciones de las puntuaciones discriminantes de los
grupos
Anlisis Discriminante
Anlisis Discriminante de dos grupos
REPRESENTACION UNIVARIANTE DE LAS PUNTUACIONES Z DISCRIMINANTES
-
8/13/2019 Analisis Multivariante (Presentacin)
128/291
128
Anlisis Discriminante de dos grupos
-
8/13/2019 Analisis Multivariante (Presentacin)
129/291
129
Una empresa quiere averiguar si uno de sus nuevosproductos tendr xito comercial. Est interesada enidentificar, si es posible, a aquellos consumidores que la
compraran y a aquellos que no la compraran.Para ayudar a identificar a los compradores potenciales sedisean escalas de valoracin para tres caractersticas:duracin, funcionamiento y diseo. Que son utilizadas por los
consumidores para evaluar el nuevo producto.No se consideran las medidas separadas sino unacombinacin ponderada de ellas.
Ejemplo
Anlisis Discriminante de dos grupos
-
8/13/2019 Analisis Multivariante (Presentacin)
130/291
130
El anlisis discriminante puede obtener una combinacinponderada de las tres escalas que se utilice para predecir laverosimilitud de que un consumidor compre el producto.
Adems, determinar si los clientes que seguramente comprenel nuevo producto se pueden distinguir de los que no locomprarn.
Tambin saber cul de las tres caractersticas del nuevo
producto separa mejor a los compradores de los nocompradores.
Ejemplo
Anlisis Discriminante de dos grupos
Duracin Funcionamiento DiseoRESULTADOS DE LA ENCUESTA SOBRE EVALUACION DEL NUEVO PRODUCTO
-
8/13/2019 Analisis Multivariante (Presentacin)
131/291
131
(X1) (X2) (X3)
Comprara
Sujeto 1 8 9 6
Sujeto 2 6 7 5
Sujeto 3 10 6 3
Sujeto 4 9 4 4
Sujeto 5 4 8 2Media del grupo 7.4 6.8 4.0
No comprara
Sujeto 6 5 4 7
Sujeto 7 3 7 2
Sujeto 8 4 5 5
Sujeto 9 2 4 3
Sujeto 10 2 2 2
Media del grupo 3.2 4.4 3.8
Escala:1= Muy Baja10 = Excelente
Anlisis Discriminante de dos grupos
9 7 5 6 2 1 4 3
10 8
DURACIN (X1)
-
8/13/2019 Analisis Multivariante (Presentacin)
132/291
132
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
9 7 5 6 2 1 4 3
9
6 7
10 4 8 3 2 5 1
10
7 9 8
5 3 4 2 1 6
FUNCIONAMIENTO (X2)
DISEO (X3)
Anlisis Discriminante de dos grupos
Funcin 1 Funcin 2 Funcin 3CONSTRUCCION DE FUNCIONES DISCRIMINANTES
-
8/13/2019 Analisis Multivariante (Presentacin)
133/291
133
Z= X1 Z = X1+ X2 Z = -4.53 + 0.476 X1 + 0.359 X2
Comprara
Sujeto 1 8 17 2.51
Sujeto 2 6 13 0.84
Sujeto 3 10 16 2.38
Sujeto 4 9 13 1.19
Sujeto 5 4 12 0.25No comprara
Sujeto 6 5 9 -0.71
Sujeto 7 3 10 -0.59
Sujeto 8 4 9 -0.83
Sujeto 9 2 6 -2.14
Sujeto 10 2 4 -2.86
Punto de Corte 5.5 11 0.0
Anlisis Discriminante de dos grupos
MATRICES DE CLASIFICACION DE LAS FUNCIONES DISCRIMINANTES
Funcin 1 Grupo predicho
-
8/13/2019 Analisis Multivariante (Presentacin)
134/291
134
Funcin 1 Grupo predicho
Grupo real 1 2
1: Comprara 4 12: No comprara 0 5
Funcin 2 Grupo predicho
Grupo real 1 21: Comprara 5 0
2: No comprara 0 5
Funcin 3 Grupo predichoGrupo real 1 2
1: Comprara 5 0
2: No comprara 0 5
Anlisis Discriminante de dos grupos
REPRESENTACION GEOMETRICA DE LA FUNCION DISCRIMINANTE DE DOS GRUPOS
-
8/13/2019 Analisis Multivariante (Presentacin)
135/291
135
-
8/13/2019 Analisis Multivariante (Presentacin)
136/291
136
Anlisis Discriminante en el
SPSS
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
137/291
137
Autovalor: Cociente entre la variacin debida a lasdiferencias entre los grupos (medida mediante la suma decuadrados inter-grupos) y la variacin que se da dentro de
cada grupo combinada en una nica cantidad (medidamediante la suma de cuadrados intra-grupos).
Se diferencia de la F del anlisis de varianza multivariante enque no intervienen los grados de libertad.
Su mnimo es 0 y no tiene mximo.El autovalor asociado a la funcin discriminante indica laproporcin de varianza total explicada por las m funcionesdiscriminantes que recoge la variable yi .
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
138/291
138
Correlacin cannica: Correlacin entre la combinacinlineal de las variables independientes (la funcindiscriminante) y una combinacin lineal de variables
indicadoras (unos y ceros) que recogen la pertenencia de lossujetos a los grupos. En el caso de dos grupos la correlacincannica es la correlacin simple entre las puntuacionesdiscriminantes y una variable con cdigos 1 y 0 segn cadacaso pertenezca a un grupo o a otro.
Una correlacin cannica alta indica que las variablesdiscriminantes permiten diferenciar los grupos.
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
139/291
139
Lambda de Wilks: Estadstico que expresa la proporcin devariabilidad total no debida a las diferencias entre los grupos.Es el cociente entre la suma de cuadrados dentro de los
grupos y la suma de cuadrados total (sin distinguir losgrupos), es decir, equivale a las desviaciones de la mediadentro de cada grupo entre las desviaciones a la media totalsin distinguir grupos. Si su valor es pequeo, la variablediscrimina mucho: la variabilidad se debe a las diferencias
entre grupos no a las diferencias dentro de los grupos.
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
140/291
140
Coeficientes estandarizados: Son independientes de lamtrica original de las variables discriminantes y por tantoson preferibles a los coeficientesbrutoscuando las variables
poseen una mtrica distinta.(el SPSS los ofrece por defecto, los coeficientes brutosdeben solicitarse explcitamente)
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
141/291
141
Matriz de estructura: Contiene las correlaciones entre lasvariables discriminantes y la funcin discriminanteestandarizada. Mientras que los coeficientes estandarizados
muestran la contribucin neta de cada variableindependiente a la funcin discriminante, las correlacionesmuestran la relacin brutaentre cada variable y la funcindiscriminante.
Conocer estas relaciones puede ayudar a interpretar mejor lafuncin discriminante.
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
142/291
142
M de Box: Prueba para el contraste de la hiptesis nula deigualdad de las matrices de varianzas-covarianzaspoblacionales. Uno de los supuestos del anlisis discriminante
es que todos los grupos proceden de la misma poblacin y,ms concretamente, que las matrices de varianzas-covarianzas poblacionales correspondientes a cada grupo soniguales entre s.
No tiene una distribucin muestral conocida pero puedetransformarse en un estadstico F e interpretarse como tal.
(muchos analistas lo critican por ser demasiado sensible apequeas variaciones de la normalidad multivariante y a
tamaos muestrales grandes)
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
143/291
143
Coeficientes no tipificados: Coeficientes brutos de lafuncin cannica discriminante. Son los coeficientes utilizadospor el programa para calcular las puntuaciones discriminantes
y la ubicacin de los centroides.No es habitual solicitarlos en el SPSS por dos motivos: elprograma calcula de manera automtica las puntuacionesdiscriminantes y estos coeficientes dependen de la
variabilidad y la mtrica de las variables, lo que dificulta suintrepretacin.
La funcin discriminante incluye una constante correctora queconsigue que las puntuaciones discriminantes tomen valor 0
en algn punto entre los centroides
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
144/291
144
Coeficientes de clasificacin de Fisher: Estoscoeficientes, propuestos por Fisher, sirven nicamente para laclasificacin. Al solicitarlos se obtiene una funcin de
clasificacin para cada grupo.Para aplicar estos coeficientes se calcula cada una de lasfunciones para un sujeto dado y se clasifica al sujeto en elgrupo en el que la funcin ofrece una puntuacin mayor.
Algunos conceptos
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
145/291
145
Hay dos opciones:
Introducir independientes juntas
Inclusin por pasos
En la primera opcin la funcin discriminante se construyeincorporando todas las variables independientes en el anlisis.
Los estadsticos que se obtienen se refieren al ajuste global
de la funcin discriminante.
Sobre el mtodo
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
146/291
146
En la inclusin por pasos las variables independientes vansiendo incluidas paso a paso a la funcin discriminante trasevaluar su contribucin individual a la diferenciacin entre losgrupos.
Puede seleccionarse el estadstico a utilizar para elegir a lasvariables:
- Lambda de Wilks (la que produce el mayor cambio)
- Varianza no explicada (la que minimiza la cantidad devarianza no explicada por las variables)
- Distancia de Mahalanobis (la que maximiza esta distancia)
Sobre el mtodo
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
147/291
147
- Menor razn (la que maximiza la menor razn, que es ladistancia de Mahalanobis ponderada por el tamao de losgrupos)
- V de Rao (la que produce un mayor incremento, la V de Raoes proporcional a la distancia entre los grupos)
En la inclusin por pasos se comienza seleccionando la mejorvariable independiente, es decir, aquella que es la que ms
diferencia a los grupos.Pueden seleccionarse uno de dos criterios de entrada y salidade las variables: usar el valor de F o usar la probabilidad de F.
Sobre el mtodo
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
148/291
148
Hay dos opciones:
Todos los grupos iguales
Calcular segn tamaos de los grupos
La clasificacin se basa en las funciones discriminantes. Peropuede realizarse a partir de matrices de covarianzas distintaspor lo que el resultado puede ser diferente.
Si el punto de corte es equidistante de los dos centroides, enel caso de dos grupos, con tamaos iguales, no habraproblemas pero los grupos pudieran tener distinto tamao.
Sobre la clasificacin
b l f
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
149/291
149
Grupos combinados: Muestra un diagrama de dispersin detodos los casos en el plano definido por las dos primerasfunciones discriminantes. Cuando solo existe una funcindiscriminante este grfico se omite.
Grupos separados: En el caso de dos grupos (una solafuncin discriminante) esta opcin ofrece el histograma decada grupo en la funcin discriminante.
En el caso de ms de dos grupos (ms de una funcindiscriminante) ofrece un diagrama de dispersin de cadagrupo en el plano definido por las dos primeras funcionesdiscriminantes.
Sobre los grficos
S b l f
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
150/291
150
Mapa territorial: En el caso de ms de dos grupos (ms deuna funcin discriminante) muestra la ubicacin de loscentroides en el plano definido por las dos primeras funcionesdiscriminantes, as como las fronteras territoriales utilizadasen la clasificacin.
Sobre los grficos
S l i
Anlisis Discriminante en el SPSS
-
8/13/2019 Analisis Multivariante (Presentacin)
151/291
151
Un problema habitual de los modelos estadsticos es que elmodelo estimado siempre se ajusta lo ms perfectamenteposible a los datos de la muestra utilizada. Esto es uninconveniente pues la estructura de la muestra puede tener
ligeras divergencias con la estructura real de la poblacin. Sepuede hacer una validacin cruzada:
1. Seleccionar una muestra de validacin (subconjuntoaleatorio de la muestra original)
2. Estimar la funcin discriminante con los restantes(muestra de entrenamiento)
3. Utilizar esta funcin para clasificar los casos de la muestra
de validacin
Seleccionar
Anlisis Discriminante de tres grupos
Evaluacin del proveedoractual
Evaluacin del proveedoractual
Grupos basados Competitividad Nivel de Grupos basados Competitividad Nivel de servicio
-
8/13/2019 Analisis Multivariante (Presentacin)
152/291
152
pen la intencin
de cambio
pen el precio
(x1 )servicio(x2 )
pen la intencin
de cambio
pen el precio
(x1 )(x2 )
Grupo 1: secambiarn conseguridad
Sujeto 9 5 2
Sujeto 1 2 2 Sujeto 10 5 3
Sujeto 2 1 2 Media del grupo 4.6 2.2
Sujeto 3 3 2 Grupo 3: No secambiarn conseguridad
Sujeto 4 2 1 Sujeto 11 2 6
Sujeto 5 2 3 Sujeto 12 3 6
Media del grupo 2.0 2.0 Sujeto 13 4 6
Grupo 2:Indecisos
Sujeto 14 5 6
Sujeto 6 4 2 Sujeto 15 5 7
Sujeto 7 4 3 Media del grupo 3.8 6.2
Sujeto 8 5 1
-
8/13/2019 Analisis Multivariante (Presentacin)
153/291
153
Regresin Logstica
A li i di i i t R i l ti
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
154/291
154
El anlisis discriminante es apropiado cuando la variabledependiente es no mtrica. Sin embargo, cuando la variabletiene solo dos grupos puede preferirse la regresinlogstica por varios motivos:
El anlisis discriminante descansa sobre un cumplimientoestricto de los supuestos de normalidad multivariante y laigualdad de matrices de varianzas covarianzas entre losgrupos, lo cual no siempre se verifican.
La regresin logstica no se enfrenta a estos supuestos tanestrictos y es mucho ms robusta cuando estos supuestos nose cumplen, haciendo su aplicacin muy apropiada en muchassituaciones.
Anlisis discriminante vs. Regresin logstica
A li i di i i t R i l ti
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
155/291
155
Aunque se cumplieran los supuestos muchos investigadoresprefieren la regresin logstica porque es similar a laregresin.
La regresin logstica es equivalente al anlisis
discriminante de dos grupos.
Anlisis discriminante vs. Regresin logstica
Reg esin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
156/291
156
En el anlisis discriminante el carcter no mtrico de unavariable dependiente dicotmica se adecua haciendopredicciones de pertenencia al grupo basadas en suspuntuaciones Z discriminantes y estableciendo puntuacionesde corte.
La regresin logstica lo hace parecido a la regresin. Sinembargo, se diferencia en que predice directamente laprobabilidad de ocurrencia de un suceso.
Regresin logstica
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
157/291
157
Aunque el valor de la probabilidad es una medida mtrica,existen diferencias entre la regresin mltiple y la regresinlogstica. Los valores de la probabilidad pueden sercualesquiera entre cero y uno, pero el valor predicho debeestar acotado para que caiga en el rango entre cero y uno.
Para definir una relacin acotada por cero y uno laregresin logstica utiliza una relacin supuesta entre lasvariables dependientes e independientes: para niveles muybajos de la variable independiente la probabilidad seaproxima a cero, segn crece la variable independiente, laprobabilidad crece a lo largo de la curva, pero se acerca a unosin llegar a excederlo.
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
158/291
158
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
159/291
159
Al igual que en la regresin mltiple, la regresin logsticaincluye un nico valor terico resumen de los coeficientesestimados para cada variable independiente, pero lo hace deuna manera totalmente diferente. La regresin mltipleemplea el mtodo de los mnimos cuadrados pero la regresinlogstica emplea el procedimiento de mximaverosimilitud.
El modelo tiene la forma concreta de una curva logstica.Para estimar un modelo de regresin logstica, se ajusta estacurva a los datos reales.
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
160/291
160
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
161/291
161
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
162/291
162
Una de las ventajas de la regresin logstica es que solo senecesita saber si un suceso ocurri o no (comprar o no,riesgo de crdito o no, quiebra de la empresa o xito) paraentonces utilizar un valor dicotmico como nuestra variabledependiente.
A partir de esta valor dicotmico, el procedimiento predicesu estimacin de la probabilidad de que el suceso tenga o nolugar. Si la prediccin de la probabilidad es mayor que 0.5entonces la prediccin es s y no en el otro caso.
La regresin logstica deriva su nombre de latransformacin logstica utilizada con la variableindependiente.
Regresin logstica
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
163/291
163
Cuando se utiliza esta transformacin la regresin logsticay sus coeficientes tienen un sentido diferente del queencontramos en la regresin con una variable dependientemtrica.
El procedimiento que calcula el coeficiente logsticocompara la probabilidad de la ocurrencia de un suceso con laprobabilidad de que no ocurra. Este odds ratio puedeexpresarse como:
Prob (evento) Bo + B1 x1 + + Bn xn
= eProb (no evento)
Regresin logstica
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
164/291
164
Los coeficientes estimados (Bo , B1 , , Bn ) son en realidadmedidas de los cambios en el ratio de probabilidades,denominado odds ratio. Estn expresados en logaritmos, porlo que necesitaramos retransformarlos (tomando los valoresdel antilogaritmo) de tal forma que se evale ms fcilmentesu efecto sobre la probabilidad. Los programas paracomputadoras lo hacen automticamente calculando tanto elcoeficiente real como el transformado. Esto no cambia el
modo de interpretar el signo del coeficiente: un coeficientepositivo aumenta la probabilidad, mientras que uno negativodisminuye la probabilidad predicha.
Regresin logstica
Regresin logstica
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
165/291
165
Veamos un ejemplo sencillo. Si Bi es positivo, sutransformacin (antilog) ser mayor que 1 y el odds ratioaumentar. Este aumento se produce cuando la probabilidadprevista de ocurrencia de un suceso aumenta y laprobabilidad prevista de su no ocurrencia disminuye. Portanto el modelo tiene una elevada probabilidad de ocurrencia.
Anlogamente, si Bi es negativo, el antilogaritmo es menorque 1 y el odds ratio disminuye. Un coeficiente cero equivalea un valor de 1, lo que no produce cambios en el odds.
Regresin logstica
-
8/13/2019 Analisis Multivariante (Presentacin)
166/291
166
Anlisis Multivariante de la
Varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
167/291
167
Es una extensin del anlisis de la varianza (ANOVA) endonde se tiene en cuenta ms de una variable de criterio.
Anlisis multivariante de la varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
168/291
168
Es una extensin del anlisis de la varianza (ANOVA) endonde se tiene en cuenta ms de una variable de criterio.
Es una tcnica de dependencia que mide las diferencias
entre dos o ms variables mtricas dependientes basadas enun conjunto de variables categricas (no mtricas) queactan como predictores.
Anlisis multivariante de la varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
169/291
169
Es una extensin del anlisis de la varianza (ANOVA) endonde se tiene en cuenta ms de una variable de criterio.
Es una tcnica de dependencia que mide las diferencias
entre dos o ms variables mtricas dependientes basadas enun conjunto de variables categricas (no mtricas) queactan como predictores.
Al igual que el ANOVA, el MANOVA se refiere a diferencias
entre grupos (o tratamientos). Sin embargo, el ANOVA sedenomina como proceso univariante porque para valorar lasdiferencias entre grupos se emplea una nica variabledependiente mtrica.
Anlisis multivariante de la varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
170/291
170
El MANOVA es un proceso multivariante porque se usa paravalorar diferencias entre grupos a travs de mltiplesvariables dependientes mtricas de forma simultnea.
Anlisis multivariante de la varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
171/291
171
El MANOVA es un proceso multivariante porque se usa paravalorar diferencias entre grupos a travs de mltiplesvariables dependientes mtricas de forma simultnea.
En el MANOVA cada grupo de tratamiento es definido poruna o ms variables dependientes.
Anlisis multivariante de la varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
172/291
172
El MANOVA es un proceso multivariante porque se usa paravalorar diferencias entre grupos a travs de mltiplesvariables dependientes mtricas de forma simultnea.
En el MANOVA cada grupo de tratamiento es definido poruna o ms variables dependientes.
Ambas tcnicas proporcionan las herramientas necesariaspara juzgar la fiabilidad de cualquier efecto observado (por
ejemplo, si una diferencia observada es debida a un efectodel tratamiento o a la variabilidad del muestreo).
Anlisis multivariante de la varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
173/291
173
El MANOVA es la extensin multivariantede las tcnicas univariantes para valorarlas diferencias entre las medias de losgrupos.
Anlisis multivariante de la varianza (MANOVA)
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
174/291
174
Se clasifican como procedimientos univariantesno por elnmero de variables independientes sino por el nmero devariables dependientes.
En la regresin mltiple, los trminos univariante ymultivariante se refieren al nmero de variablesindependientes.
En el ANOVA y el MANOVA se aplica esta terminologa sluso de variables simples o mltiples.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
175/291
175
El contraste t
Valora la significacin estadstica de las diferencias entre dos
medias muestreadas independientes.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
176/291
176
El contraste t
Valora la significacin estadstica de las diferencias entre dosmedias muestreadas independientes.
Ejemplo: Se consideran dos grupos de encuestados paradiferentes anuncios publicitarios que reflejan diferentesmensajes, uno informativo y otro emocional. Se pide a cadagrupo valorar sobre la pretensin del mensaje en una escala
de 1(pobre) a 10 (excelente). Los dos mensajes representanun factorcon dos niveleso tratamientos(informativo vs.emocional)
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
177/291
177
El contraste t
Un factor es una variable independiente no mtrica,manipulada u observada experimentalmente, que puede ser
representada en varias categoras o niveles. En el ejemplo, eltratamiento es el efecto de la pretensin emocional frente a lainformativa.
Se utiliza el estadstico:
media 1 - media 2Estadstico t =
error estndar de la dif. de medias
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
178/291
178
El contraste t
Si el valor de t es suficientemente grande, entoncespodemos decir, estadsticamente hablando, que la diferencia
no se debe a la variabilidad del muestreo, sino que representauna diferencia real.
Esto se hace comparando el valor del estadstico t con elvalor crtico del estadstico.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
179/291
179
El ANOVA
Si estuviramos interesados en evaluar tres mensajespublicitarios en vez de dos, podramos estar tentados a
realizar contrastes t por separado.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
180/291
180
El ANOVA
Si estuviramos interesados en evaluar tres mensajespublicitarios en vez de dos, podramos estar tentados a
realizar contrastes t por separado. Pero, los contrastes t mltiples aumentan el error de Tipo I.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
181/291
181
El ANOVA
Si estuviramos interesados en evaluar tres mensajespublicitarios en vez de dos, podramos estar tentados a
realizar contrastes t por separado. Pero, los contrastes t mltiples aumentan el error de Tipo I.
Se debe utilizar el ANOVA.
ANOVA es empleado para determinar la probabilidad de quelas diferencias en las medias entre varios grupos sean debidasal error muestral.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
182/291
182
El ANOVA
Se comparan dos clculos independientes de la varianza parala variable:
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
183/291
183
El ANOVA
Se comparan dos clculos independientes de la varianza parala variable:
Varianza dentrode los grupos (cuadrado medio del error),basado en desviaciones individuales respecto a las medias delos grupos respectivos, no incluye diferencias entre las medias.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
184/291
184
El ANOVA
Se comparan dos clculos independientes de la varianza parala variable:
Varianza dentrode los grupos (cuadrado medio del error),basado en desviaciones individuales respecto a las medias delos grupos respectivos, no incluye diferencias entre las medias.
Varianza entre los grupos (cuadrado medio de lostratamientos), basado en las desviaciones de las medias de losgrupos respecto a la media global de todas las puntuaciones.
diferencias de grupos
Procedimientos univariantes para valorar lasdiferencias de grupos
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
185/291
185
El ANOVA
CMTr
Estadstico F =CME
diferencias de grupos
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
186/291
186
En el contraste t y en el ANOVA la hiptesis nula contrastadaes la igualdad de las medias de las variablesdependientes.
Anlisis multivariante de la varianza (MANOVA)
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
187/291
187
En el contraste t y en el ANOVA la hiptesis nula contrastadaes la igualdad de las medias de las variablesdependientes.
En el MANOVA, la hiptesis nula contrastada es la igualdadde vectores de medias de variables dependientesmltiples entre los grupos.
s s u t a a te de a a a a ( O )
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
188/291
188
ANOVAH0: 1= 2= = k
Las medias de todos los grupos son iguales.
( )
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
189/291
189
ANOVAH0: 1= 2= = k
Las medias de todos los grupos son iguales.
MANOVA
11 12 1k21 22 2k
H0: = = =p1 p2 pk
Los vectores de las medias de todos los grupos son iguales.
( )
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
190/291
190
El caso de dos grupos: T de Hotelling
( )
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
191/291
191
El caso de dos grupos: T de Hotelling
En el ejemplo, se quiere conocer la intencin de compragenerada por los dos mensajes.
( )
2
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
192/291
192
El caso de dos grupos: T de Hotelling
En el ejemplo, se quiere conocer la intencin de compragenerada por los dos mensajes.
Si empleamos anlisis univariante se haran contrastes tseparados tanto para la pretensin de los mensajes comopara la intencin de compra generada por los mensajes.
( )
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
193/291
193
El caso de dos grupos: T de Hotelling
En el ejemplo, se quiere conocer la intencin de compragenerada por los dos mensajes.
Si empleamos anlisis univariante se haran contrastes tseparados tanto para la pretensin de los mensajes comopara la intencin de compra generada por los mensajes.
Pero las medidas no estn relacionadas.
( )
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
194/291
194
El caso de dos grupos: T de Hotelling
En el ejemplo, se quiere conocer la intencin de compragenerada por los dos mensajes.
Si empleamos anlisis univariante se haran contrastes tseparados tanto para la pretensin de los mensajes comopara la intencin de compra generada por los mensajes.
Pero las medidas no estn relacionadas.
Podemos usar la T de Hotelling, una forma especializadadel MANOVA que es una extensin directa del contraste tunivariante.
( )
2
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
195/291
195
El caso de dos grupos: T de Hotelling
Proporciona un contraste estadstico del valor tericoformado por las variables dependientes que produce la
mayor diferencia entre los grupos.
Este contraste controla el aumento de la tasa del error deTipo I proporcionando un nico contraste general paracontrastar las diferencias de los grupos entre todas las
variables dependientes para un nivel de significacin alfadado.
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
196/291
196
El caso de dos grupos: T de Hotelling
Se considera la ecuacin de un valor terico de las variablesdependientes:
C = W1Y1+ W2Y2+ + WnYn
donde
C = puntuacin del valor terico o de la combinacin para
un encuestado.Wi= ponderacin para la variable dependiente i.
Yi= variable dependiente i.
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
197/291
197
El caso de dos grupos: T de Hotelling
Para cualquier conjunto de ponderaciones podrancalcularse puntuaciones para cada encuestado.
La T de Hotelling encuentra un conjunto de ponderacionesque generan el valor mximo del estadstico t para esteconjunto de datos.
El estadstico t mximo que se obtiene es elevado alcuadrado.
T sigue una distribucin F con p y N1+N2-2-1 grados delibertad, bajo la hiptesis nula de que no existen efectos deltratamiento
2
2
2
Anlisis multivariante de la varianza (MANOVA)
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
198/291
198
El caso de k grupos: MANOVA
Es una extensin del procedimiento de la T de Hotelling.
Se idean ponderaciones de las variables dependientes paraelaborar una puntuacin del valor terico para cadaencuestado.
Se encuentra el conjunto de ponderaciones que maximizanel valor de la F del ANOVA calculado sobre las puntuacionesde los valores tericos para todos los grupos.
2
Cundo utilizar el MANOVA?
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
199/291
199
-
8/13/2019 Analisis Multivariante (Presentacin)
200/291
Cundo utilizar el MANOVA?
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
201/291
201
Consideraremos su empleo desde las perspectivas deeficiencia y control de la precisin estadstica mientras nosproporcione la manera apropiada para contrastar cuestiones
multivariantes: Control del porcentaje de errores experimentales.
Diferencias entre una combinacin de variablesdependientes.
Cundo utilizar el MANOVA?
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
202/291
202
Control del porcentaje de errores experimentales
El uso de ANOVAs univariantes separados puede crear un problemacuando se intenta controlar la tasa de errores experimentales.
Por ejemplo, se analiza una serie de cinco variables dependientesutilizando ANOVASs separados, cada uno usa 0.05 como significacin. Sino hay diferencias reales esperamos que no se observe ningn efecto dealguna variable dependiente el 5% de las veces.
Pero en cinco contrastes separados, la probabilidad de error de Tipo I se
situara entre 0.05 (si todas las variables dependientes estnperfectamente correlacionadas) y 1-0.95 (si todas las variables no estncorrelacionadas). Por ello los contrastes separados no permiten tenercontrol del error de Tipo I.
5
Cundo utilizar el MANOVA?
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
203/291
203
Diferencias entre una combinacin de variablesdependientes
Una serie de contrastes univariantes ANOVA tampoco tiene en cuenta la
posibilidad de que alguna combinacin lineal de las variablesdependientes puede proporcionar evidencia de la existencia de algunadiferencia global entre los grupos, que puede no detectarse si seexamina cada variable dependiente separadamente.
Los contrastes individuales ignoran las correlaciones entre las variables
dpendientes y por ello no emplean toda la informacin disponible paravalorar las diferencias entre grupos.
El MANOVA puede detectar diferencias combinadas que no se encuentrancon anlisis univariantes.
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
204/291
204
MANOVA
-
8/13/2019 Analisis Multivariante (Presentacin)
205/291
205
Valor de Fcrtico: F, p, N1+ N221
p (N1+ N22)Valor de T crtico: x Fcritico
N1+ N2p1
Si T es mayor que Tcritico rechazamos H0
2
22
-
8/13/2019 Analisis Multivariante (Presentacin)
206/291
206
Correlacin Cannica
Qu es la correlacin cannica?
Correlacin Cannica