Download - ANÁLISIS MULTIVARIADO INTRODUCCIÓN
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
1/47
Prof. Grabiela Montes Q.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
2/47
DEFINICIN:El anlisis multivariante es el conjunto detcnicas estadsticas que analizansimultneamente ms de dos variables enuna muestra de observaciones.
Su razn de ser radica en un mejorentendimiento del fenmeno objeto deestudio obteniendo informacin que los
mtodos estadsticos univariantes ybivariantes son incapaces de conseguir.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
3/47
Los mtodos de anlisis multivariable se
aplican a la investigacin comercial con lafinalidad de resumir y sintetizar, amplios
conjuntos de datos, para obtener las
informaciones ms vlidas y podercomprender mejor el problema que se est
estudiando.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
4/47
APLICACIONES AL MARKETING
Permite analizar gran nmero de encuestas,lo que suministra a las empresas granvolumen de informacin sobre los
mercados actuales y futuros.Hace posible comprender una gran cantidadde datos con una mnima prdida de la
informacin, proporcionando algunas vecesimgenes grficas.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
5/47
Permite analizar simultneamente toda la
informacin sobre el fenmeno,considerando todos los factores queintervienen en l.
Permite utilizar tanto variables continuascomo discretas, nominales u ordinales en elanlisis.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
6/47
Se pueden clasificar en dos grandes grupos:Mtodos de dependencia y deinterdependencia.Mtodos de dependencia:Suponen que las variables analizadas estndivididas en dos grupos: las variablesdependientes y las variables independientes.
El objetivo de los mtodos de dependenciaconsiste en determinar si el conjunto devariables independientes afecta al conjuntode variables dependientes y de qu forma.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
7/47
Mtodos de interdependencia:
Estos mtodos no distinguen entre variablesdependientes e independientes y su objetivoconsiste en identificar qu variables estn
relacionadas, cmo lo estn y por qu.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
8/47
Se pueden clasificar en dos grandessubgrupos segn que la variable (s)dependiente (s) sea (n) cuantitativas o
cualitativas.Si la variable dependiente es cuantitativa,algunas de las tcnicas que se puedenaplicar son las siguientes:
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
9/47
1. Anlisis de Regresin Es la tcnica adecuada si en el anlisis hayuna o varias variables dependientesmtricas cuyo valor depende de una o variasvariables independientes mtricas. Por
ejemplo, intentar predecir el gasto anual encine de una persona a partir de su nivel deingresos, nivel de estudios , sexo y edad.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
10/47
2. Anlisis de Supervivencia
Es similar al anlisis de regresin pero con ladiferencia de que la variable independiente esel tiempo de supervivencia de un individuo objeto. Por ejemplo, intentar predecir eltiempo de permanencia en el desempleo deun individuo a partir de su nivel de estudios yde su edad.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
11/47
3. Anlisis de la varianzaSe utilizan en situaciones en las que la
muestra total est dividida en varios gruposbasados en una o varias variablesindependientes no mtricas y las variablesdependientes analizadas son mtricas. Suobjetivo es averiguar si hay diferenciassignificativas entre dichos grupos en cuanto alas variables dependientes se refiere. Porejemplo, hay diferencias en el nivel decolesterol por sexos? afecta, tambin, el tipode ocupacin?
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
12/47
4. Correlacin Cannica Su objetivo es relacionar simultneamentevarias variables mtricas dependientes eindependientes calculando combinacioneslineales de cada conjunto de variables quemaximicen la correlacin existente entre losdos conjuntos de variables. Por ejemplo,analizar cmo estn relacionadas el tiempodedicado al trabajo y al ocio de una personacon su nivel de ingresos, su edad y su nivelde educacin.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
13/47
Si la variable dependiente es cualitativa, lastcnicas que se pueden aplicar son lassiguientes:
1. Modelos de regresin logstica
Son modelos de regresin en los que lavariable dependiente es no mtrica. Seutilizan como una alternativa al anlisisdiscriminante cuando no hay normalidad.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
14/47
2. Anlisis Discriminante Esta tcnica proporciona reglas de
clasificacin ptimas de nuevasobservaciones de las que se desconoce sugrupo de procedencia basndose en lainformacin proporcionada los valores que
en ella toman las variables independientes.Por ejemplo, determinar los ratiosfinancieros que mejor permiten discriminarentre empresas rentables y poco rentables.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
15/47
3. Anlisis Conjunto Conjoint Analysis) Es una tcnica que analiza el efecto de
variables independientes no mtricas sobrevariables mtricas o no mtricas. Ladiferencia de Conjoint con el Anlisis de laVarianza radica en que las variables
dependientes pueden ser no mtricas y losvalores de las variables independientes nomtricas son fijadas por el analista.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
16/47
Una aplicacin de la tcnica Conjoint es lasiguiente. Por ejemplo, una empresa quiere
disear un nuevo producto y, para ello,necesita especificar la forma del envase, suprecio , el contenido por envase y sucomposicin qumica. Presenta diversas
composiciones de estos cuatro factores. 100clientes proporcionan un ranking de lascombinaciones que se le presentan. Se quieredeterminar los valores ptimos de estos 4factores.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
17/47
Se pueden clasificar en dos grandes grupossegn que el tipo de datos que analicen seanmtricos o no mtricos.
Si los datos son mtricos, se pueden utilizar,entre otras, las siguientes tcnicas:
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
18/47
1. Anlisis Factorial AF) y Anlisis deComponentes Principales ACP) Se utiliza para analizar interrelaciones entreun nmero elevado de variables mtricasexplicando dichas interrelaciones en trminos
de un nmero menor de variablesdenominadas factores (si son inobservables)o componentes principales (si son
observables).
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
19/47
As, por ejemplo, si un analista financiero
quiere determinar cul es el estado de salud
financiero de una empresa a partir del
conocimiento de un nmero de ratios
financieros, construyendo varios ndicesnumricos que definan su situacin, el
problema se resolvera mediante un ACP.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
20/47
Si un psiclogo quiere determinar los factoresque caracterizan la inteligencia de unindividuo a partir de sus respuestas a un testde inteligencia, utilizara para resolver esteproblema un AF.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
21/47
2. Escalas Multidimensionales Su objetivo es transformar juicios de
semejanza o preferencia en distanciasrepresentadas en un espaciomultidimensional. Como consecuencia, seconstruye un mapa en el que se dibujan las
posiciones de los objetos comparados deforma que aquellos percibidos como similaresestn cercanos unos de otros y alejados deobjetos percibidos como distintos.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
22/47
Por ejemplo, analizar, en el mercado derefrescos, las percepciones que un grupo deconsumidores tiene acerca de una lista derefrescos y marcas con el fin de estudiar qufactores subjetivos utiliza un consumidor a lahora de clasificar dichos productos.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
23/47
3. Anlisis Cluster Su objetivo es clasificar una muestra de
entidades (individuos o variables) en un
nmero pequeo de grupos de forma que las
observaciones pertenecientes a un gruposean muy similares entre s y muy disimilares
del resto.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
24/47
A diferencia del Anlisis Discriminante, en elAnlisis Cluster se desconoce el nmero y lacomposicin de dichos grupos. Por ejemplo,clasificar grupos de alimentos (pescados,carnes, vegetales y leche) en funcin de susvalores nutritivos.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
25/47
Si los datos fuesen no mtricos, se podranutilizar, adems, las siguientes tcnicas:
1. Anlisis de Correspondencias Se aplica a tablas de contingencia ypersigue un objetivo similar al de lasescalas multidimensionales perorepresentando simultneamente las filas ycolumnas de las tablas de contingencia.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
26/47
2. Modelos log-lineales Se aplican a tablas de contingenciamultidimensionales y modelizan relaciones dedependencia multidimensional de lasvariables observadas que buscan explicar lasfrecuencias observadas.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
27/47
Las etapas de un anlisis multivariantepueden sintetizarse en las seis siguientes:
1. Objetivos del anlisis Se define el problema especificandolos objetivos y las tcnicas multivariantesque se van a utilizar. El investigador debeestablecer el problema en trminos
conceptuales, definiendo los conceptos ylas relaciones fundamentales que se van ainvestigar.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
28/47
Se deben establecer si dichas relaciones vana ser relaciones de dependencia o de
interdependencia. Con todo esto sedeterminan las variables a observar.
2. Diseo del anlisis
Se determina el tamao muestral, lasecuaciones a estimar (si procede), lasdistancias a calcular (si procede) y lastcnicas de estimacin a emplear. Una vezdeterminado todo esto, se proceden aobservar los datos.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
29/47
3. Hiptesis del anlisis
Se evalan las hiptesis subyacentes a latcnica multivariante. Dichas hiptesispueden ser de normalidad, linealidad,independencia, homocedasticidad, etc.Tambin se debe decidir qu hacer con losdatos missing.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
30/47
4. Realizacin del anlisis Se estima el modelo y se evala el ajuste a losdatos. En este paso pueden aparecerobservaciones atpicas (outliers) o influyentescuya influencia sobre las estimaciones y labondad de ajuste se debe analizar.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
31/47
5. Interpretacin de los resultados
Dichas interpretaciones pueden llevar areespecificaciones adicionales de las variables
o del modelo con lo cual se puede volver de
nuevo a los pasos 3 y 4.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
32/47
Matriz de Datos. Se observan p variablesnumricas en un conjunto de n elementos.
npn2n1
2p2221
1p1211
xxx
xxxxxx
X
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
33/47
Vector de Medias: Es una medida decentralizacin de los datos.
n
xx,
x
x
X
n
1iij
j
p
1
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
34/47
Matriz de Varianzas y Covarianzas (S): Esuna matriz cuadrada y simtrica que
contiene en la diagonal las varianzas yfuera de la diagonal las covarianzas entrelas variables.
2 j j j
n
1ik ik jij
jk
2 p p1
1p21
ssy,n
xxxxs
donde
ss
ss
S
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
35/47
Matriz de Correlaciones (R): Cada elementode esta matriz se obtiene de la siguientemanera:
Donde s i es la desviacin estndar de lavariable X i.
ji
ijij ss
sr
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
36/47
Marcas
Caractersticas
Elegancia Comodidad Deportivo
ABCDEF
234589
325597
644467
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
37/47
Para los datos anteriores tenemos que elvector de medias est dado por:
5.167
5.167
5.167
X
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
38/47
Y la matriz de Varianzas y Covarianzas estdada por:
1.47234723.18056.1
4723.15.47235.3056
8056.15.30566.4722
S
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
39/47
Y la matriz de Correlaciones est dada por:
1519.0585.0
519.010.892
585.00.8921
R
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
40/47
Este anlisis tiene como objetivo representarla informacin contenida en una matriz dedatos de n observaciones y p variables, con
un nmero menor de variables construidascomo combinaciones lineales de lasoriginales.
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
41/47
El espacio de dimensin r que mejorrepresenta a los puntos viene definido porlos vectores propios asociados a los rmayores valores propios de S.Se calculan los valores propios o races
caractersticas, 1 , , p , de la matriz devarianzas y covarianzas de las variables, S,mediante:
0IS
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
42/47
Y los vectores propios asociados son los a itales que:
Los trminos
i son nmeros reales.Llamando Z a la matriz cuyas columnas sonlos vectores de los p componentes en los nindividuos, estas nuevas variables estn
relacionadas con las originales mediante:Z = XA
donde A A=I.
0aI S ii
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
43/47
Observacin:
Si las variables que se quieren estudiar estnen diferentes unidades, se debe reemplazaren el anlisis, la matriz de Varianzas-
Covarianzas (S) por la matriz de Correlaciones(R).
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
44/47
0 3 1.59 -0.54
00
0 0
00
10.520.58
0.5210.89
0.580.891
0I-R ecuacinladeraceslasson propiosvaloresLos
152.058.0
52.010.8958.00.891
R
32
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
45/47
Las races de este polinomio son:
1 = 2.3447,
2 = 0.5508,
3 = 0.1045La varianza total es ( 1+ 2+ 3) = 3.
El vector propio asociado a 1 nos da los
pesos de la primera componente principal.Para calcularlo se resuelve el sistema
Ra1= 1 a 1
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
46/47
5054.0a ,603.0a ,622.0a
:tantolo poruno,normatenga
vector elqueimponiendoobtienesesolucinLa
00
0
a34.10.52a.58a00.52aa34.10.89a
0.58a0.89aa34.1
aa
a
3447.2aa
a
152.058.052.010.89
58.00.891
131211
131211
131211
131211
13
12
11
13
12
11
-
7/22/2019 ANLISIS MULTIVARIADO INTRODUCCIN
47/47
5054.0
603.0
622.0
a1
Y el primer componente es:
Z1 = 0.622X 1 + 0.603X 2 + 0.5054X 3
Repitiendo el proceso con los otros dos autovalorestenemos los otros dos componentes:
Z2 = -0.29X 1 0.419X 2 + 0.861X 3Z3 = 0.73X 1 0.678X 2 0.084X 3