análisis de encuestas - uco.es · pdf filedfiiió introducción...

32
ANÁLISIS DE ENCUESTAS

Upload: duongthuy

Post on 06-Feb-2018

217 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

ANÁLISIS DE ENCUESTAS

Page 2: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

ÉTÉCNICAS MULTIVARIANTES

1. Introducción

2 Clasificación de las técnicas2. Clasificación de las técnicas

3. Etapas de análisis

4. Supuestos básicos

5. Valores perdidos y anómalosp y

Page 3: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

D fi i ió

introducción

Definición.

- Conjunto de métodos estadísticos cuya finalidad es analizari ltá t j t d d t lti i t hsimultáneamente conjuntos de datos multivariantes: hay

varias variables medidas para cada caso.

Permiten un mejor entendimiento del fenómeno objeto de- Permiten un mejor entendimiento del fenómeno objeto deestudio, obteniendo información que los métodos univariantesy bivariantes son incapaces de conseguir.y p g

ObjetivosObjetivos.

- Proporcionar métodos para estudiar datos multivariantesque el análisis estadístico uni y bidimensional es incapaz deque el análisis estadístico uni y bidimensional es incapaz deconseguir.

- Ayudar al investigador a tomar decisiones óptimas en el- Ayudar al investigador a tomar decisiones óptimas en elcontexto en el que se encuentre teniendo en cuenta lainformación disponible por el conjunto de datos analizado.

Page 4: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

3

clasificación

3 grupos:

- Métodos de dependencia

- Métodos de interdependencia

- Métodos estructurales

Métodos de dependencia:

- Suponen que las variables analizadas están divididas en dosgrupos: las variables dependientes y las variablesindependientesindependientes.

- El objetivo consiste en determinar si el conjunto de variablesindependientes afecta al conjunto de variablesindependientes afecta al conjunto de variablesdependientes y de qué forma.

Page 5: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Mét d d i t d d i

clasificación

Métodos de interdependencia:

- No distinguen entre variables dependientes e independientesbj ti i t id tifi é i bl táy su objetivo consiste en identificar qué variables están

relacionadas, cómo lo están y por qué.

Métodos estructurales:

- Suponen que las variables están divididas en dos grupos: elde las variables dependientes y el de las independientes.

- El objetivo es analizar como las variables independientesafectan a las variables dependientes y las relaciones delas variables de los dos grupos entre sílas variables de los dos grupos entre sí.

Page 6: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Regresión

Supervivencia

clasificación

Métrica MANOVA

Correlación canónica

Métrica

Dependencia

Discriminante

Regresión logística

C j i t

No métrica

Conjoint

Componentes principalesCo po e tes p c pa es

Factorial

ClusterMétrica

Escalas multidimensionales

C d i

Interdependencia

Correspondencias

Modelos log-lineales

ClusterNo métrica

Escalas multidimensionalesModelos estructurales

Page 7: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

L i ti ió d bl d d d i

clasificación

¿La investigación responde a un problema de dependencia entre variables o de interdependencia de las mismas?

¿Cómo están medidas las variables: métricas o no métricas?

Si es un problema de dependencias, p p ,

¿cuántas variables dependientes existen?

Page 8: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Análisis de dependenciasclasificación

variasrelaciones

unarelación

1 variable dependiente

> 1 variabledependiente

dependenciamétrica

dependenciano métrica

dependenciamétrica

dependenciano métricamétrica no métrica métrica no métrica

independencia independenciaindependenciano métrica

independenciamétrica

ecuacionesestructurales

regresiónmúltiple

análisisdiscriminante

Regresiónlogística MANOVA correlación

canónicaestructurales múltiple discriminante logística canónica

Page 9: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

R ió li l últi l

clasificación

Regresión lineal múltiple:

- Relación entre 1 variable dependiente métrica y variasi bl i d di t ét i ét ivariables independientes métricas o no métricas.

Y1 (X1, X2, X3, .... Xm)

- Por ejemplo: Determinar si existe o no relación entre elresultado neto y la superficie, dimensión e inversióninicial.

¿Y si el resultado neto está codificado en Pérdidas = 0, y Ganancias = 2?

Page 10: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

A áli i di i i t P i l d l ifi ió

clasificación

- Análisis discriminante. Proporciona reglas de clasificaciónóptimas de nuevas observaciones de las que se desconocesu grupo de procedencia basándose en la informacióng p pproporcionada los valores que en ella toman las variablesindependientes.

- Modelos de regresión logística. Se utilizan como unaalternativa al análisis discriminante cuando no haynormalidad.

Page 11: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Análisis de correlación canónica:Y1 (X1, X2, X3, .... Xm) regresión, discriminante y logistica

clasificación

(Y1, Y2, Y3, .... Ym) (X1, X2, X3, .... Xm) correlación canónica( 1, 2, 3, m) ( 1, 2, 3, m)

- Asociación lineal entre un conjunto de variables dependientes y otroAsociación lineal entre un conjunto de variables dependientes y otrode variables independientes.

- Si la dependencia es no métrica

- Si la dependencia es métrica sólo si la independenciatambién lo es

- Por ejemplo:

- Determinar si existe o no relación entre el resultado neto y laproducción de contaminantes de una explotación con lasuperficie, dimensión e inversión inicial. Corr. canónicap ,

- Determinar la misma relación pero con el género del ganaderoy el tipo de explotación (intensivo, extensivo) MANOVA

Page 12: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

clasificación

E i t t lEcuaciones estructurales:

- Varias relaciones: estructuras de la covarianza y análisisfactorial confirmatoriofactorial confirmatorio

Y1 (X11, X12, X13, .... X1m)

Y2 (X21, X22, X23, .... X2m)

Y3 (X31, X32, X33, .... X3m)

Page 13: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

A áli i d i t d d i

clasificación

Análisis de interdependencia.

- Las variables no se pueden separar en dependientes ei d di tindependientes.

- Objetivo: determinar cómo y por qué las variables estáncorrelacionadas.

Page 14: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Análisis de interdependenciasclasificación

Relaciónentre

variables

Relaciónentrecasos

Relaciónentre

objetosj

Métricas No métricas

componentesprincipales

análisisfactorial

análisiscorrespondencias

análisiscluster

escalamientomultidimensional

Page 15: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

A áli i d t i i l

clasificación

Análisis de componentes principales.

- Técnica de reducción de datos.

- Objetivo: construir combinaciones lineales de las variablesiniciales que expliquen la mayor parte de la informacióncontenida en esas variablescontenida en esas variables.

- Esas combinaciones se denominan ComponentesPrincipales están incorrelacionados y cada componentePrincipales, están incorrelacionados y cada componentesucesivo explica menos varianza.

- Por ejemplo: para comparar 10 explotaciones, es mejorutilizar 5 Componentes Principales que 150 variablesutilizar 5 Componentes Principales que 150 variables

Page 16: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Análisis factorial.clasificación

- Técnica de reducción de datos.

- Objetivo: establecer qué causas latentes (factores) causan lacorrelación entre las variables observadas.

- Por ejemplo: el desarrollo de un animal no se puede medirdirectamente, pero sí es posible medir algunos de susi di dindicadores:

- El peso y su incremento

- La alzada y sus incrementos (cruz, palomillas, etc.)

- Las dimensiones de algunas regiones corporales y sug g p yrelación respecto a otras

- El análisis factorial establecería que el factor“desarrollo” explica todas estas variables y cómose relaciona cada variable con el factor

Page 17: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

A áli i d d i

clasificación

Análisis de correspondencias.

- Permite visualizar gráficamente tablas de contingencia.

- Por ejemplo: Si existe relación entre la formación delganadero y el tipo de gestión

- Formación: sin formación, primaria, bachillerato,universidad, formación profesional, módulos, escuelade capataces o sus combinacionesde capataces o sus combinaciones

- Tipo de gestión: ninguna, asesor fiscal, veterinarioclínico agrónomo veterinario asesor o susclínico, agrónomo, veterinario asesor o suscombinaciones

Page 18: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

A áli i d l i t ltidi i l

clasificación

Análisis de escalamiento multidimensional.

- Permite aflorar los criterios que utilizan los individuos paraid di ti t bj t idconsiderar que distintos objetos son parecidos o

distintos.

Por ejemplo: Estudios de preferencia del jamón curado- Por ejemplo: Estudios de preferencia del jamón curado

Page 19: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

A áli i d l d ( l t )

clasificación

Análisis de conglomerados (cluster).

- A diferencia del factorial que agrupa variables, pretendeb iagrupar observaciones.

- De tal modo que las observaciones dentro de los grupossean parecidas respecto a las variables utilizadas parasean parecidas respecto a las variables utilizadas paraagrupar.

Y que las observaciones entre los grupos sean lo más- Y que las observaciones entre los grupos sean lo másdiferentes posibles respecto a las mismas variables.

- Por ejemplo, para hacer grupos de animales en un programade mejora genética, o de explotaciones de cara a optimizar sugestióngestión.

Page 20: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Proceso de aplicación de la técnica multivariante.

etapas del análisis

1 Definir el problema que se está investigando (modelo1. Definir el problema que se está investigando (modelo conceptual)

- Análisis conceptual de su objeto de estudioAnálisis conceptual de su objeto de estudio

- Identificar las relaciones fundamentales que se van a abordarabordar

- Elección de la técnica a aplicar

Page 21: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Proceso de aplicación de la técnica multivariante. etapas del análisis

Por ejemplo:

Analizar la gestión de los sectores ecológicos

- Relaciones entre las variables y los casos:

- AF/ACP + ANOVAAF/ACP ANOVA

- Correlación canónica

D d i d i bl l d á- Dependencia de una variable y las demás:

- Regresión logística

- AF/ACP + Discriminante

Page 22: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

2 Desarrollo del plan de análisis

etapas del análisis

2. Desarrollo del plan de análisis

- Tamaño muestral mínimo para la técnica concreta

L l d l i bl li t- Las escalas de las variables a analizar son correctas

3. Condiciones de aplicabilidad de la técnica elegida

4. Desarrollo de la técnica, incorporando o eliminandovariables según la bondad de ajusteg j

Page 23: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

etapas del análisis

5. Interpretación de los resultados

- Interpretar el modelo globalInterpretar el modelo global

- Analizar las variables individuales: cargas factoriales, coeficientes, varianzas, etc.coeficientes, varianzas, etc.

- La interpretación retroalimenta al paso 4

6. Validación del modelo. Técnicas de diagnóstico quepermitan generalizar los resultados a la poblaciónpermitan generalizar los resultados a la población.

Page 24: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

C di i d li bilid d

supuestos básicos

Condiciones de aplicabilidad.

- Normalidad

- Homocedasticidad

- Linealidad

- Independencia

Page 25: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Análisis multivariante de la normalidad.supuestos básicos

- Existen pocos contrastes (Mardia-curtosis y Mardia-apuntalamiento) y no se conoce bien su distribución

- También el gráfico chi-cuadrado:

- Se calculan las distancias de Mahanalobis (D)( )

- Su cuadrado se ordenan de menor a mayor (D2)

En cada distancia se calcula su percentil (j 0 5)/n- En cada distancia se calcula su percentil (j-0,5)/n

- Se calculan los valores X2 de los percentiles de unadistribución X2 con p grados de libertad (p=número dedistribución X2 con p grados de libertad (p=número devariables estudiadas)

Se representan D2 y X2- Se representan D2 y X2

- Con Statgraphics se utiliza “Multivariate Control Chart”

- La variable o variables problemáticas se puedentransformar o eliminar

Page 26: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

H d ti id d ( i i t )

supuestos básicos

Homoscedasticidad (univariante):

- Contraste de Levene (hipótesis nula: la varianza de lai bl X i l t d l i l f l i blvariable X es igual en todos los niveles que forma la variable

Z)

Homoscedasticidad (multivariante):

- Contraste M de Box

- Es muy sensible (se recomienda que p<0,001)

Es necesaria normalidad multivariante para el contraste- Es necesaria normalidad multivariante para el contraste

Page 27: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Por ejemplo:

E t di i l d i t d l

supuestos básicos

- Estudiar si los ganaderos son conscientes de que laproducción intensiva perjudica el medio ambiente

O l t i l d i t i l- O por el contrario, los ganaderos intensivos lo sonporque no son conscientes de esto

Si esto es así los ganaderos intensivos estarían- Si esto es así, los ganaderos intensivos estaríansignificativamente más en desacuerdo con la afirmaciónque los extensivosq

Page 28: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Por ejemplo:

E t bl d áli i di i i t

supuestos básicos

- Esto es un problema de análisis discriminante:

- Una variable dependiente no métrica (intensivo ot i )extensivo)

- Varias variables independientes métricas:

- Y1: Opinión (1 a 5): la g.intensiva perjudica el m.ambiente

- Y2: Opinión (1 a 5): no permitir g.intensiva enespacios protegidos y naturales

- Y3: Opinión (1 a 5): reducir ayudas a g.intensiva U.E.

- Y4: Opinión (1 a 5): debe informarse más sobre losefectos de la g. Intensiva a la opinión pública

Page 29: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Por ejemplo:

D b b l hi ót i l l t i d

supuestos básicos

- Debe comprobarse la hipótesis nula, que la matriz devarianzas-covarianzas de las variables Y es la misma para losniveles de X (intensivo-extensivo).( )

- Contraste M de Box.

Page 30: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

Linealidad:supuestos básicos

- Fundamental en todas las técnicas que se centren en elanálisis de las matrices de correlaciones o de covarianzas

- Porque el coeficiente de correlación de Pearson sólo puedecaptar relaciones lineales

- Para la regresión lineal múltiple se analizan los residuos

- Para el resto de los casos: gráficos de dispersióng pbivariante

- Por ejemplo:

consumo inc. Peso inc. Diám. Digest

Consumo MS (kg/animal) 1 0,87 0,91 -0,66( g ) , , ,

Incremento de Peso 0,87 1 0,79 0,81

Incremento de Diámetro 0 91 0 79 1 0 92Incremento de Diámetro 0,91 0,79 1 0,92

Digestibilidad MS (%) -0,66 0,81 0,92 1

Page 31: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

supuestos básicos

consumo inc Peso inc Diám Digestibilidad

20

30

40

20

30

40

40

60

80

100

consumo inc. Peso inc. Diám. Digestibilidad

Consumo0

10

0 20 40 60

0

10

0 20 40 600

20

0 20 40 60

Consumo

I P30

4040

30

40

Inc Peso0

10

20

0 20 40 60 0

10

20

30

0 20 40 600

10

20

30

0 20 40 60

Inc Diam0

10

20

30

40

0 20 40 60

0

10

20

30

40

0 20 40 600

20

40

60

80

100

0 20 40 60

Diges0

10

20

30

40

20

40

60

80

100

0

10

20

30

40

00 20 40 60

00 20 40 60

00 20 40 60

Page 32: ANÁLISIS DE ENCUESTAS - uco.es · PDF fileDfiiió introducción Definición. - Conjunto de métodos estadísticos cuya finalidad es analizar siltá timultáneamente conjtjuntos de

I d d i

supuestos básicos

Independencia:

- Los valores que toman las variables en un caso no estáni fl id l l t tinfluidos por los valores que toman en otro caso

- Si no se está seguro de esto, habría que incrementar elnivel de significación de los contrastes 10 veces (denivel de significación de los contrastes 10 veces (dep<0,05 a p<0,005)

La independencia se asegura en el diseño experimental- La independencia se asegura en el diseño experimental