análisis discriminante spss

27
“ANÁLISIS DISCRIMINANTE SPSS” Estudio de Caso: Mundo UNIVERSIDAD GALILEO FACULTAD DE CIENCIA, TECNOLOGÍA E INDUSTRIA DOCTORADO EN ADMINISTRACIÓN CON ESPECIALIDAD EN FINANZAS ARQ. ALVARO COUTIÑO G Carnet 1300-4393

Upload: al-cougar

Post on 29-Jun-2015

583 views

Category:

Business


16 download

DESCRIPTION

El análisis discriminante permite estudiar las diferencias entre dos o más grupos de individuos definidos a priori, con respecto a varias variables simultáneamente.

TRANSCRIPT

Page 1: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

“ANÁLISIS DISCRIMINANTE SPSS”

Estudio de Caso: Mundo

UNIVERSIDAD GALILEO

FACULTAD DE CIENCIA, TECNOLOGÍA E INDUSTRIA

DOCTORADO EN ADMINISTRACIÓN CON

ESPECIALIDAD EN FINANZAS

ARQ. ALVARO COUTIÑO G Carnet 1300-4393

Page 2: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

1

INTRODUCCIÓN ............................................................................................................ 2

1. Información caso de estudio ..................................................................................... 2

OBSERVACIONES IMPORTANTES PARA ANALISIS DISCRIMINANTE. ............ 3

2. Ejercicio Análisis discriminante: MUNDO .............................................................. 3

3. Resultados del análisis discriminante: ...................................................................... 4

3.1. Resumen del procesamiento para el análisis de casos ........................................... 4

3.2. Estadísticos de grupo ............................................................................................. 4

RESÚMENES LAS FUNCIONES CANÓNICAS DISCRIMINANTES ....................... 5

3.3. Autovalores ............................................................................................................ 5

3.4. Lambda de Wilks ................................................................................................... 6

3.5. Coeficientes estandarizados de las funciones determinantes canónicas. ............... 6

3.6. Matriz de estructura ............................................................................................... 7

3.7. Funciones en los centroides de los grupos ............................................................ 7

ESTADÍSTICOS DE CLASIFICACIÓN: ....................................................................... 8

3.8. Resumen del proceso de clasificación ................................................................... 8

3.9. Probabilidades previas para los grupos ................................................................. 8

3.10. Coeficientes de la función clasificación: ........................................................... 8

3.10.1. Funciones lineales discriminantes de Fisher .................................................. 9

3.11. Estadísticos por casos ........................................................................................ 7

3.12. Mapa territorial: ................................................................................................. 8

3.13. Resultado de la clasificación .............................................................................. 9

4. RESPUESTAS CUESTIONARIO ......................................................................... 10

4.1. INCISO 1: ............................................................................................................ 10

4.2. INCISO 2: ............................................................................................................ 10

4.3. INCISO 3 ............................................................................................................. 10

5. CONCLUSIONES .................................................................................................. 12

6. ANEXOS ................................................................................................................ 12

Resultados alfa cronbach ................................................................................................ 12

7. BIBLIOGRAFÍA .................................................................................................... 21

Page 3: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

2

INTRODUCCIÓN

El análisis discriminante permite estudiar las diferencias entre dos o más grupos de

individuos definidos a priori, con respecto a varias variables simultáneamente. Por lo

tanto, tiene como objetivo analizar la relación entre una variable dependiente categórica

con g modalidades, que se corresponden con los grupos analizados, y un conjunto de

variables independientes x1 , x2 … xp, métricas o cuantitativas, a partir de una serie de

funciones discriminantes, que son combinaciones lineales de las variables

independientes que mejor discriminan o separan los grupos, y cuya expresión es la

siguiente:

1. Información caso de estudio

Por término medio las personas de los países de zonas templadas consumen más

calorías por día que las de los trópicos y una proporción mayor de la población de las

zonas templadas viven en núcleos urbanos. Un investigador desea combinar esta

información en una función para discriminar entre grupos de países. Considera además

que el tamaño de la población y la información económica también pueden ser

importantes. Utilice el archivo MUNDO el cuál contienen indicadores económicos,

demográficos, sanitarios y de otros tipos para diversos países del mundo.

Las variables independientes a considerar son:

Consumo diario de calorías (calorías),

El logaritmo del pib (log_pib),

La población urbana (urbana) y

El logaritmo de la población (log_pob).

Como variable de agrupación usamos:

El clima (clima) con valores entre 5 y 8.

1. Escribir las funciones de clasificación para clima:

a. Tropical,

b. Mediterráneo,

c. Templado.

2. Cuantos casos fueron eliminados del análisis?

3. Que porcentaje de la varianza explica la primera función canónica

discriminante?

Page 4: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

3

4. Clasificar a Brasil, Burundi, Costa Rica, Italia en el grupo de país que

corresponde según el clima.

5. El grupo en el que estaban realmente estos tres países es el correcto según el

análisis?.

OBSERVACIONES IMPORTANTES PARA ANALISIS DISCRIMINANTE.

1. Tomar en cuenta los valores de la variable de agrupación. (clima 5 y 8)

2. En el Análisis solicitar la Introducción de variables independientes juntas. (no

utilizar la inclusión por pasos porque interesa ver todas las variables

independientes).

2. Ejercicio Análisis discriminante: MUNDO

El siguiente análisis de caso, está basado en las técnicas de análisis discriminante de

datos (SPSS), el cual está dividido en 5 incisos, acompañadas de los análisis

respectivos, referencias conceptuales, respuestas, conclusiones.

Por último, en ANEXOS se realizaron análisis de fiabilidad y discriminantes con el

objetivo de comprobar si eliminando las variables que influyen menos en la

clasificación e incluyendo países que están muy correlacionados entre sí, como los

países centroamericanos, cuál sería el comportamiento y el resultado del discriminante y

así poder compararlo con el análisis inicial.

Como primer paso,

Cargue en SPSS el archivo de nombre MUNDO, (archivo → abrir → datos) este

contiene indicadores económicos, demográficos, sanitarios y de otros tipos para

diversos países del mundo.

Siguiente paso, cargar las variables independientes siguientes:

Consumo diario de calorías (calorías),

El logaritmo del pib (log_pib),

La población urbana (urbana) y

El logaritmo de la población (log_pob).

A continuación la viable de agrupación:

El clima (clima) con valores entre 5 y 8.

Page 5: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

4

3. Resultados del análisis discriminante:

DISCRIMINANTE

3.1. Resumen del procesamiento para el análisis de casos

Resumen del procesamiento para el análisis de casos

Casos no ponderados N Porcentaje

Válidos 56 51.4

Excluidos

Códigos de grupo para perdidos o fuera de rango 18 16.5

Perdida al menos una variable discriminante 24 22.0

Perdidos o fuera de rango ambos, el código de grupo y al

menos una de las variables discriminantes. 11 10.1

Total excluidos 53 48.6

Casos Totales 109 100.0

Interpretación:

Se puede observar que la cantidad de casos válidos fueron el 51.4% y no validos

48.6%.

3.2. Estadísticos de grupo

Estadísticos de grupo

Clima predominante N válido (según lista)

No ponderados Ponderados

tropical

Ingesta diaria de calorías 28 28.000

Log(10) de PIB_CAP 28 28.000

Habitantes en ciudades (%) 28 28.000

Log(10) de POBLAC 28 28.000

mediterráneo

Ingesta diaria de calorías 6 6.000

Log(10) de PIB_CAP 6 6.000

Habitantes en ciudades (%) 6 6.000

Log(10) de POBLAC 6 6.000

templado

Ingesta diaria de calorías 22 22.000

Log(10) de PIB_CAP 22 22.000

Habitantes en ciudades (%) 22 22.000

Log(10) de POBLAC 22 22.000

Total

Ingesta diaria de calorías 56 56.000

Log(10) de PIB_CAP 56 56.000

Habitantes en ciudades (%) 56 56.000

Log(10) de POBLAC 56 56.000

Interpretación:

Page 6: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

5

ANÁLISIS 1

RESÚMENES LAS FUNCIONES CANÓNICAS DISCRIMINANTES

3.3. Autovalores1

Autovalores

Función Autovalor % de varianza % acumulado Correlación canónica2

1 .885a 95.9 95.9 .685

2 .038a 4.1 100.0 .192

a. Se han empleado las 2 primeras funciones discriminantes canónicas en el análisis.

Interpretación:

Se observa que la primera función discriminante explica casi toda la variabilidad

del modelo (95.9%) lo que concuerda con el hecho de que la Lambda de Wilkis

indica que sólo es significativa con la primera función discriminantes.

Se observa además, que los valores de correlación canónica decrecen

0.685>0.192 = la primera función discrimina más que la segunda. Por lo tanto,

su correlación canónica es (0.685) lo que indica que discrimina aceptablemente.

Se observa que la correlación canónica está correlacionada (.685) con la variable

dependiente. Por lo tanto mide una correlación entre la función que se encontró

y los valores que puede tomar la variable dependiente. En consecuencia, si lo

que tratamos es de explicar una correlación entre una variable y otra, mientras

más alto este valor mejor. (max.1), Esto nos dice que si tenemos una buena

correlación entonces esa función si explica bien la otra.

Con los autovalores se observa también que los valores de la correlación

canónica decrecen .885 > .038. En donde la primera función explicaría un total

del 95.9% de la variabilidad total, mientras que la segunda explica el restante

4.1%.

En Resumen:

La primera función es la que otorgará la clasificación. Mientras que la segunda

aporta información y según el Lambda de Wilkes es significativa.

1 Autovalores: Mide las desviaciones de las puntuaciones discriminantes entre grupos respecto a las

desviaciones dentro de los grupos. En consecuencia, es la parte de la variabilidad total de la nube de

puntos proyectada sobre el conjunto de todas las funciones atribuible a la función. Por lo tanto, si su valor

es grande, la función discriminará mucho. 2 Correlación canónica: Mide la correlación entre la función discriminante y la variable dependiente (0,

1). Por lo tanto, si su valor es grande (próximo a 1) la dispersión será debida a las diferencias entre grupos

y en consecuencia la función discriminará mucho.

Page 7: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

6

3.4. Lambda de Wilks3

Lambda de Wilks

Contraste de las funciones Lambda de Wilks Chi-cuadrado gl Sig.

1 a la 2 .511 34.565 8 .000

2 .963 1.931 3 .587

Interpretación

La Lambda de Wilks mientras más pequeña es mejor o sea que discrimina más.

Se observa que sólo es significativa la primera función discriminante (0.000) ya

que es menor a 0.05. Por lo tanto, la función que se calculó si discrimina la

variable dependiente. En consecuencia, el (Sig) es un criterio importante para

saber si el modelo contiene variables discriminadoras.

3.5. Coeficientes estandarizados de las funciones determinantes canónicas.

Coeficientes estandarizados de las funciones discriminantes canónicas

Función

1 2

Ingesta diaria de calorías 1.107 -.459

Log(10) de PIB_CAP .005 .548

Habitantes en ciudades (%) -.196 -.145

Log(10) de POBLAC .160 1.014

Interpretación:

Se observan los coeficientes estandarizados de las funciones discriminantes

canónicas, en donde en la función (1) la ingesta de caloría (1.107) es la que más

discrimina y en la función (2) es Log (10) de POBLAC (1.014)

respectivamente.

Son las variables que más permiten separar a los grupos. Por lo tanto, la variable

con el coeficiente mayor, es la que tiene más importancia en el momento de

tomar una decisión de a cuál grupo se dirige.

En consecuencia, en este caso son en la primera función las variables de Ingesta

diaria de calorías y en la segunda función Log (10) de POBLAC.

3 Lambda de Wilks: Se obtiene de la razón entre el determinante de la matriz de varianzas y covarianzas

dentro de grupos y el determinante de la matriz de varianzas y covarianzas total.

Page 8: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

7

3.6. Matriz de estructura4

Matriz de estructura

Función

1 2

Ingesta diaria de calorías .972* -.175

Log(10) de PIB_CAP .753* -.164

Habitantes en ciudades (%) .488* -.207

Log(10) de POBLAC .103 .966*

Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones

discriminantes canónicas tipificadas

Variables ordenadas por el tamaño de la correlación con la función.

*. Mayor correlación absoluta entre cada variable y cualquier función discriminante.

Interpretación:

Se observa que todas las variables (salvo cuarta) tienen la mayor correlación con

la primera función discriminante. Por lo tanto, la ingesta de caloría tiene una

correlación con la función alta (.972*), y Log (10) de PIB_CAP (.753*) y ates

en ciudades (%) con (.488*) respectivamente

Se observa que en la segunda función discriminante, la mayor correlación es

Log (10) de POBLAC con (.966*)

3.7. Funciones en los centroides de los grupos5

Funciones en los centroides de los grupos

Clima predominante Función

1 2

tropical -.888 -.046

mediterráneo .293 .546

templado 1.050 -.091

Funciones discriminantes canónicas no tipificadas evaluadas en las medias de los grupos

Interpretación:

Se puede observar que las medias entre los grupos son diferentes o poca

parecidas. Por lo tanto la discriminación es aceptable y concuerda con la opinión

del análisis Lambda de Wilkis.

4 Matriz de estructura: Son las correlaciones entre las variables y la función discriminante

5 Funciones en los centroides de los grupos: Nos da una idea de cómo las funciones discriminan grupos.

Por lo tanto, si las medias de los grupos en cada función son muy parecidas la función no discrimina

grupos.

Page 9: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

8

Además, se observa valores más distintos en la primera función. Por lo tanto,

discrimina mejor. No obstante, se aprecia que existe poca diferencia entre los

valores tropical y templado (-.046 y -.091 respectivamente) lo que nos indica

que se observa un menor poder discriminatorio.

ESTADÍSTICOS DE CLASIFICACIÓN:

3.8. Resumen del proceso de clasificación

Resumen del proceso de clasificación

Procesados 109

Excluidos Código de grupo perdido o fuera de rango 0

Perdida al menos una variable discriminante 35

Usados en los resultados 74

Interpretación:

3.9. Probabilidades previas para los grupos

Probabilidades previas para los grupos

Clima predominante Previas Casos utilizados en el análisis

No ponderados Ponderados

tropical .333 28 28.000

mediterráneo .333 6 6.000

templado .333 22 22.000

Total 1.000 56 56.000

Interpretación:

3.10. Coeficientes de la función clasificación:

Coeficientes de la función de clasificación

Clima predominante

tropical mediterráneo templado

Ingesta diaria de calorías .004 .006 .008

Log(10) de PIB_CAP 15.681 16.247 15.654

Habitantes en ciudades (%) -.204 -.218 -.220

Log(10) de POBLAC 11.311 12.510 11.712

(Constante) -47.445 -60.071 -62.083

Funciones discriminantes lineales de Fisher

Interpretación:

Page 10: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

9

3.10.1. Funciones lineales discriminantes de Fisher

Funciones lineales discriminantes de Fisher

Tropical Y=-47.445+.004*Ingesta diaria calorías+15,682*Log(10)de PIB_CAP-2.04*Habitantes

en ciudades (%)+11.311*Log(10) de POBLAC

Mediterráneo Y=--60.071+.006*Ingesta diaria calorías+16.247*Log(10)de PIB_CAP-2.18*Habitantes

en ciudades (%)+12.510*Log(10) de POBLAC

Templado Y=-62.083+.008*Ingesta diaria calorías+15,654*Log(10)de PIB_CAP-2.20*Habitantes

en ciudades (%)+11.712*Log(10) de POBLAC

Interpretación:

Estos coeficientes se utilizarán para clasificar en el futuro a los países según el

clima a donde pertenecen, previo cálculo su puntuación en cada uno de los

grupos usando las funciones discriminantes con estos coeficientes Fisher. Por lo

tanto, cada país se clasificará en el grupo que haya alcanzado la puntuación más

elevada.

En la tabla siguiente de estadísticos de caso se observan el grupo real (Grupo al cual

pertenece antes de realizar el análisis) y el pronosticado (Grupo que se pronostica al

que pertenece). En consecuencia, cuando el grupo real en que cae el país y el

pronosticado en grupo no coinciden, hay un error de clasificación en el país.

Como podemos observar en la tabla de análisis por caso únicamente Costa Rica fue

clasificada con la función de clasificación en el grupo al cual pertenecía originalmente.

Por el contrario, Brasil, Burundi y Italia fueron clasificados erróneamente.

Page 11: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

10

Estadísticos por caso:

Interpretación

Page 12: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

Coeficientes de la función de clasificación

tropical

mediterráne

o templado tropical

mediterráne

o templado tropical

mediterráne

o templado tropical

mediterráne

o templado tropical

mediterráne

o templado

Ingesta diaria de

calorías.004 .006 .008 2751.00 2751.00 2751.00 1932.00 1932.00 1932.00 2808.00 2808.00 2808.00 3504.00 3504.00 3504.00

Log(10) de

PIB_CAP15.681 16.247 15.654

3.37 3.37 3.372.320 2.320 2.320 3.310 3.310 3.310 4.240 4.240 4.240

Habitantes en

ciudades (%)-.204 -.218 -.220 75.00 75.00 75.00 5.00 5.00 5.00 47.00 47.00 47.00 69.00 69.00 69.00

Log(10) de

POBLAC11.311 12.510 11.712

5.19 5.19 5.193.780 3.780 3.780 3.520 3.520 3.520 4.760 4.760 4.760

(Constante)-47.445 -60.071 -62.083 1 1 1 1 1 1 1 1 1 1 1 1

58.45 59.52 58.34 37.46 35.22 33.83 44.54 44.08 44.49 71.10 74.02 74.64

burundi costarica italia

17 20 27 61Coeficientes de la función de clasificación

Clima predominante

Funciones discriminantes lineales de Fisher

brasil

Interpretación:

3.11. Estadísticos por casos

Fisher Grupo real Grupo pronosticado

17 Brasil 59.52 Mediterráneo (6) 5 6**

20 Burundi 37.46 Tropical (5) 8 5**

27 Costa Rica 44.54 Tropical (5) 5 5

61 Italia 74.64 Templado (8) 6 8**

Interpretación: 5 = tropical

6 = mediterráneo

8 = templado

Interpretación

Brasil (17) pertenecía antes del análisis al grupo real de Tropical (5), después del análisis pasó al grupo pronosticado Mediterráneo (6**), pero resultó

mal pronosticado según el análisis, por lo que se procedió a realizar el análisis según Fisher y el análisis confirmó la pertenencia al grupo Mediterráneo

(6).

Burundi (20) pertenecía antes del análisis al grupo real de Templado 8), después del análisis pasó al grupo pronosticado Tropical (5**), pero resultó mal

pronosticado según el análisis, por lo que se procedió a realizar el análisis según Fisher y el análisis confirmó la pertenencia al grupo Tropical (5)

Costa Rica (27) pertenecía antes del análisis al grupo real de Tropical (5), después del análisis se confirmó en el grupo pronosticado Tropical (5), por lo

que se procedió a realizar el análisis según Fisher y el análisis reconfirmó la pertenencia al grupo Tropical (5)

Italia (61) pertenecía antes del análisis al grupo real de Mediterráneo (6), después del análisis pasó al grupo pronosticado Templado (8**), pero resultó

mal pronosticado según el análisis, por lo que se procedió a realizar el análisis según Fisher y el análisis confirmó la pertenencia al grupo Templado (8)

Page 13: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

3.12. Mapa territorial:

Mapa territorial (Asumiendo que todas las funciones excepto las dos primeras son = 0)

Discriminante canónica

Función 2

-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0

+---------+---------+---------+---------+---------+---------+---------+---------+

8.0 + 12 224 +

I 12 244 I

I 12 24 I

I 12 224 I

I 12 244 I

I 12 224 I

6.0 + + + 12 + + + + 244 +

I 12 24 I

I 12 224 I

I 12 244 I

I 12 224 I

I 12 244 I

4.0 + + + 12 + + 24 + +

I 12 224 I

I 12 244 I

I 12 224 I

I 12 244 I

I 12 24 I

2.0 + + + + 12 + +224 + + +

I 12 244 I

I 12 224 I

I 12 244 I

I 12 * 24 I

I 12 224 I

.0 + + + + * 12 24* + + + +

I 1224 I

I 144 I

I 14 I

I 14 I

I 14 I

-2.0 + + + + 14 + + + +

I 14 I

I 14 I

I 14 I

I 14 I

I 14 I

-4.0 + + + + 14 + + + +

I 14 I

I 14 I

I 14 I

I 14 I

I 14 I

-6.0 + + + + 14 + + + +

I 14 I

I 14 I

I 14 I

I 14 I

I 14 I

-8.0 + 14 +

+---------+---------+---------+---------+---------+---------+---------+---------+

-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0

Función discriminante canónica 1

Brasil (X = .059, Y = 1.361) = 2 Mediterráneo

Burundi (X = -1.806, Y = -.531) = 1 Tropical

Costa Rica (X = 0.26, Y = -1.178) = 4 Templado

Italia (X = 1.927, Y = .757) = 4 Templado

Page 14: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

9

Símbolos usados en el mapa territorial Símbol Grupo Etiqu

1 5 tropical

2 6 mediterráneo

4 8 templado

* Indica un centroide de grupo

Interpretación:

El mapa territorial que se observa representa los valores en las funciones

discriminantes canónicas, en abscisas se sitúan los valores de la función 1 y en

ordenadas las puntuaciones en la función 2.

Las regiones están determinadas por los símbolos 1, 2, 3 y 4. Por lo tanto,

corresponde a los climas donde se agrupan los países según su clima, (Tropical,

mediterráneo o templado)

Clasificación según mapa territorial

Países Abscisas F1

= X

Ordenadas F2

= Y

Coordenadas

cartesianos

Región

Real

Pronosticada Territorial Fisher

17 Brasil 0.059 1.361 (0.059,1.361) 5 Trop 6** Med. 6 Med 6 Med

20 Burundi -1.806 -0.531 (-1.806,-0.531) 8 Temp. 5** Trop 5 Trop. 5 Trop.

27 Costa Rica 0.26 -1.178 (0.26,-1.178) 5 Trop. 5 Trop. 8 Temp. 5Trop.

61 Italia 1.927 0.757 (1.927, 0.757) 6 Med. 8** Temp. 8 Temp. 8Temp

Interpretación:

Se puede observar que el pronóstico es similar al realizado con los coeficientes de la

clasificación de Fisher, con 1 excepción en la clasificación de Costa Rica que según el

mapa territorial la ubica en la región Templada y Fisher la ubica en la región Tropical

3.13. Resultado de la clasificación

Resultados de la clasificacióna

Clima predominante Grupo de pertenencia pronosticado Total

tropical mediterráneo templado

Original

Recuento

tropical 23 4 1 28

mediterráneo 2 2 2 6

templado 4 2 16 22

Casos desagrupados 8 4 6 18

%

tropical 82.1 14.3 3.6 100.0

mediterráneo 33.3 33.3 33.3 100.0

templado 18.2 9.1 72.7 100.0

Casos desagrupados 44.4 22.2 33.3 100.0

a. Clasificados correctamente el 73.2% de los casos agrupados originales.

Interpretación:

Se observa que el porcentaje de aciertos es 73.2%, lo que indica que el modelo

es correcto.

Page 15: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

10

4. RESPUESTAS CUESTIONARIO

4.1. INCISO 1:

Escribir las funciones de clasificación para clima: tropical, mediterráneo,

templado.

Conclusiones:

Las Funciones lineales discriminantes de Fisher para el clima tropical,

mediterráneo y templado son las siguientes

4.2. INCISO 2:

Cuantos casos fueron eliminados del análisis:

Conclusiones:

Fueron excluidos 53 casos, lo que representa un 48.6% de casos totales.

4.3. INCISO 3

Qué porcentaje de la varianza explica la primera función canónica discriminante:

Conclusiones:

La primera función discriminante explica el 95.9%

Page 16: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

11

INCISO 4

Clasificar a Brasil, Burundi, Costa Rica, Italia en el grupo de país que

corresponde según el clima.

Conclusiones:

En resumen:

Según el clima estos países se clasifican de la siguiente manera:

Grupo real:

Brasil (17) Grupo real / Tropical (5)

Burundi (20) Grupo real / Templado (8)

Costa rica (27) Grupo real / Tropical (5)

Italia (61) Grupo real / Mediterráneo (6)

INCISO 5

El grupo en el que estaban realmente estos tres países es el correcto según el

análisis?.

Conclusiones

Brasil estaba en Grupo real = 5 tropical y pronosticado está mal pronosticado en

6** Mediterráneo

Burundi estaba en real = 8 Templado y pronosticado está mal pronosticado en

5** Tropical

Costa rica estaba en real = 5 Tropical y pronosticado está bien pronosticado 5

Tropical

Italia estaba en real = 6 Mediterráneo y pronosticado está mal pronosticado en

8** Templado

En resumen:

Según el análisis realizado con los coeficientes de la función clasificación.

Brasil (59.52) está según Fisher está en 6 Mediterráneo

Burundi (37.46) está según Fisher está en 5 Tropical

Costa rica (44.54) está según Fisher está en 5 Tropical

Italia (74.64) está según Fisher está en 8 Templado

Page 17: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

12

5. CONCLUSIONES

Se pudo confirmar la importancia y utilidad del análisis discriminante y como es

aplicable a muy diversas áreas del conocimiento. En este estudio de caso, nos

ayudó a distinguir con una mayor precisión la pertenencia de los países

estudiados a diferentes grupos según su clima y en base a variables

independientes y variable dependiente de agrupación.

En consecuencia, el análisis discriminante sirvió para encontrar la combinación

lineal de las variables independientes que mejor nos permitieron discriminar a

los grupos estudiados, y una vez encontrada esta combinación se utilizó para

realizar una reclasificación de a los países analizados según el grupo climático

que pertenecen.

6. ANEXOS

ANEXO 1: EVALUACIÓN ANÁLISIS FIDELIDAD Y ANÁLISIS

DISCRIMINANTE

En el siguiente análisis del mismo caso MUNDO, se procederá a realizar un

análisis de fiabilidad, con el objetivo de optimizar el % de la clasificación

mediante el estudio de las variables que más aporten al modelo discriminante y

eliminar a las que menos aporten al modelo discriminante, para proceder a

eliminar la que menos impacten en el modelo y proceder a evaluar y comparar

los resultados de la clasificación

Resultados alfa cronbach

Analisis fiabilidad

Escala: Todas las variables

Resumen del procesamiento de los casos

Resumen del procesamiento de los casos

N %

Casos

Válidos 74 67.9

Excluidosa 35 32.1

Total 109 100.0

a. Eliminación por lista basada en todas las variables del procedimiento.

Estadísticos de fiabilidad

Estadísticos de fiabilidad

Alfa de Cronbach N de elementos

.080 4

Page 18: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

13

Estadísticos total-elemento

Media de la

escala si se

elimina el

elemento

Varianza de la

escala si se

elimina el

elemento

Correlación

elemento-total

corregida

Alfa de Cronbach

si se elimina el

elemento

Ingesta diaria de calorías 62.2269 653.530 .703 .053

Log(10) de PIB_CAP 2800.8433 336341.716 .857 .087

Habitantes en ciudades (%) 2749.5242 316811.864 .692 .003

Log(10) de POBLAC 2799.9647 336969.184 .047 .090

Eliminando la variable Log(10) de POBLAC para elevar a 0.090 el alfa cronbach

Analisis de fiabilidad

Escala todas las variables

Resumen del procesamiento de los casos

N %

Casos

Válidos 74 67.9

Excluidosa 35 32.1

Total 109 100.0

a. Eliminación por lista basada en todas las variables del procedimiento.

Estadísticos de fiabilidad

Alfa de Cronbach N de elementos

.090 3

Estadísticos total-elemento

Media de la

escala si se

elimina el

elemento

Varianza de la

escala si se

elimina el

elemento

Correlación

elemento-total

corregida

Alfa de Cronbach

si se elimina el

elemento

Ingesta diaria de calorías 58.0052 656.770 .700 .081

Log(10) de PIB_CAP 2796.6216 336307.060 .857 .116

Habitantes en ciudades (%) 2745.3025 316773.789 .693 .004

Page 19: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

14

Se volvió a realizar el análisis discriminante eliminando a la variable Log (10) de

POBLAC para verificar si mejora el resultado de la clasificación

Resumen del procesamiento para el análisis de casos

Casos no ponderados N Porcentaje

Válidos 56 51.4

Excluidos

Códigos de grupo para perdidos o fuera de

rango

18 16.5

Perdida al menos una variable discriminante 24 22.0

Perdidos o fuera de rango ambos, el código de

grupo y al menos una de las variables

discriminantes.

11 10.1

Total excluidos 53 48.6

Casos Totales 109 100.0

Estadísticos de grupo

Clima predominante N válido (según lista)

No ponderados Ponderados

tropical

Ingesta diaria de calorías 28 28.000

Log(10) de PIB_CAP 28 28.000

Habitantes en ciudades (%) 28 28.000

mediterráneo

Ingesta diaria de calorías 6 6.000

Log(10) de PIB_CAP 6 6.000

Habitantes en ciudades (%) 6 6.000

templado

Ingesta diaria de calorías 22 22.000

Log(10) de PIB_CAP 22 22.000

Habitantes en ciudades (%) 22 22.000

Total

Ingesta diaria de calorías 56 56.000

Log(10) de PIB_CAP 56 56.000

Habitantes en ciudades (%) 56 56.000

ANÁLISIS 1

RESUMEN DE LAS FUNCIONES CANÓNICAS DISCRIMINANTES

Autovalores

Función Autovalor % de

varianza

% acumulado Correlación

canónica

1 .865a 99.9 99.9 .681

2 .001a .1 100.0 .031

Se han empleado las 2 primeras funciones discriminantes canónicas

en el análisis.

Page 20: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

15

Lambda de Wilks

Contraste de las

funciones

Lambda de

Wilks

Chi-cuadrado gl Sig.

1 a la 2 .536 32.448 6 .000

2 .999 .051 2 .975

Coeficientes estandarizados de las

funciones discriminantes canónicas

Función

1 2

Ingesta diaria de calorías 1.171 -.226

Log(10) de PIB_CAP -.064 -.687

Habitantes en ciudades

(%)

-.207 1.509

Matriz de estructura

Función

1 2

Ingesta diaria de calorías .983* .163

Log(10) de PIB_CAP .762* .304

Habitantes en ciudades (%) .495 .825*

Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones discriminantes

canónicas tipificadas

Variables ordenadas por el tamaño de la correlación con la función.

*. Mayor correlación absoluta entre cada variable y cualquier función discriminante.

Funciones en los centroides de los grupos

Clima predominante Función

1 2

tropical -.871 .008

mediterráneo .207 -.088

templado 1.052 .013

Funciones discriminantes canónicas no tipificadas evaluadas en las medias de los grupos

Page 21: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

16

ESTADÍSTICOS DE CLASIFICACIÓN

Resumen del proceso de clasificación

Procesados 109

Excluidos Código de grupo perdido o fuera de rango 0

Perdida al menos una variable discriminante 35

Usados en los resultados 74

Probabilidades previas para los grupos

Clima predominante Previas Casos utilizados en el análisis

No ponderados Ponderados

tropical .333 28 28.000

mediterráneo .333 6 6.000

templado .333 22 22.000

Total 1.000 56 56.000

Coeficientes de la función de clasificación

Clima predominante

tropical mediterráneo templado

Ingesta diaria de calorías .009 .012 .014

Log(10) de PIB_CAP 10.285 10.279 10.066

Habitantes en ciudades (%) -.224 -.240 -.241

(Constante) -21.892 -28.812 -34.685

Page 22: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

17

Mapa territorial

Mapa territorial

(Asumiendo que todas las funciones excepto las dos primeras son = 0)

Discriminante canónica

Función 2

-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0

+---------+---------+---------+---------+---------+---------+---------+---------+

8.0 + 14 +

I 14 I

I 14 I

I 14 I

I 14 I

I 14 I

6.0 + + + + 14 + + + +

I 14 I

I 14 I

I 14 I

I 14 I

I 14 I

4.0 + + + + 124 + + + +

I 124 I

I 124 I

I 124 I

I 124 I

I 12 24 I

2.0 + + + + 12 24 + + + +

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

.0 + + + + * 12+* 24* + + + +

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

-2.0 + + + + 12+ 24 + + + +

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

-4.0 + + + + 12 + 24 + + + +

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

-6.0 + + + + 12 + 24 + + + +

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

I 12 24 I

-8.0 + 12 24 +

+---------+---------+---------+---------+---------+---------+---------+---------+

-8.0 -6.0 -4.0 -2.0 .0 2.0 4.0 6.0 8.0

Función discriminante canónica 1

Símbolos usados en el mapa territorial

Símbol Grupo Etiqu

1 5 tropical

2 6 mediterráneo

4 8 templado

* Indica un centroide de grupo

Clasificación según mapa territorial

Países Abscisas F1

= X

Ordenadas F2

= Y

Coordenadas

cartesianos

Región

Real

Pronosticada Territorial Fisher

35 Guatemala -1.047 -.016 (-1.047,-0.016) 5 Trop 5 Trop. 5Trop 5 Trop

49 Salvador -1.285 -.399 (-1.285,-0.399) 5 Trop 5 Trop. 5Trop 5 Trop

51 Honduras -1.234 0.44 (-1.234,0.44) 5 Trop 5 Trop. 5Trop 5 Trop

74 Nicaragua -1.283 1.468 (-1.283, 1.468) 5 Trop 5 Trop. 5Trop 5 Trop

81 Panamá -.566 .025 (-0.566, 0.025) 5 Trop 5 Trop. 5Trop 5 Trop

Interpretación:

Se puede observar que el pronóstico es similar al realizado con los coeficientes de la

clasificación de Fisher, que según el mapa territorial los ubica en la región Tropical y Fisher los

ubica también en la región Tropical

Brasil (X = -.184, Y = 1.306) = 2 Mediterráneo

Burundi (X = -1.166, Y = -1.423) = 1 Tropical

Costa Rica (X = 0.218, Y = -.407) = 2 Mediterráneo

Italia (X = 1.798, Y = -.491) = 4 Templado Guatemala (X = -1.047, Y = -0.016) = 5

Tropical

Salvador (X = -1.285, Y = -0.399) = 5 Tropical

Nicaragua (X = -1.283, Y =1.468) = 5 Tropical

Honduras (X = -1.234, Y = 0.044) = 5 Tropical

Panamá (X = -0.0566, Y = 0.025) = 5 Tropical

Page 23: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

18

Estadísticos por casos

Page 24: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

Coeficientes de la función clasificación

Brasil 17 Burundi 20 Costa Rica 27 Italia 61 Guatemala 49 Salvador 35 Honduras 51 Nicaragua 74 Panamá 81

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

tropica

l

mediter

ráneo

templa

do

Ingesta diaria de

calorías .009 .012 .014 2751 2751 2751 1932 1932 1932 2808 2808 2808 3504 3504 3504 2235 2235 2235 2327 2327 2327 2247 2247 2247 2265 2265 2265 2539 2539 2539

Log(10) de

PIB_CAP 10.285 10.279 10.066 3.37 3.37 3.37 2.32 2.32 2.32 3.31 3.31 3.31 4.24 4.24 4.24 3.13 3.13 3.13 3.03 3.03 3.03 3.01 3.01 3.01 2.65 2.65 2.65 3.38 3.38 3.38

Habitantes en

ciudades (%) -.224 -.240 -.241 75 75 75 5 5 5 47 47 47 69 69 69 39 39 39 44 44 44 44 44 44 60 60 60 53 53 53

(Constante) ##### ##### ##### 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

20.37 20.40 19.85 18.00 16.69 14.61 26.54 27.16 26.78 37.34 39.68 40.63 21.39 20.45 18.84 20.06 19.31 17.92 19.14 18.16 16.60 12.01 10.84 9.38 23.52 23.26 22.26

Coeficientes de la función de

clasificación

Clima predominante

Funciones discriminantes lineales de

Fisher

Interpretación:

Se puede observar que todos los países del área pertenecen al mismo grupo real y grupo pronosticado Tropical (5) con excepción de Costa Rica que pertenece al

grupo real (5) pero en el análisis lo considera m pronosticado (6**) y al realizar el análisis Fisher lo confirma en mediterraneo (6)

Si se compara el modelo inicial con el modelo modificado (el cual se eliminó la variable Log (10) POBLAC para obtener una % de clasificación mejor: Modelo

modificado 75% > 73.2 modelo sin modificar o inicial). Se puede observar que se obtienen los mismos datos y clasificaciones grupales para los países estudiados con

excepción de Costa Rica el cual en el primer modelo sin modificar estaba en el grupo real Tropical (5) y se mantenía en el grupo pronosticado Tropical (5). Sin

embargo en el modelo modificado se ubicada en el grupo real (5) y se pronostica en el grupo mediterráneo (6)

Fisher Grupo real Grupo pronosticado

17 Brasil 20.39 Mediterráneo (6) 5 6**

20 Burundi 17.99 Tropical (5) 8 5**

27 Costa Rica 27.16 Mediterráneo (6) 5 6*

61 Italia 40.62 Templado (8) 6 8**

PAÍSES ÁREA CENTROAMERICANA

49 Guatemala 21.39 Tropical (5) 5 5

35 Salvador 20.05 Tropical (5) 5 5

51 Honduras 19.14 Tropical (5) 5 5

74 Nicaragua 12.01 Tropical (5) 5 5

81 Panama 23.52 Tropical (5) 5 5

Page 25: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

Resultados de la clasificacióna

Clima predominante Grupo de pertenencia pronosticado Total

tropical mediterráneo templado

Original

Recuento

tropical 23 4 1 28

mediterráneo 2 2 2 6

templado 4 1 17 22

Casos desagrupados 8 3 7 18

%

tropical 82.1 14.3 3.6 100.0

mediterráneo 33.3 33.3 33.3 100.0

templado 18.2 4.5 77.3 100.0

Casos desagrupados 44.4 16.7 38.9 100.0

a. Clasificados correctamente el 75.0% de los casos agrupados originales.

Conclusiones:

Se observa que el porcentaje de aciertos clasificados correctamente para el

modelo eliminando la variable Log (10) POBLAC es del 75.0 %, en

comparación con el modelo donde se incluía la variable Log (10) POBLAC en

el cual el cómo resultados de clasificados correctamente era de 73.2%. lo que

indica que el modelo es correcto y que el proceso de eliminación de la variable

escogida en el análisis de fiabilidad es aceptable y justifica el uso, ya que el los

clasificados correctamente son mayores 75% > 73.2% del modelo 2 con el

modelo 1 respectivamente.

Page 26: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

21

7. BIBLIOGRAFÍA

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/mat

eriales/analisis_datosyMultivariable/23discr_SPSS.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/AMult/tema6am.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.youtube.com/watch?v=DCez9jrmohw

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.aulafacil.com/spss-avanzado/curso/Lecc-10.htm

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.google.com.gt/url?sa=t&rct=j&q=&esrc=s&source=web&cd=5&ve

d=0CEEQFjAE&url=http%3A%2F%2Frevistes.ub.edu%2Findex.php%2FREIR

E%2Farticle%2Fdownload%2F6210%2F8164&ei=vQSAU9CdE-

HgsAS5hIHABA&usg=AFQjCNF4Xun7reWYMm2oSu1UiAFp5DVmUA

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/AD10_11_Discri

minante.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/SPSS_discriminan

te.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACI

ON/DISCRIMINANTE/analisis-discriminante.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/e

s/client/Manuals/IBM_SPSS_Statistics_Base.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.sibiup.up.ac.pa/otrosenlaces/tecnociencias/Vol.%207%281%29/Tec

nociencia%20Articulo%201%207%281%29%2005.pdf

Banco Central de Costa Rica. (Mayo de 2014). Google. Recuperado el Mayo de

2014, de

Page 27: Análisis discriminante SPSS

“ANÁLISIS DISCRIMINANTE SPSS”

22

http://www.bccr.fi.cr/investigacioneseconomicas/sistemafinanciero/La_tecnica_

analisis_discriminante,_aplicacion_area_bancaria.pdf

Garnica, E., zález, P. M., & Días de Pascual, A. (Mayo de 2014). oogle.

Recuperado el Mayo de 2014, de

http://iies.faces.ula.ve/Revista/Articulos/Revista_06/Pdf/Rev6GarnicaO.pdf

IBM SPSS Statistics Base 20. (Mayo de 2014). Google. Recuperado el Mayo de

2014, de

ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/e

s/client/Manuals/IBM_SPSS_Statistics_Base.pdf

Manzano Aldás, J. (Mayo de 2014). Google. Recuperado el Mayo de 2014, de

http://wwwyyy.files.wordpress.com/2013/03/anc3a1lisis-discriminante.pdf

Mures Quintana, J. M., García Vallejo, A., & Vallejo Pascual, E. M. (Mayo de

2014). Google. Recuperado el Mayo de 2014, de

file:///C:/Users/DELL/Downloads/DialnetAplicacionDelAnalisisDiscriminanteY

RegresionLogist-1281700%20(1).pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/AD10_11_Discri

minante.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.uam.es/personal_pdi/ciencias/ajustel/docencia/ad/SPSS_discriminan

te.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACI

ON/DISCRIMINANTE/analisis-discriminante.pdf

(Mayo de 2014). Recuperado el Mayo de 2014, de

ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/e

s/client/Manuals/IBM_SPSS_Statistics_Base.pdf

Pérez López, C. (2004). Técnicas de Análisis Multivariante de Datos. Madrid:

PEARSON EDUCACIÓN, S. A.