analisis multivariante 2012

16
Servicio de asesoría y resolución de ejercicios [email protected] www.maestronline.com Pide una cotización a nuestros correos. Maestros Online Análisis multivariante Apoyo en ejercicios Servicio de asesorías y solución de ejercicios [email protected]

Upload: maestros-en-linea

Post on 26-Jul-2015

102 views

Category:

Education


3 download

TRANSCRIPT

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Pide una cotización a nuestros correos.

Maestros Online

Análisis

multivariante

Apoyo en

ejercicios

Servicio de asesorías y solución de ejercicios

[email protected]

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Problema 3. Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensión.

Las variables son: Y: presión arterial media (mmHg), X1: edad (años), X2: peso (kg), X3: área superficie corporal m2, X4: duración de la hipertensión (años), X5: pulso básico (latidos/min), X6: índice de estrés:

Paciente Y X1 X2 X3 X4 X5 X6

1 2 3 4 5

105 115 116 117 112

47 49 49 50 51

85.4 94.2 95.3 94.7 89.4

1.75 2.10 19.8 2.01 1.89

5.1 3.8 8.2 5.7 7.0

63 70 72 73 72

33 14 10 99 98

6 7 8 9

10

121 121 110 110 114

48 49 47 49 48

99.5 99.8 90.9 89.5 92.7

2.25 2.25 1.90 1.83 2.07

9.3 2.5 6.2 7.1 5.6

71 69 66 69 64

10 42 8

62 35

11 12 13 14 15

114 115 114 106 125

47 49 50 45 52

64.4 94.1 91.6 87.1

101.3

2.07 1.98 2.05 1.92 2.19

5.3 5.6

10.2 5.6 10.

74 71 68 67 76

90 21 47 80 98

16 17 18 19 20

114 106 113 110 122

46 46 46 48 56

94.5 87.0 94.5 90.5 95.7

1.98 1.87 1.90 1.88 2.09

7.4 3.6 4.3 9.0 7.0

69 62 70 71 75

95 18 12 99 99

a. Encontrar el análisis de regresión simple entre la presión arterial media y la edad a fin de determinar la ecuación lineal que la rige.

b. ¿Qué presión arterial se espera para una persona que tiene 51 años? c. ¿Qué edad se espera que tenga una persona con presión arterial media de

111? d. Encuentra la matriz de correlación de todas las variables y determina qué par

de variables presentan una mayor correlación. e. Determina el modelo lineal de los datos anteriores mediante el análisis de

regresión múltiple. f. Encuentra el coeficiente de determinación múltiple R2e interpreta el análisis

de varianza que presentan tus resultados.

Problema 4. Para los mismos datos:

Aplica el análisis factorial y presenta:

Matriz de correlación y aplica análisis de componentes Realiza todas las pruebas para determinar el número de factores necesarios:

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

o Valores propios o Porcentaje de varianza o Diagrama de sedimentación

¿Es clara la selección del número de factores? Explica. ¿Cuál es la cantidad adecuada de factores?

o Interpreta los factores extraídos. o Si tuvieras variables sustitutas, ¿cuáles escogerías? o Examina el ajuste del modelo y determina si el análisis factorial es la

mejor técnica para tratar estos datos.

Instrucciones:

Problema 1. Una empresa distribuidora de vinos tiene interés en encontrar clasificación de distintos productos a fin de poder diversificar y especializar su mercado. Hace un estudio de composición de los vinos a fin de determinar de acuerdo a sus características qué ofrecer y a qué tipo de público. Los valores que midió son los siguientes:

Tipo de vino: A, B, o C (según la región) Alcohol Ácido Málico (ácido orgánico de la uva) Cenizas Flavonoides: antioxidantes Fenoles no flavonoides: antioxidantes Intensidad de color

Tipo Alcohol Ácido Málico

Cenizas flavonoides Fenoles no flavonoides

Intensidad color

A 14.21 4.04 2.44 2.65 0.3 5.24

A 14.38 3.59 2.28 3.17 0.27 4.9

A 13.9 1.68 2.12 3.39 0.21 6.1

A 14.1 2.02 2.4 2.92 0.32 6.2

A 13.94 1.73 2.27 3.54 0.32 8.9

A 13.05 1.73 2.04 3.27 0.17 7.2

A 13.83 1.65 2.6 2.99 0.22 5.6

A 13.82 1.75 2.42 3.74 0.32 7.05

B 13.49 1.66 2.24 1.84 0.27 3.74

B 12.99 1.67 2.6 2.89 0.21 3.35

B 11.96 1.09 2.3 2.14 0.13 3.21

B 11.66 1.88 1.92 1.57 0.34 3.8

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

B 13.03 0.9 1.71 2.03 0.24 4.6

B 11.84 2.89 2.23 1.32 0.43 2.65

B 12.33 0.99 1.95 1.85 0.35 3.4

C 12.53 5.51 2.64 0.6 0.63 5

C 13.49 3.59 2.19 0.48 0.58 5.7

C 12.84 2.96 2.61 0.6 0.53 4.92

C 12.93 2.81 2.7 0.5 0.53 4.6

C 13.36 2.56 2.35 0.5 0.37 5.6

C 13.52 3.17 2.72 0.52 0.5 4.35

C 13.62 4.95 2.35 0.8 0.47 4.4

Utiliza como variable de agrupación el lugar de procedencia del vino, es decir, el tipo de vino.

1. ¿Qué variable, de acuerdo a la agrupación realizada, tiene más peso en la composición del vino?

2. Analizando la tabla del resumen de datos, ¿cómo puedes identificar si hay diferencia entre los distintos grupos con respecto a los parámetros?

3. Identifica, mediante el examen de medias, si las medias son estadísticamente iguales para ambos grupos.

4. Analiza los valores de la λ de Wilks para los datos solos y posteriormente para los datos agrupados junto con su transformación en chi cuadrada. A partir de los resultados, indica el nivel de significancia del análisis.

5. De acuerdo a la matriz de correlaciones agrupadas, identifica si hay alguna que presente correlación con alguna otra variable.

6. Ahora realiza la interpretación de datos. Puedes utilizar las cargas canónicas, los coeficientes estandarizados o los no estandarizados, o los signos de los centroides, para hacerlo.

7. Finalmente, comenta la validez del análisis discriminante y menciona el % de validez que hay en los datos agrupados originales.

8. Arma la función discriminante para el modelo en particular. 9. Elabora tus conclusiones respecto a lo que podría hacer el distribuidor de

vinos con esta información.

Problema 2. Para determinar aspectos significativos de selección de vino l, se realizó una encuesta en la que se consideraron los siguientes parámetros a calificar:

Tipo: blanco (1), rosado (2), tinto (3). Tamaño: 250ml (1), 750 ml (2), 1500 ml (3). Cantidad de azúcares: seco (1), semiseco (2), dulce (3). Edad: sin crianza (1), crianza (2), reserva (3), gran reserva (4).

Aun cuando las combinaciones que resultan son más, se tomaron solamente 9, las cuales se determinó que eran las más significativas para la tarjeta de encuesta, presentada a continuación:

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Tarjeta (PREF)

Tipo Tamaño Azúcares Edad

1 2 3 4 5 6 7 8 9

Blanco Blanco Blanco Blanco Rosado Rosado

Tinto Tinto Tinto

250 ml 750 ml 750 ml 1500 ml 750 ml 750ml 250 ml 750 ml 1500 ml

Seco Semiseco

Seco Dulce Seco

Semiseco Seco

Semiseco Dulce

Gran reserva Reserva Reserva

Sin crianza Crianza Reserva Crianza Reserva

Gran reserva

Se presenta la tarjeta con las 9 combinaciones a diferentes personas que pretenden consumir vino, a fin de que ordenen sus preferencias. Las respuestas se presentan en la siguiente tabla:

ENCUESTA

PREF 1

PREF 2

PREF 3

PREF 4

PREF 5

PREF 6

PREF 7

PREF 8

PREF 9

1 7 8 5 9 6 4 2 1 3

2 6 9 7 8 5 2 1 4 3

3 9 7 6 8 5 4 3 1 2

4 6 9 5 8 7 3 2 1 4

5 7 8 6 9 5 4 1 2 3

6 6 9 7 8 5 4 2 3 1

7 5 8 6 7 9 2 1 3 4

8 6 9 5 7 8 4 2 1 3

9 9 8 5 7 6 1 3 2 4

10 8 9 6 7 5 2 1 3 4

11 7 8 9 5 6 3 2 1 4

12 7 9 8 6 5 2 1 4 3

13 9 7 8 5 6 3 2 1 4

14 8 9 7 2 5 6 1 3 4

15 9 6 8 7 5 4 2 1 3

16 8 9 5 6 7 2 1 3 4

17 9 7 8 6 5 4 2 1 3

18 6 9 8 7 4 5 1 2 3

19 9 7 5 8 6 4 2 1 3

20 8 7 6 9 5 3 4 2 1

a. Utiliza SPSS y elabora un archivo PLAN con los datos de la primera tabla (tarjeta de encuesta) y un archivo de preferencias con la segunda tabla (respuestas de la encuesta aplicada).

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

b. Utiliza el código que se explica en el tema 7: “Análisis conjunto I”, a fin de determinar los parámetros que describen el análisis conjunto.

Interpreta los resultados.

Problema 1. Se realizó un estudio acerca de la duración de dolores de cabeza tipo migraña y su duración en horas por semana medida durante cinco semanas cuando se da tratamiento al enfermo. La variable dependiente es la duración de los dolores de cabeza medida cinco veces.

Los datos cambian mucho más en la semana 1 y 2 que en el resto.

semana1 semana2 semana3 semana4 semana5 promedio

21 22 8 6 6 12.6

20 19 10 4 9 12.4

7 5 5 4 5 5.2

25 30 13 12 4 16.8

30 33 10 8 6 17.4

19 27 8 7 4 13

26 16 5 2 5 10.8

13 4 8 1 5 6.2

26 24 14 8 17 17.8

a. Encuentra la matriz de correlación de todas las semanas a fin de ver si existe alguna relación entre ellas.

b. Determina si existe alguna correlación entre los datos de: semana1 – semana 3, semana1 – semana5, semana3 – semana5.

c. Encuentra el modelo lineal que determine la duración de dolor de cabeza de acuerdo al número de semanas de tratamiento.

Problema 2. En un experimento agrícola se busca identificar diferencias de siembra de maíz mediante el uso de 3 tipos de fertilizante. La producción de búshels por acre son los siguientes:

Variedad

Fertilizante A B C D

1 2 3

86 92 75

88 91 80

77 81 83

84 93 79

a. ¿Puede pensarse que cualquier de los fertilizantes produce un resultado equivalente?

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

b. Interpretar los resultados.

Problema 3. Un psicólogo está trabajando con tres tipos de pruebas de aptitud que se aplican a trainees que trabajarán en la Bolsa Mexicana de Valores. Se aplican las tres pruebas a personas que están agrupadas de acuerdo a su sociabilidad que se distingue como poca, regular, buena y muy buena y que se obtuvo de entrevistas previas. Los resultados son los siguientes:

Tipo de prueba

Sociabilidad Ajusta al perfil Adaptable Estabilidad

Poca Regular Buena

Muy buena

65 74 64 89

68 79 72 82

62 76 65 84

69 72 68 78

71 69 73 78

67 69 75 75

75 70 78 76

75 69 82 77

78 65 80 75

Determinar con un nivel de confianza del 95% si existe alguna diferencia entre la sociabilidad y los resultados en las pruebas.

Actividad integradora 4

Instrucciones:

En la revista Anthrozoös el Dr. Wuensch y su equipo hicieron un estudio para medir actitudes acerca de los derechos de los animales y la experimentación en animales mediante un cuestionario de 28 preguntas con cinco opciones cada una (1 = totalmente en desacuerdo, 5 = totalmente de acuerdo). Para este trabajo utilizaremos solo las primeras 15 preguntas a fin de no hacer un estudio demasiado complicado y los terceros 30 encuestados.

Se presentan las 15 primeras preguntas del cuestionario:

1. Los humanos no tienen derecho a desplazar animales salvajes para convertir los espacios en granjas, sitios de pastoreo, ciudades, carreteras, etc.

2. La investigación en animales no tiene justificación y debe detenerse. 3. Es moralmente incorrecto beber leche y comer huevo. 4. Un humano no tiene derecho a utilizar un caballo como medio de transporte

ni entretenimiento. 5. Es incorrecto utilizar atuendos hechos con piel. 6. La mayoría de la investigación médica hecha en animales es innecesaria y

no válida. 7. He pensado seriamente convertirme en vegetariano a fin de salvar vidas

animales. 8. Los propietarios de mascotas son responsables de prevenir que sus

mascotas maten otras especies (gatos que matan ratones, serpientes que comen ratones vivos).

9. Necesitamos más regulaciones por parte del gobierno en el uso de investigación en animales.

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

10. Es moralmente incorrecto comer res y otras carnes ‘rojas’. 11. Las plagas (mosquitos, moscas, cucarachas, etc.) deben ser retiradas del

hogar más que exterminadas. 12. Los animales deben tener los mismos derechos que los humanos. 13. Es incorrecto utilizar cinturones de piel y zapatos de piel. 14. Prefiero que mueran o sufran de enfermedades los humanos a que se

investigue en animales la cura y tratamiento de dichas enfermedades. 15. Ya que se han extendido los derechos humanos hacia las mujeres y las

minorías, se deben extender también hacia los animales.

Además en la columna sexo se tiene (1 = mujer, 2 = hombre)

Revisado en: http://core.ecu.edu/psyc/wuenschk/Animals/Anim-Rights-Q.htm el 7 de diciembre de 2010 y publicado en: Wuensch, K. L., Jenkins, K. W., & Poteat, G. M. (Misanthropy, idealism, and attitudes towards animals. Anthrozoös, 2002, 15, 139-149)

P 1 P 2 P 3 P 4 P 5 P 6 P 7 P 8 P 9 P 10 P 11 P 12 P 13 P 14 P 15 sexo

3 2 2 2 2 4 2 2 4 2 4 2 2 2 2 1

2 2 1 2 2 2 2 1 2 1 1 1 1 1 1 2

4 2 1 3 2 2 1 2 4 2 1 3 2 1 4 1

3 4 2 3 2 4 3 2 5 3 3 3 2 2 3 1

2 2 1 1 1 2 1 2 4 1 3 1 1 1 2 1

4 2 1 2 2 2 1 4 4 1 2 1 2 1 2 1

3 3 1 1 2 2 1 3 4 1 1 1 1 1 1 1

4 3 1 2 2 2 2 3 3 2 4 3 2 1 2 1

2 2 1 1 1 2 2 2 2 1 1 2 1 1 2 1

2 2 1 2 2 2 2 2 2 2 1 2 2 1 2 1

4 5 1 2 2 2 2 4 5 2 3 1 2 2 3 1

3 1 1 1 1 1 3 2 3 1 1 2 1 3 3 1

2 1 1 1 1 2 5 3 2 2 1 1 1 2 2 1

3 3 2 2 3 2 3 3 4 2 3 3 2 3 3 1

4 2 4 1 2 2 2 3 3 2 3 3 2 3 3 1

4 4 2 2 3 4 2 2 5 2 3 4 3 1 3 1

3 3 1 2 2 2 2 3 4 2 2 2 2 1 2 1

2 1 2 2 2 3 1 1 3 1 1 1 2 1 1 2

2 2 1 1 1 3 3 5 3 1 1 3 1 1 1 1

2 1 1 1 1 1 2 1 1 1 1 2 1 1 2 1

4 2 1 2 1 2 1 1 4 1 3 2 1 1 2 2

2 2 2 2 4 2 5 4 5 3 2 4 2 1 3 1

4 2 1 1 1 1 1 1 2 1 2 2 1 1 1 1

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

3 2 1 2 1 2 2 2 3 2 4 3 2 1 3 1

3 3 1 2 2 3 2 2 4 1 1 3 2 2 2 1

4 2 2 3 2 2 3 2 4 2 2 3 2 2 4 1

4 3 2 1 2 2 2 2 3 2 2 3 2 2 3 1

2 2 1 1 2 1 2 1 2 1 2 2 2 1 1 2

5 2 2 2 5 4 1 4 2 4 4 3 3 3 2

2 2 2 2 2 3 1 1 3 2 1 2 2 2 2 1

a. Analiza los datos a fin de identificar si hay alguna forma de agruparlos de acuerdo a las respuestas proporcionadas.

b. Identifica si entre los encuestados hay alguna forma de agruparlos de acuerdo a uso de animales o la investigación en animales.

c. Realiza los siguientes análisis por conglomerado: i. Procedimiento de enlace ii. Procedimiento de k-medias con 2 o 3 grupos

d. Encuentra:

i. la matriz de distancia ii. el historial del conglomerado

iii. el conglomerado de pertenencia iv. el diagrama de témpano y el v. dendograma a fin de hacer tu análisis completo

e. Presenta las conclusiones argumentando con tus resultados.

Envía la actividad a tu tutor, en formato de reporte.

Instrucciones

Entrega a tu profesor el proyecto final, el cual debe contener lo siguiente:

Copia del enunciado de cada problema. Especificación del método multivariante aplicado por problema y

justificación de su selección. Solución del problema por el método multivariante que se seleccionó. Interpretación de los resultados.

Para cada uno de los problemas que se te presentan a continuación, se debe aplicar alguna técnica multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente.

1. McDonald’s es un restaurante de comida rápida que ha incursionado en el mercado de ensaladas. Las ensaladas que ofrece son las siguientes: César, Ranch, Diosa Verde y Rusa. Se probó en 14 restaurantes, durante 14 días, a fin de ver la respuesta de los clientes y los datos encontrados se presentan a continuación:

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Día César Ranch Diosa Verde

Rusa

1 2 3 4 5 6 7

155 157 151 146 181 160 168

143 146 141 136 180 152 157

149 152 146 141 173 170 174

135 136 131 126 115 150 147

8 9 10 11 12 13 14

157 139 144 158 184 161 165

167 159 154 169 195 177 178

141 129 167 145 178 201 185

130 119 134 144 177 151 160

a. Determina si existe alguna diferencia significativa entre las preferencias de los consumidores hacia alguna ensalada.

2. En el análisis taxonómico de las flores para distinguir sus distintas especies se toma en cuenta cinco aspectos: longitud de los sépalos, anchura de los sépalos, longitud de los pétalos y anchura de los pétalos y su especie. Se desea probar si las cuatro variables (longitud sépalo, ancho sépalo, longitud pétalo y ancho pétalo) presentadas permiten identificar la especie en cuestión (visualizar los datos de forma gráfica para comprobar si están correctamente diferenciadas). Se toma una muestra de 50 observaciones que se presentan a continuación:

OBS Long

sépalo Ancho sépalo

Long pétalo

Ancho pétalo

Especie

Obs1 50 33 14 2 Setosa

Obs2 64 28 56 22 Virginica

Obs3 65 28 46 15 Versicolor

Obs4 67 31 56 24 Virginica

Obs5 63 28 51 15 Virginica

Obs6 46 34 14 3 Setosa

Obs7 69 31 51 23 Virginica

Obs8 62 22 45 15 Versicolor

Obs9 59 32 48 18 Versicolor

Obs10 46 36 10 2 Setosa

Obs11 61 30 46 14 Versicolor

Obs12 60 27 51 16 Versicolor

Obs13 65 30 52 20 Virginica

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Obs14 56 25 39 11 Versicolor

Obs15 65 30 55 18 Virginica

Obs16 58 27 51 19 Virginica

Obs17 68 32 59 23 Virginica

Obs18 51 33 17 5 Setosa

Obs19 57 28 45 13 Versicolor

Obs20 62 34 54 23 Virginica

Obs21 77 38 67 22 Virginica

Obs22 63 33 47 16 Versicolor

Obs23 67 33 57 25 Virginica

Obs24 76 30 66 21 Virginica

Obs25 49 25 45 17 Virginica

Obs26 55 35 13 2 Setosa

Obs27 67 30 52 23 Virginica

Obs28 70 32 47 14 Versicolor

Obs29 6 32 45 15 Versicolor

Obs30 61 28 40 13 Versicolor

Obs31 48 31 16 2 Setosa

Obs32 59 30 51 18 Virginica

Obs33 55 24 38 11 Versicolor

Obs34 63 25 50 19 Virginica

Obs35 64 32 53 23 Virginica

Obs36 52 34 14 2 Setosa

Obs37 49 36 14 1 Setosa

Obs38 54 30 45 15 Versicolor

Obs39 79 38 64 20 Virginica

Obs40 44 32 13 2 Setosa

Obs41 67 33 57 21 Virginica

Obs42 50 35 16 6 Setosa

Obs43 58 26 40 12 Versicolor

Obs44 44 30 13 2 Setosa

Obs45 77 28 67 20 Virginica

Obs46 63 27 49 18 Virginica

Obs47 47 32 16 2 Setosa

Obs48 55 26 44 12 Versicolor

Obs49 50 23 33 10 Versicolor

Obs50 72 32 60 18 Virginica

Datos tomados de Fisher M. (1936). “The Use of Multiple Measurements in Taxonomic Problems”, Annals of Eugenics, 7, pp. 179 – 188).

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Para contestar lo anterior (subrayado) se te sugiere:

a. Encontrar la matriz de correlación entre las variables. b. Realizar un análisis de regresión múltiple a fin de determinar el modelo lineal

que permita explicar los datos. c. Hacer el análisis de varianza correspondiente de la muestra completa e

interpretar. d. Hacer el análisis discriminante e interpretar.

3. La empresa Kimberly-Clark es líder en el mercado de la industria de los pañales desde 1960 que inició en este campo. A la fecha vende más de 3500 millones de dólares, únicamente en Estados Unidos. Los atributos principales en la fabricación de pañales son los siguientes:

Estilo: estampado/ color, blanco. Absorbencia: regular, superabsorbente. Cierre: cinta normal, cinta resellable. Escurrimiento: regular, antiescurrimiento.

b. Diseña los 16 perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo.

4. Los siguientes datos corresponden a personas que pertenecen a una comunidad en donde se realizaron distintas medidas físicas a fin de determinar si existe diferencia entre las medidas de hombres y mujeres. Responde lo siguiente:

a. ¿Qué análisis multivariante aplicarías? ¿Por qué? b. Aplica el análisis que mencionaste en el inciso ‘a’ a los datos e

interpreta los resultados. c. Identifica si hay alguna relación entre las medidas del cuerpo e

interprétalas.

Sexo Estatura Peso Pie Largo brazo

Ancho espalda

Diámetrocráneo Distancia rodilla - tobillo

1 0.00 159.00 49.00 36.00 68.00 42.00 57.00 40.00

2 1.00 164.00 62.00 39.00 73.00 44.00 55.00 44.00

3 0.00 172.00 65.00 38.00 75.00 48.00 58.00 44.00

4 0.00 167.00 52.00 37.00 73.00 41.50 58.00 44.00

5 0.00 164.00 51.00 36.00 71.00 44.50 54.00 40.00

6 0.00 161.00 67.00 38.00 71.00 44.00 56.00 42.00

7 0.00 168.00 48.00 39.00 72.50 41.00 54.50 43.00

8 1.00 181.00 74.00 43.00 74.00 50.00 60.00 47.00

9 1.00 183.00 74.00 41.00 79.00 47.50 59.50 47.00

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

10 0.00 158.00 50.00 36.00 68.50 44.00 57.00 41.00

11 0.00 156.00 65.00 36.00 68.00 46.00 58.00 41.00

12 1.00 173.00 64.00 40.00 79.00 48.00 56.50 47.00

13 0.00 158.00 43.00 36.00 68.00 43.00 55.00 39.00

14 1.00 178.00 74.00 42.00 75.00 50.00 59.00 45.00

15 1.00 181.00 76.00 43.00 83.00 51.00 57.00 43.00

16 1.00 182.00 91.00 41.00 83.00 53.00 59.00 43.00

17 1.00 176.00 73.00 42.00 78.00 48.00 58.00 45.00

18 0.00 162.00 68.00 39.00 72.00 44.00 59.00 42.00

19 0.00 156.00 52.00 36.00 67.00 36.00 56.00 41.00

20 0.00 152.00 45.00 34.00 66.00 40.00 55.00 38.00

21 1.00 181.00 80.00 43.00 76.00 49.00 57.00 46.00

22 1.00 173.00 69.00 41.00 74.00 48.00 56.00 44.00

23 0.00 155.00 53.00 36.00 67.00 43.00 56.00 38.00

24 1.00 189.00 87.00 45.00 82.00 53.00 61.00 52.00

25 0.00 170.00 70.00 38.00 73.00 45.00 56.00 43.00

26 1.00 170.00 67.00 40.00 77.00 46.50 58.00 44.50

27 0.00 168.00 56.00 37.50 70.50 48.00 60.00 40.00

5. Los datos presentados a continuación representan 21 observaciones de 8 variables que corresponden a publicaciones científicas en distintos países recogidas durante 1982 – 1984. Las variables se organizaron por área:

InterA (interdisciplinaria), InterB (interdisciplinaria), Agric. (Agricultura), Biolo. (Biología), Medic. (Medicina), Quimi. (Química), Ingen. (Ingeniería) y Física.

INTER.A INTER.B AGRIC. BIOLO. MEDIC. QUIMI. INGEN. FÍSICA

EE.UU 815319 379851 88663 58104 255864 440134 111015 162288

UK 162103 90332 35158 29802 59630 92725 6409 34349

JP 105856 78811 13978 16758 55634 308926 32039 40538

F 118935 76186 13818 11253 49938 120065 9984 35792

G 91099 85037 11740 20337 41233 66087 11304 22093

C 72722 49459 14041 16722 23139 101900 12034 14645

I 42905 29734 7904 13444 31078 36322 5833 11351

A 36121 22236 12419 9863 12186 19641 4898 6299

H 29912 18036 6563 7548 13721 23029 3798 6775

S 28568 16190 3985 9502 14852 18341 2387 3549

CH 26495 14518 3378 3636 11096 19304 2556 5784

E 16425 11818 3089 3981 7196 15493 1258 2692

B 17311 11791 3240 4011 8098 11964 1772 3417

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

D 14677 555 2635 5667 8368 14266 1197 1999

AU 10957 13154 1433 2372 5928 6713 1318 2278

FI 11012 6457 2028 4756 5731 6647 1001 1669

N 9075 5432 1803 3299 4801 5326 912 853

Y 4686 2957 2031 1194 1806 7046 801 1861

GR 3720 2749 692 1293 1518 2415 896 1366

IR 6786 214 432 1119 1355 98 522 941

P 1221 1929 388 386 564 12 493 413

a. Identifica si existe redundancia entre los datos, es decir, si podemos reducir el número de variables para explicar el comportamiento de los datos.

b. Identifica si existe correlación entre las distintas disciplinas y si puedes generar un modelo lineal para el conjunto de datos.

6. Una importante empresa financiera quiere ganar el liderazgo en el manejo de tarjetas de crédito para lo cual busca elaborar un conjunto de perfiles de tarjeta y presentarlo a clientes para conocer sus preferencias. Las características a valorar son las siguientes:

Tasa de interés: baja, media, alta Puntos por uso: sí, no Cargo anual: cero, $200, $400

Diseña el total de perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo. Algunos atributos son incompatibles (por ejemplo: a tarjetas que tienen tasa de interés baja no se les dan puntos por uso o por ejemplo si la tarjeta tiene cargo anual cero generalmente presenta tasa anual media o alta, o en una tarjeta con cargo anual alto y puntos puede tener tasa de interés baja -¿por qué?-). Determina los perfiles que sería conveniente presentar a los clientes en el diseño de esta nueva tarjeta de crédito.

7. La siguiente tabla pertenece a un grupo de datos constituido por 26 observaciones y 9 variables que corresponden a porcentaje de empleo en los distintos sectores en países europeos. Los sectores son los siguientes:

Agr: agricultura Min: minería Man: manufactura Ene: energía Con: construcción SI: servicios industriales Fin: finanzas Ser: servicios TC: transporte y comunicaciones

Fuente: Euromonitor (1979).

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Agr Min Man Ene Con SI Fin Ser TC

Alemania del E. 4.20 2.90 41.20 1.30 7.60 11.20 1.20 22.10 8.40

Alemania del O. 6.70 1.30 35.80 0.90 7.30 14.40 5.00 22.30 6.10

Austria 12.70 1.10 30.20 1.40 9.00 16.80 4.90 16.80 7.00

Bélgica 3.30 0.90 27.60 0.90 8.20 19.10 6.20 26.60 7.20

Bulgaria 23.60 1.90 32.30 0.60 7.90 8.00 0.70 18.20 6.70

Checoeslovaquia 16.50 2.90 35.50 1.20 8.70 9.20 0.90 17.90 7.00

Dinamarca 9.20 0.10 21.80 0.60 8.30 14.60 6.50 32.20 7.10

España 22.90 0.80 28.50 0.70 11.50 9.70 8.50 11.80 5.50

Finlandia 13.00 0.40 25.90 1.30 7.40 14.70 5.50 24.30 7.60

Francia 10.80 0.80 27.50 0.90 8.90 16.80 6.00 22.60 5.70

Grecia 41.40 0.60 17.60 0.60 8.10 11.50 2.40 11.00 6.70

Hungría 21.70 3.10 29.60 1.90 8.20 9.40 0.90 17.20 8.00

Irlanda 23.20 1.00 20.70 1.30 7.50 16.80 2.80 20.80 6.10

Italia 15.90 0.60 27.60 0.50 10.00 18.10 1.60 20.10 5.70

Luxemburgo 7.70 3.10 30.80 0.80 9.20 18.50 4.60 19.20 6.20

Noruega 9.00 0.50 22.40 0.80 8.60 16.90 4.70 27.60 9.40

Países Bajos 6.30 0.10 22.50 1.00 9.90 18.00 6.80 28.50 6.80

Polonia 31.10 2.50 25.70 0.90 8.40 7.50 0.90 16.10 6.90

Portugal 27.80 0.30 24.50 0.60 8.40 13.30 2.70 16.70 5.70

Reino Unido 2.70 1.40 30.20 1.40 6.90 16.90 5.70 28.30 6.40

Rumania 34.70 2.10 30.10 0.60 8.70 5.90 1.30 11.70 5.00

Suecia 6.10 0.40 25.90 0.80 7.20 14.40 6.00 32.40 6.80

Suiza 7.70 0.20 37.80 0.80 9.50 17.50 5.30 15.40 5.70

Turquía 66.80 0.70 7.90 0.10 2.80 5.20 1.10 11.90 3.20

USSR 23.70 1.40 25.80 0.60 9.20 6.10 0.50 23.60 9.30

Yugoslavia 48.70 1.50 16.80 1.10 4.90 6.40 11.30 5.30 4.00

a. Analiza la tabla de datos anterior por el método de conglomerados de acuerdo con las siguientes técnicas:

i. Jerárquico enlace único (vecino más cercano) ii. Jerárquico procedimiento de centroide

iii. Técnica de Ward

b. Analiza por el método de dos pasos para tratar de encontrar entre 3 y 5 grupos conglomerados bien identificados.

c. Interpreta y analiza cada grupo de resultados a fin de identificar qué cantidad de conglomerados es óptima y cuál es el parámetro que conglomera los datos. Utiliza dendograma o los gráficos que requieras a fin de aclarar tus respuestas.

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com