sistemas de soporte para la toma de decisiones

22
Producción Industrial SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

Upload: keaton-austin

Post on 01-Jan-2016

47 views

Category:

Documents


0 download

DESCRIPTION

SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES. Producción Industrial. IR a Estadistica_ANOVA_Un solo Factor_Desapilado Respuestas en columnas Separadas A B C Nivel de Confianza: 95 Comparaciones: Tukey Tasa de error por familia - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

Producción Industrial

SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

Page 2: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

2

Análisis de varianza (ANOVA)

El Análisis de Varianza es una prueba de hipótesis que trata de probar la igualdad de varias medias al mismo tiempo:

Requiere que las poblaciones sean normales y con varianza similar.

ANOVA de una vía con datos de tratamientos en diferentes columnas:

Ejemplo: Los técnicos de una fábrica de papel hacen un experimento de un factorpara ver que variedad de árbol produce menos fenoles en los desechos de pasta depapel. Se colectan los siguientes datos en porcentajes:A un 95% de nivel de confianza, ¿hay alguna variedad que produzca más fenoles que otra?

Se colocan los datos en tres columnas distintas:

kH ....3210

.:1 diferentessonmediasdosmenosAlH

Page 3: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

3

Instrucciones de Minitab:Stat > ANOVA > One Way (Unstacked)

OK

IR aEstadistica_ANOVA_Un solo Factor_DesapiladoRespuestas en columnas Separadas A B CNivel de Confianza: 95Comparaciones: Tukey Tasa de error por familiaGráficos: Diagrama de Cajas de Datos y Gráfica Normal de Residuos OK

Page 4: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

4

Los resultados se muestran a continuación:Como el valor P value es menor

One-way ANOVA: A, B, C a 0.05 existe una diferencia significativa entre algunas medias

Source DF SS MS F PFactor 2 0.9000 0.4500 8.44 0.005Error 12 0.6400 0.0533Total 14 1.5400S = 0.2309 R-Sq = 58.44% R-Sq(adj) = 51.52%

Individual 95% CIs For Mean Based on Pooled StDevA produce más fenoles que B,CLevel N Mean StDev ----+---------+---------+---------+-----A 4 1.9000 0.1414 (-------*--------)B 5 1.3000 0.2121 (------*-------)C 6 1.4000 0.2828 (------*------) ----+---------+---------+---------+----- 1.20 1.50 1.80 2.10

Pooled StDev = 0.2309 Las medias B y C La media de A esDesviación estándar poblacional son similares diferente a B y C

Page 5: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

5

Tukey 95% Simultaneous Confidence IntervalsAll Pairwise Comparisons

Individual confidence level = 97.94% Como el cero no está en elintervalo de la diferencia B-A

A subtracted from: o C-A, A es diferente de B y C Lower Center Upper -----+---------+---------+---------+----B -1.0130 -0.6000 -0.1870 (---------*---------)C -0.8974 -0.5000 -0.1026 (---------*--------) -----+---------+---------+---------+---- -0.80 -0.40 -0.00 0.40

B subtracted from: Lower Center Upper -----+---------+---------+---------+----C -0.2728 0.1000 0.4728 (---------*--------) -----+---------+---------+---------+---- -0.80 -0.40 -0.00 0.40

El intervalo de la diferencia C-B si incluyeel cero por tanto B no es diferentes de C

Page 6: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

6

CBA

2.2

2.0

1.8

1.6

1.4

1.2

1.0

Data

Boxplot of A, B, C

Los resultados gráficos son los siguientes:

Se observa que la media de A es diferente a las medias de B y C (si se superpone B y C tienen elementos comunes y son iguales)Los árboles B y C producen menos cantidad de fenoles.

Page 7: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

7

Los resultados gráficos son los siguientes:

0.500.250.00-0.25-0.50

99

95

90

80

70

605040

30

20

10

5

1

Residual

Perc

entNormal Probability Plot

(responses are A, B, C)

Los residuos o errores se apegan a la recta normal, por tantoel modelo ANOVA es un modelo adecuado para los datos

Page 8: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

8

ANOVA de una vía con datos de tratamientos en una sola columna

Los datos del ejemplo anterior se arreglan en doscolumnas como se muestran a continuación: Fenoles Árbol

1.9 AA B C 1.8 A

1.9 1.6 1.3 2.1 A1.8 1.1 1.6 1.8 A2.1 1.3 1.8 1.6 B1.8 1.4 1.1 1.1 B

1.1 1.5 1.3 B1.1 1.4 B

1.1 B1.3 C1.6 C1.8 C1.1 C1.5 C1.1 C

Page 9: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

9

Instrucciones de Minitab:Estadistica> ANOVA > Un solo Factor

Respuestas Fenoles Factor Árbol Nivel deConfidanzal 95Comparaciones Tukey's, : 5Graficos: Residuos De cajas y Normal de ResiduosOK

Los resultados que se obtienen son iguales a los ejemplo anterior.

Page 10: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

10

Ejercicios:Las calificaciones de un curso de liderazgo para 18 participantes de tres diferentes departamentos fueron las mostradas en la tabla siguiente. Probar a un 95% de nivel de confianza o 5% de nivel de significancia si el aprovechamiento fue similar en los tres departamentos

o en su caso cuál fue el peor.

DEPARTAMENTO Arreglados en dos columnas quedan como:Depto_A Depto_B Depto_C Calificaciones Depto

8 7 5 8 Depto_A7 8 6 7 Depto_A8 7 6 8 Depto_A6 7 7 6 Depto_A7 6 7 7 Depto_A8 8 6 8 Depto_A

7 Depto_B8 Depto_B7 Depto_B7 Depto_B6 Depto_B8 Depto_B5 Depto_C6 Depto_C6 Depto_C7 Depto_C7 Depto_C6 Depto_C

Page 11: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

Curso básico de Minitab

Estadística no paramétrica

11

Page 12: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

Curso básico de Minitab

Regresión lineal y cuadrática

12

Page 13: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

13

Correlación y Regresión lineal y cuadrática simple

Coeficiente de Correlación

Establece si existe una relación entre las variables y responde a la pregunta,”¿Qué tan evidente es esta relación?".

La correlación es una prueba fácil y rápida para eliminar factores que no influyen en la predicción, para una respuesta dada.

* Es una medida de la fuerza de la relación lineal entre dos variables x y y.* Es un número entre -1 y 1* Un valor positivo indica que cuando una variable aumenta, la otra variable aumenta* Un valor negativo indica que cuando una variable aumenta, la otra disminuye* Si las dos variables no están relacionadas, el coeficiente de correlación tiende a 0.

Page 14: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

14

Correlación PositivaEvidente

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

Correlación NegativaEvidente

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

CorrelaciónPositiva

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

CorrelaciónNegativa

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

Sin Correlación

10

15

20

25

5 10 15 20 25

X

Y0

5

0

Correlación PositivaEvidente

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

Correlación NegativaEvidente

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

CorrelaciónPositiva

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

CorrelaciónNegativa

0

5

10

15

20

25

0 5 10 15 20 25

X

Y

Sin Correlación

10

15

20

25

5 10 15 20 25

X

Y0

5

0

r = 1

r = 0.8 r = -0.8

r = -1

r = 0

Page 15: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

15

Ejemplo:Se utiliza el archivo PULSE.MTW campos Peso (Weight) y Altura (Height)

Archivo > Abrir hoja de trabajo> Pulso.Mtw

Antes de calcular el coeficiente de correlación se sugiere hacer un diagramabivariante para identificar posibles valores anómalos, relaciones no lineales, etc.

Grafica > Disperción: Simple Y = Peso y X = Altura

Height

Weig

ht

767472706866646260

220

200

180

160

140

120

100

Scatterplot of Weight vs Height

Page 16: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

16

Ahora se calcula el coeficiente de Correlación que mide el grado de relación que existeentre dos variables, como sigue:

Estadistica > Estadistica Básica > CorrelacionSeleccionar en Variables Peso Altura Seleccionar Presentar Valores de p

Los resultados son los siguientes:

Correlations: Weight, Height Pearson correlation of Weight and Height = 0.785

Coeficiente de correlación

P-Value = 0.000Como el P value es menor a 0.05, la correlación si es significativa

Page 17: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

17

Curso básico de Minitab

Coeficiente de correlación

Coeficiente de correlación0.8 < r < 1.00.3 < r < 0.8-0.3 < r < 0.3-0.8 < r < -0.3-1.0 < r < -0.8

RelaciónFuerte, positivaDébil, positiva

No existeDébil, negativa

Fuerte, negativa

Reglas empíricas

Page 18: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

18

Análisis de Regresión

El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.

Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí

El análisis de regresión es un método estandarizado para localizar la correlación entre dos grupos de datos, y, quizá más importante, crear un modelo de predicción.

Puede ser usado para analizar las relaciones entre:• Una sola “X” predictora y una sola “Y”

• Múltiples predictores “X” y una sola “Y”

• Varios predictores “X” entre sí

Page 19: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

19

Modelo de regresión lineal simple

7060504030

80

75

70

65

60

55

50

Tiempo de estudio (horas)

Resu

ltados

de p

rueba (

%)

S 4.47182R-Sq 77.0%R-Sq(adj) 74.2%

Fitted Line PlotResultados de prueba (%) = 31.21 + 0.6955 Tiempo de estudio (horas)

Mínimos cuadrados

R^2 Coef. de determinación

Page 20: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

20

Regresión simple por medio de gráfica:

File > Open Worksheet > Pulse.MtwStat > Regression > Fitted line PlotSeleccionar en Response (Y) Weight y en Predictor (X) HeightSeleccionar modelo Type of Regression model LinearSel. en Graphs > Residuals Standardized > Normal Plot y Residuals vs fitsOK

Ecuación deRegresión

S Desv. Estandar delos residuos(valor real-estimadopor la regresión)

R-Sq Coeficientede Determinaciónen porcentaje de variación explicadapor la ecuación deregresión

R-Sq (Adj) - Sólo para regresión múltiple

Height

Weig

ht

767472706866646260

220

200

180

160

140

120

100

S 14.7920R-Sq 61.6%R-Sq(adj) 61.2%

Fitted Line PlotWeight = - 204.7 + 5.092 Height

Page 21: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

21

Regression Analysis: Weight versus Height

The regression equation isWeight = - 204.7 + 5.092 HeightS = 14.7920 R-Sq = 61.6% R-Sq(adj) = 61.2%

Analysis of VarianceSource DF SS MS F PRegression 1 31591.6 31591.6 144.38 0.000Error 90 19692.2 218.8Total 91 51283.9

El valor p menor a 0.05 indica que SIes significativa la Correlación de Y y X.

Page 22: SISTEMAS DE SOPORTE PARA LA TOMA DE DECISIONES

22

Análisis de los residuos

Los residuos muestran aleatoriedad Los residuos siguen una distribución normal

180170160150140130120110100

4

3

2

1

0

-1

-2

Fitted Value

Sta

nd

ard

ize

d R

esi

du

al

Versus Fits(response is Weight)

43210-1-2-3-4

99.9

99

95

90

80706050403020

10

5

1

0.1

Standardized Residual

Pe

rce

nt

Normal Probability Plot(response is Weight)