analisi de regresion

54
ANÁLISIS DE REGRESIÓN Y CORRELACIÓN NÚMEROS ÍNDICE. DISTRIBUCIÓN NORMAL Asignatura: ESTADÍSTICA GENERAL Docente: RISCO DÁVILA CARLOS Ciclo: II-Grupo B

Upload: jenilut

Post on 07-Dec-2014

111 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Analisi de Regresion

ANÁLISIS DE REGRESIÓN Y CORRELACIÓNNÚMEROS ÍNDICE. DISTRIBUCIÓN NORMAL

Asignatura: ESTADÍSTICA GENERAL

Docente:RISCO DÁVILA CARLOS

Ciclo:II-Grupo B

Page 2: Analisi de Regresion

EJERCICIOS DE REGRESIÓN LINEAL SIMPLE

1. Un estudio para valorar la capacidad de sistemas de humedecimiento de suelos mediante flujo subsuperficial para eliminar la demanda de oxígeno bioquímico (BOD) y otros constituyentes químicos dio los datos adjuntos sobre x=carga masiva de oxigeno bioquímico (Kg/ha/d) y y=eliminación masiva de oxigeno bioquímico(Kg/ha/d).

x 3 8 10 11 13 16 27 30 35 37 38 44 103 142y 4 7 8 8 10 11 16 26 21 9 31 30 75 90

Calcular: Ecuación de regresión lineal simple. Ecuación de la línea de regresión estimada. Error estándar de estimación. Coeficiente de determinación.

DIAGRAMA DE DISPERSIÓN

0 20 40 60 80 100 120 140 1600

10

20

30

40

50

60

70

80

90

100

f(x) = 0.652290200363518 x + 0.626140458004365R² = 0.955973574454454

Grafico 1. Carga & Eliminacion de BOD

Carga de BOD

Elim

inac

ion d

e BOD

Calculo de ECUACIÓN DE REGRESION LINEAL SIMPLE

ESTADÍSTICA GENERAL Página 2

Page 3: Analisi de Regresion

y=A+Bx

Por método de los mínimos cuadrados.

n x y x2 y2 xy

1 3 4 9 16 122 8 7 64 49 563 10 8 100 64 804 11 8 121 64 885 13 10 169 100 1306 16 11 256 121 1767 27 16 729 256 4328 30 26 900 676 7809 35 21 1225 441 735

10 37 9 1369 81 33311 37 31 1369 961 114712 44 30 1936 900 132013 103 75 10609 5625 772514 142 90 20164 8100 12780

n=14 ∑ x=¿516

∑ y=¿346

∑ x2=¿¿39020

∑ y2=¿¿17454

∑ xy=¿25794

Ecuación de Regresión Lineal Simple Estimada:

y=0,6829+0,652 x

ERROR ESTÁNDAR DE ESTIMACIÓN

ESTADÍSTICA GENERAL Página 3

A=∑ x2∑ y−∑ x∑ xy

n∑ x2−(∑ x )2

A=(39020 x 346 )−(516 x25794)

(14 x 39020 )−(516)2

A=0,6829

B=n∑ xy−∑ x∑ y

n∑ x2−(∑ x )2

B=(14 x25794 )−(516 x346)

(14 x39020 )−(516)2

B=0,652

Page 4: Analisi de Regresion

Sy / x=√∑ y2−A∑ y−B∑ xyn−2

S yx

=√ 17454−0,6829 x346−0,652 x2579414−2

Sy / x=5,7

COEFICIENTE DE DETERMINACIÓN

r2=A∑ y+B∑ xy−n y2

∑ y2−n y2

r2=0,6829 x346+0,652x 25794−14 x 24,72

17454−14 x 24,72

r2=0,98

2. La siguiente tabla muestra la combustión de la masa (x) y la longitud de flama (y), datos recogidos de la revista Combustion Science and Technology.

x 1,7 2,2 2,3 2,6 2,7 3,0 3,2 3,3 4,1 4,3 4,6 5,7 6,1y 1,3 1,8 1,6 2,0 2,1 2,2 3,0 2,6 4,1 3,7 5,0 5,8 5,3

Calcular: Ecuación de regresión lineal simple. Ecuación de la línea de regresión estimada. Error estándar de estimación. Coeficiente de determinación.

DIAGRAMA DE DISPERSIÓN

ESTADÍSTICA GENERAL Página 4

y=∑ y

n

y=34614

y=24,7

Page 5: Analisi de Regresion

1 2 3 4 5 6 70

1

2

3

4

5

6

7

f(x) = 1.08736540344008 x − 0.715487344427352R² = 0.944068952188387

Grafico 2. Combustión & Longitud

Combustion de la masa

Long

itud d

e la fl

ama

Calculo de ECUACIÓN DE REGRESION LINEAL SIMPLE

y=A+Bx

Por método de los mínimos cuadrados.

n x y x2 y2 xy

1 1,7 1,3 2,89 1,69 2,212 2,2 1,8 4,84 3,24 3,963 2,3 1,6 5,29 2,56 3,684 2,6 2 6,76 4 5,25 2,7 2,1 7,29 4,41 5,676 3 2,2 9 4,84 6,67 3,2 3 10,24 9 9,68 3,3 2,6 10,89 6,76 8,589 4,1 4,1 16,81 16,81 16,81

10 4,3 3,7 18,49 13,69 15,9111 4,6 5 21,16 25 2312 5,7 5,8 32,49 33,64 33,0613 6,1 5,3 37,21 28,09 32,33

n=13 ∑ x=¿45,8

∑ y=¿40,5

∑ x2=¿¿183,36

∑ y2=¿¿153,73

∑ xy=¿166,61

ESTADÍSTICA GENERAL Página 5

A=∑ x2∑ y−∑ x∑ xy

n∑ x2−(∑ x )2 B=

n∑ xy−∑ x∑ y

n∑ x2−(∑ x )2

Page 6: Analisi de Regresion

Ecuación de Regresión Lineal Simple Estimada:

y=1,0874 x−0,7155

ERROR ESTÁNDAR DE ESTIMACIÓN

Sy / x=√∑ y2−A∑ y−B∑ xyn−2

Sy / x=√ 153,73−(−0,7155 ) x 40,5−1,0874 x166,6113−2

Sy / x=0,37

COEFICIENTE DE DETERMINACIÓN

r2=A∑ y+B∑ xy−n y2

∑ y2−n y2

r2=−0,7155 x 40,5+1,0874 x 166,61−13 x3,122

153,73−13 x3,122

r2=0,99

3. Los datos adjuntos se tomaron de una gráfica publicada en un artículo y muestra la variable dependiente (x) que es la tasa de acumulación de SO2 (mg/m2/d) y la variable dependiente (y) es la pérdida de peso de acero (g/m2)

ESTADÍSTICA GENERAL Página 6

A=∑ x2∑ y−∑ x∑ xy

n∑ x2−(∑ x )2 B=

n∑ xy−∑ x∑ y

n∑ x2−(∑ x )2

y=∑ y

n

y= 40,513

y=3,12

Page 7: Analisi de Regresion

x 14 18 40 43 45 112y 280 350 470 500 560 1200

Calcular: Ecuación de regresión lineal simple. Ecuación de la línea de regresión estimada. Error estándar de estimación. Coeficiente de determinación.

DIAGRAMA DE DISPERSIÓN

0 20 40 60 80 100 1200

200

400

600

800

1000

1200

1400

f(x) = 9.31156696380625 x + 137.875630974117R² = 0.989717856763519

Grafico 3. Tasa de acumulacion de SO2 y perdida de peso del acero

Tasa de acumulacion de SO2

Perd

ida d

e pe

so d

el ac

ero

Calculo de ECUACIÓN DE REGRESION LINEAL SIMPLE

y=A+Bx

Por método de los mínimos cuadrados.

n x y x2 y2 xy

1 14 280 196 78400 39202 18 350 324 122500 63003 40 470 1600 220900 18800

ESTADÍSTICA GENERAL Página 7

Page 8: Analisi de Regresion

4 43 500 1849 250000 215005 45 560 2025 313600 252006 112 1200 12544 1440000 134400

n=6 ∑ x=¿272

∑ y=¿3360

∑ x2=¿¿18538

∑ y2=¿¿2425400

∑ xy=¿210120

Ecuación de Regresión Lineal Simple Estimada:

y=9,31x+137,88

ERROR ESTÁNDAR DE ESTIMACIÓN

Sy / x=√∑ y2−A∑ y−B∑ xyn−2

Sy / x=√ 2425400−(137,88 ) x3366−9,31 x2101206−2

Sy / x=38 ,42

COEFICIENTE DE DETERMINACIÓN

r2=A∑ y+B∑ xy−n y2

∑ y2−n y2

ESTADÍSTICA GENERAL Página 8

A=∑ x2∑ y−∑ x∑ xy

n∑ x2−(∑ x )2

A=(18538 x3360 )−(272x 210120)

(6 x18538 )−(272)2

A=137,88

B=n∑ xy−∑ x∑ y

n∑ x2−(∑ x )2

B=(6 x210120 )−(272x 3360)

(6 x18538 )−(272)2

B=9,31

y=∑ y

n

y=33666

y=561

Page 9: Analisi de Regresion

r2=137,88 x3366+9,31x 210120−6 x5612

2425400−6 x5612

r2=0,99

EJERCICIOS DE REGRESIÓN NO LINEAL (parabólico, potencial y exponencial)

4. Se realizó un estudio sobre un camión de reparto ligero a diesel para ver si la humedad, temperatura del aire y presión barométrica influyen en la emisión de óxido nitroso (en rpm). Las mediciones de las emisiones se tomaron en diferentes momentos, con condiciones experimentales variantes. Los datos son los siguientes:

x 8,3 10,7 14,1 20,1 24 18,2 16,6 28,2y 0,0

50,11 0,21 0,63 0,8

70,52 0,3 1,19

Construya un diagrama de dispersión. Estime los parámetros usando una ecuación regresión parabólica. Calcule el error estándar de estimación y coeficiente de determinación.

DIAGRAMA DE DISPERSIÓN

5 10 15 20 25 300

0.2

0.4

0.6

0.8

1

1.2

1.4

f(x) = 0.00151027295906128 x² + 0.00420425795125268 x − 0.110524236140145R² = 0.988137394236115

Grafico 4. Viscosidad & Derrame libre %

Eje x

Eje y

Calculo de ECUACIÓN DE REGRESION PARABÓLICA

y=a+bx+c x2

ESTADÍSTICA GENERAL Página 9

Page 10: Analisi de Regresion

Ecuaciones Normales

∑ y=an+b∑ x+c∑ x2

3,88=a(8)+b (140,2)+c (2764,2)

∑ xy=a∑ x+b∑ x2+c∑ x3

86,1=a(140,2)+b(2764,2)+c (59573,3)

∑ x2 y=a∑ x2+b∑ x3+c∑ x4

2014,7=a(2764,2)+b (59573,3)+c (2764,2)

Cálculo matricial

[ 3,8886,12014,7]=[ 8 140,2 2764,2

140,2 2764,2 59573,32764,2 59573,3 2764,2 ] [abc ]

[abc ]=[−0,11050,00420,0015 ]

Ecuación de Regresión Parabólica Estimada:

y=−0,1105+0,0042 x+0,0015 x2

ERROR ESTÁNDAR DE ESTIMACIÓN

Sy / x=√∑ y2−a∑ y−b∑ xy−c∑ x2 yn−3

Sy / x=√ 2,99−(−0,1105 ) (3,88 )−(0,0042 ) (86,1 )−(0,0015 )(2014,7)8−3

Sy / x=0,08

COEFICIENTE DE DETERMINACIÓN

r2=a∑ y+b∑ xy+c∑ x2 y−n y2

ESTADÍSTICA GENERAL Página 10

y=∑ y

n

y=3,888

y=0,48

Page 11: Analisi de Regresion

r2= (−0,1105) (3,88 )+(0,0042 ) (86,1 )+(0,0015 ) (2014,7 )−8(0,48)2

r2=0,98

5. En la producción de herramientas, el método para deformar acero a temperatura normal mantiene una relación inversa con la dureza del mismo ya que a medida que la deformación crece, se ve afectada la dureza del acero. Para investigar esta relación se ha tomado la siguiente muestra:

Donde: X: deformación (en mm)Y: dureza del acero (Kg/mm2)

x 6 9 11 13 22 26 28 33 35y 68 67 65 53 44 40 37 34 32

Construya un diagrama de dispersión. Estime los parámetros usando una ecuación regresión potencial. Calcule el error estándar de estimación y coeficiente de determinación.

DIAGRAMA DE DISPERSIÓN

0 5 10 15 20 25 30 35 400

10

20

30

40

50

60

70

80f(x) = 175.60662539855 x -̂0.462107919471277R² = 0.947828891293398

Grafico 5. Deformación & Dureza del acero

Deformación (mm)

Dure

za d

el a

cero

(Kg/

mm

^2)

Calculo de ECUACIÓN DE REGRESION POTENCIAL

y=A x B

Cálculo para hallar la ecuación

ESTADÍSTICA GENERAL Página 11

Page 12: Analisi de Regresion

n x y logx logy logx . logy (logx)2 (logy)2

1 6 68 0,78 1,83 1,43 0,61 3,362 9 67 0,95 1,83 1,74 0,91 3,333 11 65 1,04 1,81 1,89 1,08 3,294 13 53 1,11 1,72 1,92 1,24 2,975 22 44 1,34 1,64 2,21 1,80 2,706 26 40 1,41 1,60 2,27 2,00 2,577 28 37 1,45 1,57 2,27 2,09 2,468 33 34 1,52 1,53 2,33 2,31 2,359 35 32 1,54 1,51 2,32 2,38 2,27

n=9 ∑ x=¿183

∑ y=¿440

∑ ¿11,15

∑ ¿15 ∑ ¿18,37 ∑ ¿14,43

∑ ¿25,29

Ecuación de Regresión Potencial Estimada:

y=logA+Bx

y=2,244−0,462x

y=175 ,61 x−0,462

ERROR ESTÁNDAR DE ESTIMACIÓN

Sy / x=√∑ log y2−logA∑ logy−B∑ logxlogyn−2

ESTADÍSTICA GENERAL Página 12

logA=∑ logy∑ (logx)2−∑ logx∑ logxlogy

n∑ (logx)2−(∑ logx )2

logA=(15 x14,43 )−(11,15 x18,37)

(9 x14,43 )−(11,15)2

logA=2,244

B=n∑ logxlogy−∑ logx∑ logy

n∑ ¿¿¿

B=(9 x18,37 )−(11,15 x15)

(9 x14,43 )−(11,15)2

B=−0,462

Page 13: Analisi de Regresion

Sy / x=√ 25,29−(2,244 ) (15 )−(−0,462 ) (18,37 )9−2

Sy / x=0,017

COEFICIENTE DE DETERMINACIÓN

r2=B∑ logxlogy−logA∑ logy−n(log y )2

∑ log y2−¿n( log y )2¿

r2=−0,462 x18,37+ (2,244 ) (15 )−9(0,223)2

25,29−9(0,223)2

r2=0,99

6. La solubilidad en el agua de cierto producto orgánico se hace más rápida con la ayuda de un agente químico. Según presumimos las siguientes observaciones registradas en la tabla de datos, donde 6 muestras de 20 gramos de productos y diversas dosis del agente químico.

Donde: X: agente químico (g)Y: tiempo de solubilidad (s)

x 3 2 1 3 5 4y 7 9 10 8 5 6

Construya un diagrama de dispersión. Estime los parámetros usando una ecuación regresión potencial. Calcule el error estándar de estimación y coeficiente de determinación. DIAGRAMA DE DISPERSIÓN

ESTADÍSTICA GENERAL Página 13

y=∑ logy

n

y=159

y=1,67

Page 14: Analisi de Regresion

0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.50

2

4

6

8

10

12

Grafico 6. Agente químico & Tiempo de solubilidad

Tiempo de solubilidad (s)

Agen

te qu

ímico

(g)

Calculo de ECUACIÓN DE REGRESION POTENCIAL

y=A Bx

Cálculo para hallar la ecuación

n x y x2 logy x .logy

1 3 7 9 0,85 2,542 2 9 4 0,95 1,913 1 10 1 1,00 1,004 3 8 9 0,90 2,715 5 5 25 0,70 3,496 4 6 16 0,78 3,11

n=6 ∑ x=¿18

∑ y=¿45

∑ ¿64 ∑ ¿5,18 ∑ ¿14,76

Ecuaciones Normales

∑ logy=nlogA+logB∑ x

5,18=8 logA+18logB ¿

∑ xlogy=logA∑ x+logB∑ x2

14,76=18 logA+64 logB

ESTADÍSTICA GENERAL Página 14

Page 15: Analisi de Regresion

Cálculo matricial

[ 5,1814,76]=[ 8 1818 64] [logAlogB ]

[ logAlogB ]=[0,350,13]

Ecuación de Regresión Potencial Estimada:

y=logA+xlogB

y=0,35+0,132 x

y=2.24¿

COEFICIENTE DE DETERMINACIÓN

r2=logB∑ logy+logA∑ logy−n(log y )2

∑ log y2−¿n(log y )2¿

r2=0,132 (5,18 )+0,35 (5,18 )−6(−0,06)2

25,29−6 (−0,06)2

r2=0,98

ESTADÍSTICA GENERAL Página 15

y=∑ y

n

y=5,186

y=0,86

Page 16: Analisi de Regresion

EJERCICIOS DE CORRELACION SIMPLE (DISPERSION Y MEDIA ESTADISTICA CON GRAFICAS)

1. Una compañía de seguros considera que el número de vehículos (y) que circulan por una determinada autopista a más de 120 km/h, puede ponerse en función del número de accidentes (x) que ocurren en ella. Durante 5 días obtuvo los siguientes resultados.

a)

Calcula el coeficiente de correlación lineal.

b) Si ayer se produjeron 6 accidentes, ¿cuántos vehículos podemos suponer que circulaban por la autopista a más de 120 km / h?

c) ¿Es buena la predicción?

SOLUCION:

ESTADÍSTICA GENERAL Página 16

Accidentes xi 5 7 2 1 9

Vehículos yi 15 18 10 8 20

Page 17: Analisi de Regresion

DIAGRAMA DE DISPERSIÓN

0 1 2 3 4 5 6 7 8 9 1005

10152025

Accidentes & Vehículos

accidentes

vehí

culo

s

Cálculo para hallar la ecuación

ESTADÍSTICA GENERAL Página 17

Page 18: Analisi de Regresion

2. Las calificaciones de 40 alumnos en psicología evolutiva y en estadística han sido las de la tabla adjunta.

Psicología xi 3 4 5 6 6 7 7 8 10

Estadística yi 2 5 5 6 7 6 7 9 10

# de alumnos fi 4 6 12 4 5 4 2 1 2

a) Obtener la ecuación de la recta de regresión de calificaciones de estadística respecto de las calificaciones de psicología.

b) ¿Cuál será la nota esperada en estadística para un alumno que obtuvo un 4,5 en psicología?

Solución

DIAGRAMA DE DISPERSIÓN

ESTADÍSTICA GENERAL Página 18

Page 19: Analisi de Regresion

4 6 8 10 12 14 160

2

4

6

8

10

12

f(x) = 0.704301075268817 x + 0.870967741935483R² = 0.849050069265783

Psicología & Estadística

psicologia

esta

disti

ca

Cálculo para hallar la ecuación

ESTADÍSTICA GENERAL Página 19

Page 20: Analisi de Regresion

3. La empresa Bradford Electric Illuminating Co, analiza la relación entre el consumo de energía (en miles de kilowatts - hora,kwh) y el número de habitaciones en una residencia privada unifamiliar. Una muestra aleatoria de 10 casas produjo lo siguiente:

ESTADÍSTICA GENERAL Página 20

Page 21: Analisi de Regresion

a. Determine la ecuación de regresión:

b. Evalué el consumo en kilowatts – hora, para una casa de 6 habitaciones

EJERCICIOS DE INDICE ESTADISTICO

1) La siguiente tabla muestra la evolución trimestral del número de parados en Andalucía :

ESTADÍSTICA GENERAL Página 21

4 6 8 10 12 14 160

2

4

6

8

10

12

f(x) = 0.666666666666667 x + 1.33333333333333R² = 0.816849816849817

Habitacion & Consumo

habitación

cons

umo

Page 22: Analisi de Regresion

a) Calcular la serie de números índices simples con base el primer trimestre de 2002.

b) Calcular la serie de números índices en cadena.

c) Calcular la tasa de variación del número de parados del cuarto trimestre del año 2004 con respecto al primer trimestre de 2003.

d) Calcular la tasa media acumulativa en el periodo comprendido entre el primer trimestre de 2002 y el cuarto trimestre de 2004.

SOLUCIÓN:

a) Llamemos X: número de parados (miles de personas). El índice simple del periodo t con base el periodo 0, vendrá dado por:

Donde x es el número de parados en el periodo t y Xo es el número de parados en el periodo base. En nuestro caso el periodo base es el primer trimestre del año 2002, que representaremos por I-2002. Así, se tiene que:

ESTADÍSTICA GENERAL Página 22

Page 23: Analisi de Regresion

Y así sucesivamente, obteniéndose:

Estos índices nos indican la variación porcentual del número de parados en cada periodo con respecto al periodo base.

Así, por ejemplo, el número de parados del cuarto trimestre de 2002 es un 9,64% superior al número de parados del primer trimestre de 2002, ya que 109,64 -100 = 9,64.

b) Los números índices en cadena los calculamos tomando como base en cada periodo, el periodo anterior:

Así, se tiene que:

ESTADÍSTICA GENERAL Página 23

Page 24: Analisi de Regresion

Y así sucesivamente, obteniéndose:

Estos índices nos indican la variación porcentual del número de parados en cada periodo con respecto al periodo anterior.

Así, por ejemplo, el número de parados del segundo trimestre de 2004 es un 2,33% superior al número de parados del primer trimestre de 2004.

Evidentemente, para el primer periodo no podemos calcular el índice en cadena, ya que no disponemos el dato del periodo anterior.

c) La tasa de variación del número de parados del período t con respecto al período s viene dada por:

ESTADÍSTICA GENERAL Página 24

Page 25: Analisi de Regresion

En nuestro caso, el periodo t es el cuarto trimestre del año 2004 y el periodo s es el primer trimestre de 2003.

Luego, el número de parados del cuarto trimestre del año 2004 descendió un 10,69% con respecto al primer trimestre del año 2003.

Esta tasa de variación también podríamos calcularla utilizando los índices simples de ambos periodos en lugar de los valores de la variable.

d) La tasa media acumulativa del número de parados del período t con respecto al período s viene dada por:

Así, la tasa media acumulativa en el periodo comprendido entre el primer trimestre de 2002 y el cuarto trimestre de 2004 viene dada por:

Por tanto, la tasa media acumulativa en el periodo comprendido entre el primer trimestre de 2002 y el cuarto trimestre de 2004 es de -0,686% .

Esta tasa media acumulativa también se podría haber obtenido a partir de los índices simples:

ESTADÍSTICA GENERAL Página 25

Page 26: Analisi de Regresion

2) Se dispone de los siguientes datos sobre el índice anual de ventas de una cierta empresa:

Enlazar las tres series de números índices y expresar la serie enlazada en base el año 1994.

SOLUCIÓN:

Como las series de índices en base 1994 y en base 2000 tienen un único periodo en

común (el año 2000), para realizar el enlace de estas dos series expresamos ambas en

base el año 2000. Para ello, sólo tenemos que realizar un cambio de base en la serie

que está en base el año 1994.

ESTADÍSTICA GENERAL Página 26

Page 27: Analisi de Regresion

Así, tenemos:

Ahora expresamos ambas series en base el año 1994.

Para la serie en base 1990, dividimos todos los índices

por el índice de 1994 en base 1990. Para la serie en base

2000, dividimos todos los índices por el índice de 1994 en

base 2000. De esta forma, ya tendremos las tres series

enlazadas:

ESTADÍSTICA GENERAL Página 27

Page 28: Analisi de Regresion

3) Las empresas del sector informático de cierta región facturaron durante los años

2001, 2002 y 2003 las cantidades que se indican y a los precios que figuran en la

siguiente tabla:

a) Construir, con base el año 2001, el índice de valor y los índices de precios y cantidades de Laspeyres, Paasche y Fisher.

b) Hallar la repercusión y participación de cada tipo de ordenador en la variación del índice de precios de Laspeyres entre los años 2002 y 2003.

c) Hallar la repercusión y participación de cada tipo de ordenador en la variación del índice de precios de Paasche entre los años 2002 y 2003.

SOLUCIÓN:

a) Los índices de precios y cantidades de Laspeyres, Paasche y Fisher vienen dados

por:

El índice de valor viene dado por:

ESTADÍSTICA GENERAL Página 28

Page 29: Analisi de Regresion

Calculemos las distintas sumas que aparecen en las expresiones de dichos índices,

teniendo en cuenta que el año base es el año 2001:

Una vez obtenidas las distintas sumas, calculamos los índices:

ESTADÍSTICA GENERAL Página 29

Page 30: Analisi de Regresion

El índice de valor también se podría haber obtenido a partir de los índices de precios y

cantidades de Laspeyres, Paasche y Fisher:

b) Para calcular la repercusión y participación, tenemos que expresar el índice de

precios de Laspeyres como una media aritmética ponderada de índices simples

de precios.

Siendo la ponderación del artículo i, y

el índice simple de precios del artículo i.

Calculemos la ponderación y los índices simples de precios de cada tipo de

ordenador:

· Ponderación de los ordenadores personales:

ESTADÍSTICA GENERAL Página 30

Page 31: Analisi de Regresion

· Ponderación de los ordenadores portátiles:

· Índices simples de precios con base el años 2001:

Como las ponderaciones son constantes en el tiempo, la repercusión de cada tipo

de ordenador en la variación del índice de precios de Laspeyres entre los años 2002

y 2003 viene dada por:

· Repercusión de los ordenadores personales:

· Repercusión de los ordenadores portátiles:

La participación de cada tipo de ordenador en la variación del índice de precios de

Laspeyres entre los años 2002 y 2003 viene dada por:

· Participación de los ordenadores personales:

ESTADÍSTICA GENERAL Página 31

Page 32: Analisi de Regresion

· Participación de los ordenadores portátiles:

c) Para calcular la repercusión y participación, tenemos que expresar el índice de

precios de Paasche como una media aritmética ponderada de índices simples

de precios.

Siendo la ponderación del artículo i, y

el índice simple de precios del artículo i.

En este caso, como las ponderaciones son variables en el tiempo, la repercusión de

cada tipo de ordenador en la variación del índice de precios de Paasche entre los años

2002 y 2003 viene dada por:

Calculemos las ponderaciones de cada tipo de ordenador en los años 2002 y 2003:

· Ponderación de los ordenadores personales año 2002:

· Ponderación de los ordenadores portátiles año 2002:

· Ponderación de los ordenadores personales año 2003:

ESTADÍSTICA GENERAL Página 32

Page 33: Analisi de Regresion

· Ponderación de los ordenadores portátiles año 2003:

Luego, la repercusión de cada tipo de ordenador en la variación del índice de precios

de Paasche entre los años 2002 y 2003 es:

· Repercusión de los ordenadores personales:

· Repercusión de los ordenadores portátiles:

La participación de cada tipo de ordenador en la variación del índice de precios de

Paasche entre los años 2002 y 2003 viene dada por:

· Participación de los ordenadores personales:

· Participación de los ordenadores portátiles:

ESTADÍSTICA GENERAL Página 33

Page 34: Analisi de Regresion

EJERCICIOS NÚMERO ÍNDICE LASPAYER Y PEASCHE:

Se observa una cesta de la compra compuesta por pan, leche y carne. Los datos relativos a los precios y a las cantidades consumidas por una familia en el perıodo 2006-2008 aparecen en las siguientes tablas:

a) Calcula e interpreta los índices de precios de Laspeyres respecto a 2006.b) Calcula e interpreta los índices cuánticos de Laspeyres respecto a 2006.c) Calcula e interpreta los índices de precios de Paasche respecto a 2006.d) Calcula e interpreta los índices cuánticos de Paasche respecto a 2006.

SOLUCIÓN (a):

El objetivo del Apartado a) es ahora calcular en primer lugar el índice de precios de Laspeyres del año 2007 base 2006.

Método y Justificación: se calculará el índice de Laspeyres porque ese es el objetivo. Se puede utilizar cualquiera de las dos fórmulas.

Cálculos: a partir de los índices simples y las ponderaciones o gastos en cada bien (ver Tabla 10.1), se puede aplicar la primera fórmula.

ESTADÍSTICA GENERAL Página 34

Page 35: Analisi de Regresion

Al aplicar directamente la segunda fórmula, se pierde un poco la visión del índice como media ponderada, aunque sale el mismo valor y se aprecia mejor la segunda interpretación.

Conclusión: la cesta de la compra subió en media un 2,6% del año 2006 al año 2007 teniendo en cuenta el valor de los distintos bienes en el año 2006. En el primer cálculo se ve perfectamente que el bien en el que más se invirtió fue la carne (es el que mayor gasto o valor presenta), y de ahí que su bajada influya bastante en la media ponderada. Equivalentemente, se puede decir que en el año 2007 se gastarían 1057,9e para comprar las mismas cantidades que en el año 2006, frente a los 1030,98e que se gastaron en 2006. Esto significa que el gasto aumentó un 2,61% debido a la variación de los precios.

ESTADÍSTICA GENERAL Página 35

Page 36: Analisi de Regresion

SOLUCIÓN (b):

El primer objetivo del Apartado b) es calcular el ´índice cuántico de Laspeyres del año 2007 base 2006. El planteamiento, método y justificación es análogo al del Apartado a).

Cálculos: de nuevo, se puede utilizar cualquiera de las dos formulas que se conocen. A partir de los índices de cantidad simples de cada bien y las ponderaciones o gastos (ver Tabla 10.2), se aplica la primera fórmula.

También se puede utilizar la segunda fórmula:

ESTADÍSTICA GENERAL Página 36

Page 37: Analisi de Regresion

Conclusión: el consumo subió 6,3 puntos porcentuales del año 2006 al año 2007 teniendo en cuenta el valor de los distintos bienes en el año 2006. Con el primer cálculo se aprecia que el bien en el que más se invirtió fue la carne (es el que mayor gasto o valor presenta), y de ahí que su subida influya bastante en la media ponderada. Con el segundo cálculo se ilustra mejor la segunda interpretación: en 2007 se gastarían 1095,92e de haberse mantenido los precios frente a los 1030,98e que se gastaron en 2006. En consecuencia, el gasto ha aumentado un 6,3% a causa del aumento del consumo.

SOLUCIÓN (c):

El objetivo del Apartado c) es calcular en primer lugar el ´índice de precios de Paasche del año 2007 base 2006. El planteamiento, método y justificación es análogo al del Apartado a).

Cálculos: a partir de los índices simples y las ponderaciones (ver Tabla 10.3), se puede aplicar la primera fórmula.

ESTADÍSTICA GENERAL Página 37

Page 38: Analisi de Regresion

Al aplicar la segunda fórmula, se tendrían los siguientes cálculos:

Conclusión: la cesta de la compra subió en media un 2,3% del año 2006 al año 2007 teniendo en cuenta el valor de los distintos bienes en el año 2007 de haberse mantenido los precios de 2006. El valor es similar al del índice de Laspeyres, y eso se debe al que la valoración de los bienes no cambió en exceso en este caso (sigue teniendo la mayor ponderación la carne y la menor el pan). Atendiendo a la segunda fórmula también se puede decir que el gasto en 2007 fue de 1121,35e, mientras que para comprar las mismas unidades a precios del 2006 se habrían gastado 1095,92. Esto significa que el gasto aumentó un 2,3% a causa de la subida de precios.

SOLUCIÓN (d):

El objetivo del Apartado d) es calcular en primer lugar el índice cuántico de Paasche del año 2007 base 2006. El planteamiento, método y justificación es análogo al del Apartado a).

Cálculos: de nuevo a partir de los índices simples y las ponderaciones (ver Tabla 10.4), se puede aplicar la primera fórmula.

ESTADÍSTICA GENERAL Página 38

Page 39: Analisi de Regresion

Con la segunda fórmula:

Conclusión: el consumo subió un 6% del año 2006 al año 2007 teniendo en cuenta el valor que hubiesen tenido los distintos bienes de haberse mantenido el consumo de 2006. También se puede decir que el gasto en 2007 fue de 1121,35e, mientras que a precios de 2007 en 2006 habría sido de 1057,9e. Esto significa que en gasto aumentó un 6% a causa de la subida del consumo.

ESTADÍSTICA GENERAL Página 39

Page 40: Analisi de Regresion

EJERCICIOS DISTRIBUCION NORMAL

1. Las calificaciones de los 500 aspirantes presentados a un examen para contratación laboral, se distribuye normalmente con media 6'5 y varianza 4.a. Calcule la probabilidad de que un aspirante obtenga más de 8 puntos.b. Determine la proporción de aspirantes con calificaciones inferiores a 5

puntos.c. ¿Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 7'5

puntos?

SOLUCIÓN (a):

Nos encontramos ante una distribución normal N(6'5, 4)= N(6'5,2)

Tipificamos el valor 8:

La probabilidad pedida es el área a la derecha de z = 0'75.

Consultando las tablas obtenemos: 0'22663

SOLUCIÓN (b):

Tipificamos el valor 5:

Calculemos el área (probabilidad) a la izquierda de z = -0'75.

ESTADÍSTICA GENERAL Página 40

Page 41: Analisi de Regresion

Consultando las tablas obtenemos: 0'22663

En términos de porcentajes será 0'22663 x 100 : el 22'663 %

SOLUCIÓN (c):

Tipificamos los valores 5 y 7'5:

El área comprendida entre ambos es, consultando las tablas:

Pr(5 < X < 7'5) = Pr(-0'75 < z < 0'5) = 0'46483

Multiplicando la probabilidad por el total de aspirantes, obtenemos el número de ellos que tienen calificaciones comprendidas entre 5 y 7'5 puntos:

0'46483 x 500 = 232'415 232 aspirantes≅

2. Sólo 24 de los 200 alumnos de un Centro miden menos de 150 cm. Si la estatura media de dichos alumnos es de 164 cm., ¿cuál es su varianza?

Siendo 24 / 200 = 0'12, sabemos que el 12% de los alumnos tienen estaturas inferiores a 150.

Consultando las tablas de la distribución normal tipificada, obtenemos el valor z que deja a su izquierda un área 0'12.

Dicho valor es: z = -1'175

(Para z = -1'17 encontramos 0'12100 y para z = -1'18 encontramos 0'11900).

ESTADÍSTICA GENERAL Página 41

Page 42: Analisi de Regresion

3. El percentil 70 de una distribución normal es igual a 88, siendo 0'27 la probabilidad de que la variable tenga un valor inferior a 60. ¿A qué distribución normal nos estamos refiriendo?

Se nos pide determinar la media y desviación típica de una distribución normal que verifica las condiciones del enunciado.

Gráficamente:

Consultando las tablas obtenemos:

a) Valor de z que deja a su izquierda un área igual a 0'70:

z = 0'52 (valor más próximo 0'69847)

b) Valor de z que deja a su izquierda un área igual a 0'27

z = -0'61 (valor más próximo 0'27093)

Con esto:

Resolviendo el sistema determinaremos los valores de la media y la desviación típica:

ESTADÍSTICA GENERAL Página 42

Page 43: Analisi de Regresion

Se trata de una distribución N(75'11 , 24'78).

4. Las puntuaciones de un examen se distribuyen normalmente con medida 15 puntos. La puntuación A ha sido superada por un 23% de los alumnos. La puntuación B está situada a 5 puntos diferenciales por debajo de la media. Entre B y la media se encuentra el 30% de los alumnos. Calcular:

a) La desviación típica de las notas.

b) Las puntuaciones directas de A y B.

c) El porcentaje de alumnos entre A y B.

SOLUCIÓN (a):

ESTADÍSTICA GENERAL Página 43

Page 44: Analisi de Regresion

La puntuación B=10, deja a su izquierda un área 0’20. Consultando las tablas obtenemos un valor z = -0’84. De aquí:

SOLUCIÓN (b):

La puntuación A, deja a su izquierda un área 0’77 (1-0’23). Consultando las tablas obtenemos un valor z = 0’74. De aquí:

SOLUCIÓN (c):

Observando la figura resulta un área 0’57 (0’30+0’27); es decir, el 57%.

5. En un estudio realizado sobre los ingresos familiares en los que los dos cónyuges trabajan, se ha observado que el salario mensual, en miles de pesetas, de las mujeres (X) se distribuye normalmente con media 100, en tanto que el de los hombres (Y) tiene la siguiente transformación Y = X + 20. Sabiendo además que el 15% de los hombres no superan el percentil 75 de las mujeres, se pide :

a) Representar gráficamente el enunciado del problema.

b) El salario medio de los hombres.

c) La desviación típica del salario de los hombres y de las mujeres.

SOLUCIÓN (a):

ESTADÍSTICA GENERAL Página 44

Page 45: Analisi de Regresion

Si la media de las mujeres es 100, la de los hombres queda definida por la relación Y = X+20, luego es 120.

Dicha transformación (al no multiplicar o dividir por ningún valor) no modifica las desviaciones típicas. En consecuencia, las desviaciones de la distribución de mujeres y hombres coinciden.

En la distribución correspondiente a las mujeres el valor que tipificado (Zm) deja a su izquierda un área 0'75 (75%) coincide con el de la de los hombres (Zh) que tipificado deja a su izquierda un área 0'15 (no supera el valor anterior).

Estas conclusiones se muestran a la derecha.

SOLUCIÓN (b):

Ya se justificó anteriormente que la media de la distribución de ingresos de los hombres es 120 (en miles de pesetas).

SOLUCIÓN (c):

Con la tabla de la distribución normal determinamos los valores Zm y Zh , y recordando que coinciden Xm y Xh

Luego las desviaciones típicas coinciden y valen 11'696 (miles de pesetas).

LINKCOGRAFÍA:

ESTADÍSTICA GENERAL Página 45

Page 46: Analisi de Regresion

http://www.uca.es/uca/dpto/C146/pag_personal/f_alvarez/documentos/CC %20Trabajo%20Tema%205.pdf

http://www.ciens.ucv.ve:8080/generador/sites/QAII-pregrado/archivos/miller- estadistica%20y%20quimiometria%20para%20quimica%20analitica%202005.pdf

http://es.wikipedia.org/wiki/Quimiometr%C3%ADa

BIBLIOGRAFÍA:

Estadística Administrativa I (GAP-Oviedo) - A. Colubi, A. Lubiano, P. Terán Probabilidad y estadística para ingeniería. RAYMOND H. MYERS, WALPOLE Estadística química analítica. James N. Miller, Jane C. Miller

ESTADÍSTICA GENERAL Página 46