estimacion puntual

17
26 ESTADÍSTICA Y PROBABILIDAD 10.1.1 Estimación puntual Un estimador es un elemento descriptivo basado en las mediciones contenidas en una muestra. Por ejemplo, la media de la muestra x n x i i n = = 1 1 es un estimador puntual para la media de la población µ 0 . Supóngase que se quiere obtener una inferencia respecto de la calificación media de todos los alumnos que cursan la materia de cálculo, para esto se analiza una muestra aleatoria de diez de ellos, cuyas calificaciones son 8, 4, 9, 9, 6, 8, 2, 7, 3 y 6 Mediante el promedio de los datos de una muestra se calcula un valor para el estadístico X x = + + + + + + + + + = 1 10 8 4 9 9 6 8 2 7 3 6 62 ( ) . Con base en el valor calculado del estadístico X se puede llevar a cabo una inferencia respecto del parámetro µ, es decir, una estimación puntual del parámetro media respecto de las calificaciones de la materia de cálculo. En este caso la calificación promedio es 6.2. En general Dada una población en donde θ es un parámetro, y ˆ Θ su estadística correspondiente, se le llama estimador puntual de θ a cualquier valor ˆ θ de ˆ Θ. De la definición de estimador puntual no se puede esperar que dicho valor realice una estimación certera del parámetro, de hecho, ésta también depende del estadístico utilizado. Por ejemplo, si la población estudiantil de la materia de cálculo tiene calificación promedio µ = 6.5, y se considera una muestra al azar de tres estudiantes con calificaciones 3, 6 y 6, para realizar una estimación del parámetro, se tiene x = + + = 1 3 3 6 6 5 ( ) Es decir, el estadístico media difiere del parámetro en 1.5 unidades, mientras que el estadístico mediana x = 6, difiere del parámetro en sólo 0.5. Por tanto, con la muestra anterior, el estadístico mediana estima mejor el parámetro. Pero, qué pasará si en una segunda muestra aleatoria de tamaño tres, las calificaciones para la estimación del parámetro resultan 4, 4, y 10, se tiene x = + + = 1 3 4 4 10 6 ( ) Por tanto, para esta muestra el estadístico media difiere del parámetro en 0.5 unidades, mientras que el estadístico x = 4, difiere del parámetro en 2.5. Es decir, con la muestra anterior el estadístico media estima mejor el parámetro. Por tanto, puede ser de interes qué estimador puntual para un mismo parámetro es mejor elegir. La respuesta se encuentra en las siguientes definiciones. Definición 10.1

Upload: dandeuzal

Post on 26-Nov-2015

220 views

Category:

Documents


12 download

TRANSCRIPT

2�6 Estadística y probabilidad

10.1.1 Estimación puntual

Unestimadoresunelementodescriptivobasadoenlasmedicionescontenidasenunamuestra.Porejemplo,lamediadelamuestra

xn

xii

n=

=∑1

1

es un estimador puntual para la media de la población µ0.Supóngasequesequiereobtenerunainferenciarespectodelacalificaciónmedia

detodoslosalumnosquecursanlamateriadecálculo,paraestoseanalizaunamuestraaleatoriadediezdeellos,cuyascalificacionesson

8,4,9,9,6,8,2,7,3y6

Mediante el promedio de los datos de una muestra se calcula un valor para elestadísticoX

x = + + + + + + + + + =1

108 4 9 9 6 8 2 7 3 6 6 2( ) .

ConbaseenelvalorcalculadodelestadísticoXsepuedellevaracabounainferenciarespectodelparámetroµ,esdecir,unaestimación puntualdelparámetromediarespectodelascalificacionesdelamateriadecálculo.Enestecasolacalificaciónpromedioes6.2.Engeneral

Dada una población en donde θ es un parámetro, y Θ̂ su estadística correspondiente, se le llama estimador puntual de θ a cualquier valor θ̂ de Θ̂.

Deladefinicióndeestimador puntualnosepuedeesperarquedichovalorrealiceunaestimacióncerteradelparámetro,dehecho,éstatambiéndependedelestadísticoutilizado.Porejemplo,silapoblaciónestudiantildelamateriadecálculotienecalificaciónpromedioµ=6.5,yseconsideraunamuestraalazardetresestudiantesconcalificaciones3,6y6,pararealizarunaestimacióndelparámetro,setiene

x = + + =1

33 6 6 5( )

Esdecir,elestadísticomediadifieredelparámetroen1.5unidades,mientrasqueelestadísticomediana

x = 6,difieredelparámetroensólo0.5.Portanto,conlamuestraanterior,elestadísticomedianaestimamejorelparámetro.

Pero,quépasarásienunasegundamuestraaleatoriadetamañotres,lascalificacionesparalaestimacióndelparámetroresultan4,4,y10,setiene

x = + + =1

34 4 10 6( )

Por tanto, para esta muestra el estadístico media difiere del parámetro en 0.5unidades,mientrasqueelestadístico x = 4,difieredelparámetroen2.5.

Esdecir,conlamuestraanteriorelestadísticomediaestimamejorelparámetro.Portanto,puedeserdeinteresquéestimadorpuntualparaunmismoparámetroesmejorelegir.Larespuestaseencuentraenlassiguientesdefiniciones.

Definición 10.1

2�7Unidad 10 • infErEncia Estadística

El estadístico Θ̂ se llama estimador insesgado del parámetro θ si E(Θ̂)= θ.

DadasX1,X2, . . .,X5 unamuestra aleatoriadeunapoblación cuyadistribución esnormal,conmediaµyvarianzaσ 2,considerandolosestadísticos

T X TX X X

TX X X X X

1 21 2 5

31 2 3 4 5

10 3= =

+ + +=

+ + − +,

y

secompruebacuálessonestimadoresinsesgadosdeµ.Paraverificarquéestimadoressoninsesgados,seemplealadefiniciónylapropiedad

delvaloresperadoenvariablesindependientes

E a X a X a X a E X a E X a E Xn n n n( ) ( ) ( ) ( )1 1 2 2 1 1 2 2+ + + = + + +

ParaelestadísticoT1

E T E X EX X X X X

E X X X X X( ) ( )11 2 3 4 5

1 2 3 4 55

1

5

1

5

= =+ + + +

= + + + + =

EE X E X E X E X E X( ) ( ) ( ) ( ) ( )

( ) ( )

1 2 3 4 5

1

5

1

55

+ + + + =

+ + + + = =µ µ µ µ µ µ µ

SemuestraqueT1esunestimador insesgado.ParaelestadísticoT2

E T EX X X X X

E X X X X X

E

( )

(

21 2 3 4 5

1 2 3 4 5101

10

110

=+ + + +

= + + + + =

XX E X E X E X E X1 2 3 4 51

105

12

) ( ) ( ) ( ) ( ) ( )+ + + + = = ≠µ µ µ

SemuestraqueT2esunestimador sesgado.ParaelestadísticoT3

E T EX X X X X

E X X X X X

E X

( )

( )

31 2 3 4 5

1 2 3 4 5

1

313

13

=+ + − +

= + + − + =

++ + − + = + + − + = =E X E X E X E X( ) ( ) ( ) ( ) ( ) ( )2 3 4 513

13

3µ µ µ µ µ µ µ

Portanto,T3tambiénesunestimador insesgadodelamedia.

Enelejemploanteriorseapreciaqueaunmismoparámetrolepuedencorrespondervariosestimadoresinsesgados.Porconsiguiente,enelestudiodelaestadísticaresultadeinterésconocerelestimadorinsesgadoquetengalamenorvarianza,yaqueentalcasosudistribuciónestámáscercanaalparámetro.

Dado un parámetro θ y un conjunto de estimadores insesgados de él, ˆ , ˆ , , ˆΘ Θ Θ1 2 m , se llama estimador más eficiente de θ al de menor varianza.

Definición 10.2

Definición 10.3

Ejemplo 1

2�� Estadística y probabilidad

DadalamuestraaleatoriadelejemploanteriorX1,X2,...,X5yconsiderandolosestadísticosqueresultaroninsesgadosdeµ,

T X TX X X X X

1 31 2 3 4 5

3= =

+ + − +y

secompruebacuálesmáseficiente.Paraestoseusaladefiniciónylapropiedaddelavarianzaenvariablesindependientes

V a X a X a X a V X a V X a V Xn n n n( ) ( ) ( ) ( )1 1 2 2 12

1 22

22+ + + = + + +

ParaelestadísticoT1

V T VX X X X X

V X X X X X

V X

( )

(

11 2 3 4 5

2 1 2 3 4 551

5

125

=+ + + +

= + + + + =

11 2 3 4 52 2 2 2 21

25

125

5

) ( ) ( ) ( ) ( ) ( )

(

+ + + + = + + + + =V X V X V X V X σ σ σ σ σ

σ 22 215

)= σ

ParaelestadísticoT3

V T VX X X X X

V X X X X X

V X

( )

(

31 2 3 4 5

2 1 2 3 4 5

1

31

3

19

=+ + − +

= + + − + =

)) ( ) ( ) ( ) ( ) ( ) ( )

(

+ + + − +

= + + + + =V X V X V X V X2 3

24 5

2 2 2 2 2119

19

σ σ σ σ σ

5559

2 2σ σ)=

De los cálculos anteriores, resultaque el estadísticoT1 esmás eficientequeT3,puestoque1/5<5/9.

Entrelosparámetrosmáscomunesysusestadísticos,existenlosinsesgadosqueseempleanconmayorregularidad:

Ejercicio 1

1. Dadas X1, X2, X3 y X4 una muestra aleatoria seleccionada de una poblacióndistribuidaen formanormalconmediaµ ydesviaciónestándarσ, considera lossiguientesestimadoresdeµ

TX X X X

11 2 3 4

6=

+ + + T

X X X X2

1 2 3 4

4=

+ + + T

X X X X3

1 2 3 42 3 4

10=

+ + +

ydeterminacuálessoninsesgadosyentreéstoscuálesmáseficiente.

Ejemplo 2

2��Unidad 10 • infErEncia Estadística

2. Lalecturaenunvoltímetroconectadoauncircuitodepruebatieneunadistribuciónuniformeenelintervalode(θ,θ +1),dondeθeselparámetroparaelvoltajedelcircuito. SupónqueX1,X2,X3 yX4 esunamuestra aleatoriade tales lecturas yverificaque ˆ .θ = −X 0 5esunestimadorinsesgado.

3. DadasX1,X2yX3yY1,Y2yY3comomuestrasaleatorias independientesdedospoblacionesconmediasµ1yµ2yvarianzaσ1

2 yσ22,respectivamente

    a) compruebaqueX Y− esunestimadorinsesgadodeµ1yµ2    b) calculalavarianzadelestimadorX Y−

10.1.2 Estimación por intervalo

Despuésde iniciadoel estudiode los estimadorespuntuales es lógico suponerque lainferencia realizadamedianteun valorpuntualno es lamás adecuada, yaquepuedevariar considerablemente de muestra en muestra, por tanto, es preferible indicar unintervalo enelque sepueda estimar, con cierto grado  de  confianza, la localizacióndelparámetroenestudio.

Dada θ como parámetro, supóngase que, bajo ciertas condiciones (como se veráenlassiguientessubsecciones),seencuentraqueθ θ θ∈ ( ˆ , ˆ )i s ,dondelospuntosextremosˆ ˆθ θi sy llamados extremo inferior y extremo superior, respectivamente, dependen del

valor de la estadística Θ̂ para una muestra particular. Como los extremos ˆ ˆθ θi sy delintervalodependendelamuestra,resultaquesólosonvaloresdelasvariablesaleatoriascorrespondientes ˆ ˆΘ Θi sy . Con base en las variables aleatorias anteriores y sus valorescorrespondientes, se calcula la probabilidad de que el parámetro θ se encuentre en elintervaloestablecido.Sesimbolizapor1–αconα∈(0,1)alaprobabilidadmencionada

P i s( ˆ ˆ )Θ Θ< < = −θ α1

Esdecir,setieneunaprobabilidadde1–αdeseleccionarunavariablealeatoriaqueconbaseenunamuestraproduzcaunintervaloquecontengaaθ.

El intervalo anterior en el que se localiza el parámetro θ, ˆ ˆΘ Θi s< <θ , se llama intervalo de confianza de (1 – α)100%; mientras que la fracción 1 – α se le llama coeficiente o grado de confianza y los extremos ˆ ˆθ θi sy , son los límites de confianza inferior y superior, respectivamente.

Porejemplo,setieneunamuestrade20focoscuyaduraciónpromedioenhorases x = 750yconbaseenestevalorseestimaqueelparámetroµpuedeencontrarseconunaprobabilidad1–α,establecidadeantemanoenelintervalodeconfianza(740,760),esdecir

P( )740 760 1< < = −µ α

En las siguientes subsecciones se analizarán los intervalos de confianza máscomunesparalosparámetros,medias,diferencia de medias,varianzasyproporciones.

¿Qué es una estimación por medio de un intervalo?

Definición 10.4

2�0 Estadística y probabilidad

Intervalos de confianza para medias de poblaciones aproximadamente normales

Establecidaslasbasesgeneralesdelosintervalosdeconfianzayutilizandoelteoremadellímitecentral,losconceptossobreestimadorespuntualesylasdistribucionesdeterminadasenlaunidad9,sepresentanmétodosparaelcálculodeintervalosdeconfianza.Unodeestosmétodosserefierealamedia,ysedivideentrescasos:

1. Intervalo de confianza para la media poblacional µ con distribución normal, cuando se conoce σ.

Dada x la media de una muestra aleatoria de tamaño n de una población condistribución aproximadamente normal, de la cual se conoce σ 2, el intervalo deconfianza(1–α)de100%paraµestádadopor

x zn

x zn

< < +

α α

σµ

σ

2 2

dondezα/2eselvalordeladistribuciónnormalestándar,aladerechadelcualtieneunáreadeα/2. Sedenotaenestecasoqueparapoderaplicarlafórmula,ladistribucióntienequesernormaloaproximadamentenormalyse debe conocer el parámetro σ.

Una máquina de refrescos está ajustada de tal manera que la cantidad de líquidosuministrado se distribuye en forma normal con desviación estándar de 0.15 dl. Secalcula95%deintervalodeconfianzaparalamediaderefrescosservidosdeunamuestrade36vasostomadaalazarconuncontenidopromediode2.25dl.

Setomanlosdatos:σ=0.15dl,eltamañodelamuestraes36conmediamuestralde x = 2 25. dl.Paracalcularelintervalodeconfianzadelparámetromediaseemplealafórmulaanterior.

Primerosecalculaelvalordezα/2,con1–α=0.95.Delastablasporcentualesparaladistribuciónnormalestándarsetienezα/2=1.96.Portanto,

2 25 1 960 15

362 25 1 96

0 15

36

2 201 2 299

. ..

. ..

. .

< < +

< <

µ

µ

Esdecir,con95%deprobabilidadseafirmaqueelparámetromediadellíquidosuministradoporlamáquinaderefrescosseencuentraentre2.201y2.299dl.

2. Intervalo de confianza para la media poblacional µ cuando se desconoce σ en muestras grandes.

Dada x lamediadeunamuestraaleatoriadetamañon(n≥30)tomadaalazardeunapoblacióndelacualseconocesudesviaciónestandar sysedesconoceσ,elintervalodeconfianza(1–α)de100%paraµestádadopor

x zs

nx z

s

n−

< < +

α αµ

2 2

Ejemplo 3

2�1Unidad 10 • infErEncia Estadística

dondezα/2eselvalordeladistribuciónnormalestándar,lacualtieneunáreadeα /2ysesladesviaciónestándarobtenidadelestadísticovarianzainsesgada. Enestecasoesposiblenotarqueparapoderaplicarlafórmula,adiferenciadelanterior,sedesconoce la distribución.

Setieneunamáquinaderefrescoscomoenelejemploanterior,perodelacualsedesconocesudesviaciónestándar.Paraestimarlacantidadpromediodelíquidosuministradoporlamáquinasetomaunamuestraalazarde50vasos,conmediade240mlydesviaciónestándarde20. Se calcula99%de intervalode confianzapara lamediade refrescosservidos.

Setomanlosdatos:eltamañodelamuestraes50, x = 240ys=20ml.Elintervalodeconfianzadelparámetromediaseobtienesustituyendoestosvaloresen la fórmulaanterior.

Secalculaprimeroelvalordezα/2,con1–α=0.99.Delastablasporcentualesparaladistribuciónnormalestándarsetienezα/2=2.575.Portanto,

240 2 57520

50240 2 575

20

50

232 72 247 28

< < +

< <

. .

. .

µ

µ

Esdecir,con99%deprobabilidadseafirmaqueelparámetromediadellíquidosuministradoporlamáquinaderefrescosseencuentraentre232.72y247.28ml.

3. Intervalo de confianza para la media poblacional µ cuando se desconoce σ en muestras pequeñas.

Dada x lamediadeunamuestradetamañon(n<30)tomadaalazardeunapoblacióncondistribuciónnormaldelacualseconoces2,ysedesconoceσ 2,elintervalodecon-fianza(1–α)de100%paraµestádadopor

x ts

nx t

s

n−

< < +

α αµ

2 2

dondetα/2eselvalordeladistribución t-Studentconv = n–1gradosdelibertad,lacualtieneunáreadeα/2,yses ladesviaciónestándarobtenidadelestadísticovarianzainsesgada. Sedenotaenestecasoquelaaplicacióndelafórmulasepuederealizarsiladistri-bucióndelapoblaciónesnormaloaproximadamentenormal,peroadiferenciadelcaso1,noseconoceelparámetroσ,ydelcaso2,eltamañodelamuestradebeserpequeño.

Unfabricantedemáquinasderefrescosaseguraquesusmáquinassuministranenpromedio240mlderefresco99.9%deloscasos.Uncompradordecideverificarestosdatos,porloquetomaunamuestraalazarde15vasos,obteniendolossiguientesresultados

243 250 240 248 245 250 238 246 252 247 246 240 250 249 248 240 245 247 238 248 250 252 247 239 245 249 250 248 247 251

Secalculacon99.9%deconfianzasiesválidalaafirmacióndelfabricante.Paraencontrarelintervalodeconfianzasenecesitacalcularlamediaylavarianza

insesgadadelamuestraobtenida: x = 246 27. y sn− =12 17 58. ,esdecir,s=4.19.

Ejemplo 4

Ejemplo 5

2�2 Estadística y probabilidad

Siendolamuestrade15vasos,seaplicaelcaso3,paralocualsecalculaelvalordetα/2,conv =15–1=14gradosdelibertady1–α=0.999,dondeα=0.001,esdecirα/2=0.0005.Portanto,aplicandolastablasporcentualesparaladistribuciónt-Studentsetienet0.0005=4.14.Enconclusión

246 27 4 144 19

15246 27 4 14

4 19

15

241 79

. ..

. ..

.

< < +

< <

µ

µ 2250 75.

Es decir, con 99.9% de probabilidad se determina que el parámetro media dellíquidosuministradoporlamáquinaderefrescosseencuentraentre241.79y250.75ml.Portanto,laafirmacióndelfabricantenoseráválidacon99%deconfianza,puestoqueelvalor240mlestáfueradelintervalo.

Ejercicio 2

1. Delasiguientemuestraaleatoria,tomadadeunpoblaciónnormal

13 19 14 12 21 14 17 20 17

calcula95%deintervalodeconfianzaparalamediadelapoblación

    a)  sisesabequelavarianzapoblacionales4    b)  sinoseconoceelvalordelavarianzapoblacional

2. Uningenierodecontroldecalidadmidió lasparedesde25botellasdevidriodedoslitros.Lamediamuestralfue4.02mmyladesviaciónestándarmuestral0.09,calcula95%deintervalodeconfianzarespectodelamediadelespesordelasparedesdelasbotellas.

3. Mientrasseefectúaunatareadeterminadaencondicionessimuladasdeausenciadegravedadelritmocardiacode40astronautasenadiestramientoseincrementa,26.4pulsacionesporminutoenpromediocondesviaciónestándarde4.28,calculalaverdaderamediaenelincrementodelritmocardiacosi x = 26 4. seutilizacomounaestimaciónpuntualdelincrementomedioenelritmocardiacoyseutiliza95%deconfianza.

4. Se realizan cinco mediciones en un medidor de volumen en la bomba de unaestacióndegasolina(10.5,10.0,9.90,9.95y10.15),supónnormalidadycalculaunintervalodeconfianzaparalamediaconα=0.05

5. Unamáquinaproducepiezasmetálicasdeformacilíndrica.Setomaunamuestraalazardepiezascuyosdiámetrosson10,12,11,11.5,9,9.8,10.4,9.8,10y9.8mm.Supónquelosdiámetrostienenunadistribuciónaproximadamentenormaly

a)  calcula99%deintervalodeconfianzaparaeldiámetropromediodetodaslaspiezas

b)  calcula99%deintervalodeconfianzaparaeldiámetropromediodepiezassiσ=1.

2�3Unidad 10 • infErEncia Estadística

Intervalos de confianza para la diferencia de medias en poblaciones aproximadamente normales

Despuésdeanalizarlosintervalosdeconfianzaparalamediapoblacional,secontinúaconelcálculodeintervalosdeconfianzaparaladiferenciademedias,elcualsedivideencincocasos.

1. Intervalo de confianza para µ1 – µ2 de poblaciones con distribuciones normales,

cuando se conocen σσ σσ12

22y .

Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2,respectivamente,depoblacionescondistribucionesaproximadamentenormales,delascualesseconoceσ σ1

222y ,elintervalodeconfianzade(1–α)de100%para

µ1yµ2estádadopor

( ) ( )x x zn n

x x zn n1 2

2

12

1

22

21 2 1 2

2

12

1

22

2− − + < − < − + +α α

σ σµ µ

σ σ

dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2.

Secomparandostiposderoscadetornillosparadeterminarsuresistenciaalatensión.Sepruebandocepiezasdecadatipodecuerdabajocondicionessimilares,obteniéndoselossiguientesresultados(enkg)

Siµ1yµ2sonresistenciaspromedioa latensióndelostornillostipoIytipoII,respectivamente,conlasvariacionesalatensióndelostornillostipoIytipoIIσ1

2 5= yσ2

2 10= ,respectivamente,secalcula90%deintervalodeconfianzaparaµ1–µ2.Primerosecalculanlasmediasmuestrales: x x1 270 5 71 4= =. .y .Lasmuestrassondetamañon1=n2=12.Secalculaelvalorparazα/2con90%de

intervalodeconfianzausandolastablasporcentuales,zα/2=1.645.

( . . ) . ( . . ) .70 5 71 4 1 6455

12

10

1270 5 71 4 1 645

5

12

10

121 2− − + < − < − + +

µ µ

22 74 0 941 2. .< − <µ µ

Esdecir,ladiferenciadelaresistenciapromedioalatensiónalfabricarlostornillostiposIyIIseencuentraentreelintervalo(–2.74,0.94),con90%deconfianza.Dadoqueenel intervaloseencuentrael0,nohaydiferenciasignificativaentre losdostiposderosca.

Ejemplo 6

1 2 3 4 5 6 7 8 9 10 11 12

68 70 72 69 71 72 70 69 75 69 70 71

75 73 73 68 68 67 69 75 74 68 73 74

Tipode rosca

1

2

2�4 Estadística y probabilidad

2. Intervalo de confianza para µ1 – µ2 de poblaciones cuando se desconocen σσ σσ12

22y

en muestras grandes.

Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2(n1≥30yn2≥30),respectivamente,depoblacionesdelascualessedesconocenσ σ1

222y ,elintervalodeconfianza(1–α)de100%paraµ1–µ2estádadopor

( ) ( )x x zs

n

s

nx x z

s

n

s

n1 22

12

1

22

21 2 1 2

2

12

1

22

2− − + < − < − + +α αµ µ

dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2y s s1

222, sonlasvarianzasinsesgadasrespectivasdelasmuestras1y2.

Retomandoelejemplo6,seprueban40tornillosdecadatipodecuerdabajocondicionessimilaresyseobtienenlossiguientesresultados(enkg).

deltipoI x s n1 1 172 5 2 45 40= = =. . ,y

deltipoII x s n2 2 269 8 1 75 40= = =. . ,y

Siµ1yµ2sonresistenciaspromedioalatensión,delostornillostipoIytipoII,respectivamente, se calcula 95% de intervalo de confianza para µ1– µ2 con el fin dedeterminarconcuáltipodetornillosesmásresistente.

Comoyaseconocenlosvaloresmuestralesparalamediayladesviaciónestándar,ysiendolasmuestrasgrandes(n1=n2=40>30),faltaúnicamenteencontrarelvalorparazα/2con95%deintervalodeconfianza.Usandolastablasporcentuales,zα/2=1.96

( . . ) .. .

( . . ) ..

72 5 69 8 1 962 45

40

1 75

4072 5 69 8 1 96

2 452 2

1 2− − + < − < − +µ µ22 2

1 2

40

1 75

40

1 78 3 62

+

< − <

.

. .µ µ

Puestoqueelintervaloparaladiferenciadelasmediaspoblacionalessiempreserápositivo,setiene95%deconfianzadequelaresistenciaalatensióndelostornillostipoIesmayoraladelosdeltipoII

µ1–µ2∈(1.78,3.62)indicaqueµ1–µ2>0,esdecirµ1>µ2

3. Intervalo de confianza para µ1 – µ2 de poblaciones normales cuando se desconocen

σσ σσ12

22y , pero se sabe que σσ σσ1

222== en muestras pequeñas.

Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2(n1<30yn2<30),respectivamente,depoblacionesaproximadamentenormalesdelasquesedesconocenσ σ1

222y peroseconocequeσ σ1

222= ,elintervalodeconfianza

(1–α)de100%paraµ1–µ2estádadopor

( ) ( ) ( ) ( )x x t sn n

x x t sn np p1 2

2 1 21 2 1 2

2 1 2

1 1 1 1− − + < − < − + +α αµ µ

Ejemplo 7

2�5Unidad 10 • infErEncia Estadística

dondetα/2eselvalordeladistribuciónt-Studentconv=n1+n2–2gradosdelibertad,elcualtieneunáreadeα/2

sn s n s

n np =− + −

+ −( ) ( )1 1

22 2

2

1 2

1 1

2

eslaestimacióncomúndeladesviaciónestándarpoblacionaly s s12

22y sonlasvarianzas

insesgadasrespectivasdelasmuestras1y2.

Laspruebasdetracciónendiezpuntosdesoldaduraparaundispositivosemiconductorprodujeronlossiguientesresultadosenlibrasrequeridaspararomperlasoldadura

15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5

Unsegundoconjuntodeochopuntosfueprobadoparadeterminarsilaresistenciaalatracciónseincrementaconunrecubrimiento,produciendolossiguientesresultados

24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

Sesuponedistribuciónnormal,secalcula90%deintervalodeconfianzaparaµ1–µ2,considerandoσ σ1

222= ,ambasdesconocidas.

Primerosecalculanlasmediasyvarianzasmuestrales

delconjunto1 x s n1 12

114 29 7 50 10= = =. . ,y

delconjunto2 x s n2 22

222 09 2 68 8= = =. . ,y

Conestosvaloressecalcula

sn s n s

n np =− + −

+ −=

− + −+ −

=( ) ( ) ( ) . ( ) .1 1

22 2

2

1 2

1 1

2

10 1 7 50 8 1 2 68

10 8 22..32

Faltadeterminarenlastablasporcentualesdeladistribuciónt-Studentelvalordetα/2con90%deconfianza(α=0.10esdecir,α/2=0.05)yv=n1+n2–2=16gradosdelibertad.Sedeterminaenlastablascorrespondientesquet0.05=1.746.

( . . ) . . ( . . ) .14 29 22 09 1 746 2 321

10

1

814 29 22 09 1 746 21 2− − × + < − < − + ×µ µ ..

. .

321

10

1

8

9 72 5 881 2

+

− < − < −µ µ

4. Intervalo de confianza para µ1 – µ2 de poblaciones normales cuando se desconocen

σσ σσ12

22y , pero se sabe que σσ ≠≠ σσ1

222 en muestras pequeñas.

Dadas x x1 2y lasmediasdemuestrasaleatoriasindependientesdetamañosn1yn2(n1<30yn2<30),respectivamente,depoblacionesaproximadamentenormalesdondesedesconocenσ σ1

222y perosesabequeσ σ1

222≠ ,elintervalodeconfianza

(1–α)de100%paraµ1–µ2estádadopor

( ) ( )x x ts

n

s

nx x t

s

n

s

n1 22

12

1

22

21 2 1 2

2

12

1

22

2− − + < − < − + +α αµ µ

Ejemplo �

2�6 Estadística y probabilidad

dondetα/2eselvalordeladistribuciónt-Studentcon

ν =

+

+

sn

sn

sn n

sn

12

1

22

2

2

12

1

2

1

22

2

11

2

2

11n

gradosdelibertad,elcualtieneunáreadeα/2,y s s12

22y sonlasvarianzasinsesgadas

respectivasdelasmuestras. De la fórmula anterior sepuede estimarque el resultadodel cálculode losgradosdelibertadgeneralmenteseráunacantidad no entera,porloquesiemprese debe redondear al entero más próximo(noalsiguiente),porejemplo,siv =14.3≈14;v =14.7≈15;v =14.5≈15.

Se retoman los datos del ejemplo 8, considerando que σ σ12

22≠ y son ambas desco-

nocidas.Sesuponenormalidad;secalcula90%deintervalodeconfianzaparaµ1–µ2;sedeterminaquétipodesemiconductorsinrecubrimiento(1)oconrecubrimiento(2)tienemásresistenciaalatracción.

Lasmediasyvarianzasmuestralessecalcularonanteriormente

delconjunto1 x s n1 12

114 29 7 50 10= = =. . ,y

delconjunto2 x s n2 22

222 09 2 68 8= = =. . ,y

Conestosvaloressecalculanlosgradosdelibertad

ν =

+

+

sn

sn

sn n

sn

12

1

22

2

2

12

1

2

1

22

2

11

=+

2

2

2

21

1

7 5010

2 688

7 5010

110 1n

. .

.

+

= ≈2 68

81

8 1

14 99 152..

Falta determinar, usando las tablas porcentuales de la distribución t-Student, elvalordetα/2con90%deconfianza(α=0.10esdecir,α/2=0.05)yv=15gradosdelibertad.Sedeterminaenlastablascorrespondientesquet0.05=1.753.

( . . ) .. .

( . . ) .14 29 22 09 1 7537 50

10

2 68

814 29 22 09 1 753

71 2− − + < − < − +µ µ

.. .

. .

50

10

2 68

8

9 63 5 971 2

+

− < − < −µ µ

Comoelintervalodeconfianzasiempreresultanegativo(de–9.63a–5.97),setiene90%deconfianzadequelaresistenciaalatracciónconrecubrimientoesmayorquesinrecubrimiento.

5. Intervalo de confianza para µd = µ1 – µ2 de poblaciones normales, cuando se desconocen σσ σσ1

222y , pero se sabe que son observaciones por pares en muestras pequeñas.

Dadas x sd dy la media y la desviación estándar de las diferencias normalmentedistribuidas de n pares aleatorios y dependientes de mediciones de muestras detamaño n(n < 30), respectivamente, de poblaciones aproximadamente normales

Ejemplo �

2�7Unidad 10 • infErEncia Estadística

dondesedesconoceσ σ12

22y ,elintervalodeconfianza(1–α)de100%para

µd=µ1–µ2estádadoporx t

s

nx t

s

nd

dd d

d−

< < +

α αµ

2 2

dondetα/2eselvalordeladistribuciónt-Studentcon v=n–1gradosdelibertad,elcualtieneunáreadeα/2.

En un proceso químico se comparan dos catalizadores para comprobar su efecto en elresultadodelareacción.SepreparóunamuestradedoceprocesosutilizandoelcatalizadormarcaL y tambiéndocede lamarca M; a continuación semuestran losdatos con losrendimientos.

Secalcula99%deintervalodeconfianzaparaladiferenciadeobservacionesigua-ladasysesuponequelosdatosestándistribuidosnormalmente.

Primerosedeterminanlasdiferenciasdelosdatosdelamuestra

Conestasdiferenciassecalculasuvalormedioyladesviaciónestándar

x sd d= =0 074 0 207. .y

Eltamañodelamuestraesdiez,porconsiguientelosgradosdelibertadv=10–1=9.De las tablasporcentualescorrespondientesa ladistribución t-Studentcon99%decon-fianza(α=0.01yα/2=0.005),setienequet0.005=3.25.Porúltimoelintervalodeconfianzaresulta

0 074 3 250 207

100 074 3 25

0 207

10

0 139

. ..

. ..

.

< < +

− <

µ

µ

d

dd < 0 287.

Ejercicio 3

1. Calcula si enunaclasedediezestudiantessetieneelmismorendimientoendospruebasdiferentes.Suspuntuacionesson

Considera95%de intervalode confianzapara ladiferenciade laspuntuacionesigualadasysupónnormalidadenlaspoblaciones.

Ejemplo 10

0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

L

M

0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

0.04 0.50 0.28 0.08 0.01 0.05 0.23 0.11 0.18 0.06

L

M

L – M

1 2 3 4 5 6 7 8 9 10

90 90 90 80 90 92 88 90 63 70

84 84 82 94 90 85 89 62 65 52

Estudiante:

Prueba 1:

Prueba 2:

2�� Estadística y probabilidad

2. Seaplicóunexamendematemáticasfinancierasaungrupodealumnos(grupoA),elcualobtuvolassiguientescalificaciones

3.0 3.5 4.0 8.1 7.2 8.9 8.2 10.0 10.0 9.0

Aotrogruposeleaplicóunexamendeálgebralinealconlassiguientescalificaciones

2.0 3.0 3.7 8.0 5.0 4.0 3.0 8.0 9.0 10.0 7.0 7.0 6.0

Calculaunintervalodeconfianzaparaladiferenciademediascon90%deniveldeconfianza.

3. Uncentrodeinvestigaciónenmedicinadeldeportedioaconocerlasdiferenciasenlastasasdeconsumodeoxígenoparavaronesuniversitariosentrenadoscondosmétodosdiferentes.Unodeellosrecibeentrenamientocontinuoyelotrointermitente,losdosconigualduración.Enlasiguientetablaseregistranlostamañosdemuestra,mediasydesviacionesestándarrespectivas,expresadosenmlporkg/min

Calcula las medias de estas poblaciones con 99% de intervalo de confianza;supónquelasvarianzaspoblacionalessondiferentesyquesudistribuciónesaproxima-damentenormal.

4. LosdatosquesemuestranacontinuaciónsonlosgradosdedurezaBrinellobtenidosparamuestrasdedosaleacionesdemagnesio

Supónqueprovienendepoblacionesaproximadamentenormalesconvarianzasquesondistintasyconsidera98%deintervalodeconfianzaparaµ1–µ2.

5. Sedicequeunanuevadietareduceelpesodeunapersona,4.5kgenpromedio,enunperiododedossemanas.Lospesosdesietemujeresquesiguieronestadietafueronanotadosantesydespuésdedichoperiodo.

Determinalaeficaciadeladietaconsiderando95%deintervalodeconfianzaparaladiferenciademediade lospesos;supónquesudistribuciónaproximadamentenormal.

    a) siσ σ12

22=

    b) siσ σ12

22≠

Entrenamiento intermitenteEntrenamiento continuo

xc = 43.71

nc = 9

= 4.87sc

x i = 39.63

ni = 7

= 9.68s i

1 2 3 4 5 6 7

58.5 60.3 61.7 69.0 64.0 62.6 56.7

60.0 54.9 58.1 62.1 58.5 59.9 54.4

Mujer

Peso anterior

Peso posterior

2��Unidad 10 • infErEncia Estadística

Intervalos de confianza para la varianza de poblaciones aproximadamente normales

Cuandosetratadeintervalosdeconfianzaparalavarianza,seconsiderandoscasos,unoparalasvarianzaspoblacionalesyelotroparaunarazónentrevarianzas.

1. Intervalo de confianza para σ 2 de poblaciones normales en muestras pequeñas.

Dadas2lavarianzadeunamuestraaleatoriadetamañon(n<30)deunapobla-ciónaproximadamentenormal,elintervalodeconfianza(1–α)de100%paraelparámetroσ 2estádadopor

( ) ( )n s n s−< <

1 12

22

22

1 22χ

σχα α

donde χ χα α22

1 22y − sonvaloresdeladistribuciónjicuadrada χ 2

(vertablasestadís-ticascorrespondientes)conv = n–1gradosdelibertad,loscualestienenáreasdeα /2y1–α /2,respectivamente.

Unantropólogomidióelancho(encentímetros)deunamuestratomadaalazardenuevecráneosdemiembrosdeciertatribu,yobtuvolossiguientesresultados

13.3 14.2 13.5 16.7 11.1 13.1 13.0 12.2 13.0

Secalcula95%deintervalodeconfianzaparalavarianzadedichatribu.Primerosecalculalavarianzainsesgadadelamuestras2=2.33.Elgradodeconfianzaestádadopor1–α=0.95,dondeα=0.05,esdecir

α/2=0.025y1–α/2=0.975.Buscandoenlastablasdeladistribuciónjicuadradaconv=9–1=8gradosdelibertad,setiene

χ χ χ χα α22

0 0252

1 22

0 975217 5345 2 1797= = = =−. .. .y

Porúltimo,resulta( ) .

.

( ) .

.

. .

9 1 2 33

17 5345

9 1 2 33

2 1797

1 06 8 55

2

2

−< <

< <

σ

σ

2. Intervalo de confianza para σσ σσ12

22 de poblaciones normales en muestras pequeñas.

Dadas s s12

22y lasvarianzasdemuestrasaleatoriasindependientesdetamañosn1y

n2 (n1 < 30 y n2 < 30), respectivamente, de poblaciones normales, el intervalo deconfianza(1–α)de100%paralarazóndelasvarianzasσ σ1

222estádadopor

s

s

s

s12

22

2 1 2

12

22

12

22 2 2 1

1

< <

f

αν νσσ

ν ν( , )

( , )

donde fα ν ν2 1 2( , )eselvalordeladistribuciónF(vertablascorrespondientes),conv1=n1–1gradosde libertaddelnumeradoryv2=n2–1gradosde libertaddeldenominadorelcualtieneunáreade α/2,similarmente fα ν ν2 2 1( , ).

Ejemplo 11

300 Estadística y probabilidad

Retomandolosdatosdelejemplo8sehizo lasuposicióndequeσ σ12

22= y secalculó

un intervalo de confianza para la razón de varianzas y se determinó si fue válida lasuposición,con90%deconfianza.

Losresultadosdelconjunto1fueron

15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5

Losresultadosdelconjunto2fueron

24.9 23.6 19.8 22.1 20.4 21.6 21.8 22.5

Alcalcularlasvarianzasmuestrales,delconjunto1seobtuvo s12 7 50= . ,n1=10,y

delconjuntodos s22 2 68= . ,n2=8.

FaltadeterminarusandolastablasporcentualesdeladistribuciónFlosvaloresde f fα αν ν ν ν2 1 2 2 2 1( , ) ( , )y con90%deconfianza(α=0.10esdecir,α/2=0.05)yv1=n1–1=10–1=9yv2=n2–1=8–1=7gradosdelibertad.SebuscaenlastablasdeladistribuciónFyseobtiene

f f f fα αν ν ν ν2 1 2 0 05 2 2 1 0 059 7 3 677 7 9 3 29( , ) ( , ) . ( , ) ( , ) .. . = = = =y 33Elintervalodeconfianzaresulta

7 50

2 68

1

3 677

7 50

2 683 293

0 76

12

22

12

22

.

. .

.

..

.

< <

<

σσ

σσ

<< 9 22.

Delintervalodeconfianzaparalarazónentrevarianzassedeterminaqueelvalor1estácontenidoenelintervalo.Portanto,con90%deconfianzasejustificalasuposiciónde

queσ σ12

22= ,yaqueσ σ1

222 1 0 76 9 22= ∈ ( . , . )ysisemultiplicanporσ2

2ambosmiembros

delaigualdadseobtieneσ σ12

22= .

Ejercicio 4

1. Ungeólogoestudiaelmovimientodeloscambiosrelativosenlacortezaterrestreenunsitioparticular,enunintentopordeterminarelángulomediodelasfracturaseligión=50fracturasydeterminaquelamediaesde39.8°yladesviaciónestándarmuestral esde17.20°.Considera99%de intervalode confianzapara estimar lavarianzadelapoblación(supónquelapoblaciónestánormalmentedistribuida).

2. Enunprocesoquímicosecomparandoscatalizadoresparaverificarsuefectoenelresultadodelareacción.SepreparóunamuestradediezprocesosutilizandoelcatalizadormarcaLydiezconelde lamarcaM,acontinuaciónsemuestran losdatosconlosrendimientos

Ejemplo 12

0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92

0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86

L

M

301Unidad 10 • infErEncia Estadística

Considera99%deintervalodeconfianzapararazónentrevarianzasdelosrendi-mientosdeloscatalizadores;supónquelosdatosestándistribuidosnormalmente.

3. Elespesordelasparedesde25botellasdevidriodedoslitrosfuemedidoporuningenierodecontroldecalidad.Lamediamuestralfuede4.02mmyladesviaciónestándarmuestralde0.09.Considera95%deintervalodeconfianzaconrespectodelavarianzadelespesordelasparedesdelasbotellas.

4. Se realizan cinco mediciones en un medidor de volumen en la bomba de unaestacióndegasolina(10.5,10.0,9.90,9.95y10.15),supónnormalidadycalculaunintervalodeconfianzaparalavarianzaconα=0.05.

Intervalos de confianza para las proporciones en muestras grandes

1. Intervalo de confianza para el parámetro p en muestras grandes.

Si ˆ ˆ ˆp q py = −1 sonlasproporcionesrespectivasdeéxitosyfracasosenunamuestraaleatoriade tamañon (n≥30),el intervalodeconfianza (1–α)de100%paraelparámetrobinomialpestádadopor

ˆˆˆ

ˆˆˆ

p zpq

np p z

pq

n− < < +α α

2 2

dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2.

Enunamuestraaleatoriadecienposiblesclientes,70prefierendeterminadoproducto.Se considera95%de intervalode confianzapara la proporciónde todos losposiblesclientesqueprefierentalproducto.

Paraelintervalodeconfianzadelaproporciónprimerosedeterminaelvalordeéstadepersonasqueprefierenelproducto

ˆ . ˆ .p q= = = =70

1000 70

30

1000 30y

Enestecasosetiene95%deconfianza,portanto,1–α=0.95,yusandolastablasporcentualesdeladistribuciónnormalsetienezα/2=1.96.Porúltimo

0 70 1 960 70 0 30

1000 70 1 96

0 70 0 30

100

0 6102 0 78

. .. .

. .. .

. .

−×

< < +×

< <

p

p 998

2. Intervalo de confianza para p1 – p2 de poblaciones en muestras grandes.

Dadas ˆ ˆp p1 2y lasproporcionesdeéxitosdelasmuestrasaleatoriasdetamañosn1yn2(n1≥30yn2≥30),respectivamenteyˆ ˆ ˆ ˆq p q p1 1 2 21 1= − = −y ,elintervalodeconfianza(1–α)de100%paraladiferenciaentrelosdosparámetrosbinomialesp1–p2estádadopor

(ˆ ˆ )ˆ ˆ ˆ ˆ

(ˆ ˆ )ˆ ˆ

p p zp q

n

p q

np p p p z

p q

n1 22

1 1

1

2 2

21 2 1 2

2

1 1

1− − + < − < − +α α ++

ˆ ˆp q

n2 2

2

dondezα/2eselvalordeladistribuciónnormalestándar,elcualtieneunáreadeα/2.

Ejemplo 13

302 Estadística y probabilidad

Unafirmamanufactureradecigarrosdistribuyedosmarcas.Siseencuentraque56de200fumadoresprefierenlamarcaAyque29de150fumadoresprefierenlamarcaB,seconsidera95%deintervalodeconfianzaparapA–pB;sedeterminasiesválidosuponerquelapoblacióndefumadoresprefierelamarcaB,sobrelamarcaA.

DadapA laprobabilidaddeque56de200 fumadoresprefieran lamarcaA, suestadísticoresulta

ˆ .pA = =56

2000 28

detalformaque ˆ .qA = 0 72conn1=200.Asimismolaprobabilidaddeque29de150prefieranlamarcaBresulta

ˆ .pB = =29

1500 19

detalformaqueˆ .qB = 0 81conn2=150.Porúltimoparaelintervalode95%deconfianza,delastablasporcentualesparaladistribuciónnormalresultaquezα/2=1.96,empleandolafórmulacorrespondienteparapA–pB

( . . ) .. . . .

( . .0 28 0 19 1 960 28 0 72

200

0 19 0 81

1500 28 0 19− −

×+

×< − < −p pA B )) .

. . . .

. .

< − <

1 960 28 0 72

200

0 19 0 81

150

0 0018 0 1782p pA B

ComopA–pB>0entoncespA>pB.Portanto,noesválidalasuposicióndequelapoblacióndefumadoresprefierela

marcaBsobrelaAcon95%deconfianza.

Ejercicio 5

1. Para estimar la propuesta de los trabajadores desempleados en Panamá, uneconomistatomaunamuestraalazarde400personasdeclaseobrera,donde25resultaronsinempleo.CalculalaproporciónrealdetrabajadoresdesempleadosenPanamáconsiderando97%deunintervalodeconfianza.

2. Unrector registródebidamenteelporcentajedecalificacionesD yFotorgadasalosestudiantespordosprofesoresuniversitariosdehistoria.ElprofesorIalcanzó32% contra 21% del profesor II, con 200 y 180 estudiantes, respectivamente.Considera90%deintervalodeconfianzaparaladiferenciadeproporciones.

3. Un antropólogo está interesado en la proporción de individuos que presentanbraquicefaliaendostribusindígenas.Supónquesetomanmuestrasindependientesdecadaunadelastribusysedescubreque24decada100nativosdelatribuAy36decada120delatribuBposeendichacaracterística.Considera95%deintervalodeconfianzaparaladiferenciap1–p2entrelasproporcionesdeestasdostribus.

10.2 Pruebas de hipótesis

En la sección anterior se analizaron los intervalos de confianza para el cálculo deestimacionessobrelosparámetrosyparatomardecisionesaltrabajarconlapoblacióndeinterés.Enestasecciónseestudiaráotrométodoestadísticoquepermitatomardeci-sionesenproblemasrelacionadosconpoblacionesqueresultanmuydifícilesoimposiblesdeanalizarensutotalidad.Porejemplo,parapoderconcluirconciertaveracidadsobrela

Ejemplo 14