estadistica experimental

402
ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniería 1 E E E S S S T T T A A A D D D Í Í Í S S S T T T I I I C C C A A A E E E X X X P P P E E E R R R I I I M M M E E E N N N T T T A A A L L L A A A p p p l l l i i i c c c a a a d d d a a a a a a c c c i i i e e e n n n c c c i i i a a a e e e i i i n n n g g g e e e n n n i i i e e e r r r í í í a a a E E E d d d i i i c c c i i i ó ó ó n n n C C C O O O N N N C C C Y Y Y T T T E E E C C C P P P A A A L L L A A A C C C I I I O O O S S S C C C . . . S S S E E E V V V E E E R R R O O O

Upload: nelson-quintana

Post on 06-Aug-2015

1.067 views

Category:

Documents


5 download

TRANSCRIPT

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera

Aplicada a ciencia e ingeniera

ESTADSTICA EXPERIMENTAL

Ediiciin CONCYTEC Ed c n CONCYTEC

PALACIOS C.. SEVE1RO PALACIOS C SEVERO

Palacios C. Severo

ESTADSTICA EXPERIMENTAL Aplicada a ciencia e ingeniera PALACIOS C. Severo CEO Proceso SEVERO [email protected] [email protected] (+511) 996696214, Lima Per (+5152) 952672846, Tacna Per (+505) 84566216 Centro Amrica Primera edicin: ISBN: Hecho el Depsito Legal en la Biblioteca Nacional del Per N PALACIOS C. Severo CONCYTEC en la presente edicin Tiraje: 1000 ejemplares Subvencin CONCYTEC N Consejo Nacional de Ciencia, Tecnologa e Innovacin TecnolgicaCONCYTEC Presidente: Dr. Augusto Mellano Mndez Av. Del Aire 485, San Borja, Lima Per Telefax: (51) 01-2251150 www.concytec.gob.pe Impreso por: Derechos Reservados. Prohibida la reproduccin de esta publicacin por cualquier sistema conocido sin la autorizacin escrita del autor; y del editor en la presente edicin.EIRL

2

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera

La presente obra esta dedicada a la Memoria de: Juan de la Cruz Palacios Avendao Adelaida Calisaya Flores Luz Lucila Zeballos Argandoa Camila Palacios Zeballos Ceferina Chambilla Chambilla Gustavo Vallenas Casaverde Con mucho amor a quienes amor nos dio, que Dios lo tenga en su gloria y nosotros en nuestro corazn

3

Palacios C. Severo

Un reconocimiento muy especial al Rector de la Universidad Nacional Micaela Bastidas de Abancay Dr. Leoncio Carnero Carnero

4

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera

CONTENIDOCONTENIDO Prlogo Introduccin Estadstica bsica Introduccin Recopilacin de datos Cuestionario como fuente de datos Presentacin de datos Anlisis de datos Distribucin de frecuencia Criterios de distribucin de frecuencia Medias de tendencia central Medidas de disepersin Problemas Estimacin de parmetros Diferencias significativas Dispersin de los datos problemas Problemas Distribuciones Intervalos de confianza Muestreo Mtodos de muestreo Toma de decisiones Principios para la toma de decisin Planificacin Problemas Anlisis de regresin Introduccin Mtodos de mnimos cuadrados Modelos de regresin Modelo de regresin lineal con k variables Regresin lineal simple Regresin lineal mltiple Regresin polinomial Regresin polinomial cuadrtica Regresin no lineal Coeficiente de correlacin mltiple R Prueba de significanca Pgina 9 11 13 13 14 15 15 16 17 19 19 26 29 39 39 40 43 50 54 55 55 59 62 62 64 67 67 67 70 70 71 73 74 75 76 77 77 5

1 I. II. III. IV. V. VI. VII. VIII. IX. X. XI. XII. XIII. XIV. XV. XVI. XVII. XVIII. XIX. 2 I. II. III. IV. V. VI. VII. VIII. IX. X. XI.

Palacios C. Severo Problemas Principios de diseo experimental Introduccin Tipo de experimentos Unidades experimentales y mustrales Fuente de variacin Control de la variacin del no tratamiento Propiedades del diseo estadstico Replicacin Aleatorizacin Control local Clasificacin de los diseos Estrategia del diseo Diseo de tratamientos Diseo de muestreo Estudio experimental Problemas Diseo experimental aplicado a ciencias Introduccin Limitaciones Prediccin Diseo experimental Diseo aleatorizado Diseo unifactorial con n niveles Diseo de parcelas divididas Problemas Diseo totalmente aleatorizado Problemas Diseo de bloques aleatorizados Problemas Diseo cuadrado latino Problemas Diseo cuadrado greco latino Problemas Prueba de intervalos mltiples de Duncan Diseo doble reverso Problemas Estimacin de parmetros del modelo Polinomio ortogonal Mtodos de anlisis Introduccin Mtodos no paramtricos 81 83 83 84 86 87 90 92 96 97 99 101 103 104 105 106 110 111 111 111 112 113 113 114 118 121 129 131 134 141 143 147 151 153 154 154 157 158 159 161 161 162

3 I. II. III. IV. V. VI. VII. VIII. IX. X. XI. XII. XIII. XIV. 4 I. II. III. IV. a) b) c) V. VI. VII. VIII. IX. X. XI. XII. 5 I. II.6

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera III. IV. V. VI. 6 I. II. III. IV. V. VI. VII VIII. IX. X. XI. XII. XIII. XIV. XV. XVI. XVII. XVIII. XIX. XX. XXI. XXII. A. B. C. D. Prueba U de Mann Whitney Prueba H de Kruskal Wallis Mtodos multivariables Correlacin de Spearman Problemas Diseos experimentales aplicado a ingeniera Introduccin Problemas Diseos bifactoriales Comparacin mltiple Diseo anidado Problemas Diseos factoriales Diseo factorial 2n Diseo factorial 2 Problemas Diseo factorial 2 Problemas Diseo factorial 2k replicado Problemas Diseo 2k con pruebas centrales Diseo confundido Diseo factorial 2k con dos bloques Diseo factorial 2k con cuatro bloques Diseo factorial 2k con bloques replicados Algoritmo de Yates Problemas Diseo factorial fraccionado Medio fraccionado del diseo 2k Cuarto fraccionado del diseo 2k Problemas Diseo Plackett Burman Problemas Diseos factoriales 3n Problemas Diseos rotables Diseos rotables con dos factores Diseo trigonal Diseo pentagonal Diseo hexagonal Problemas Diseo octogonal 162 165 166 168 171 173 173 176 177 180 182 184 186 188 189 195 205 221 225 228 231 233 233 235 236 237 239 244 245 247 250 258 263 266 270 275 275 275 276 276 280 281 7

Palacios C. Severo E. F. G. Diseo compuesto centrado Problemas Diseo experimental comercial EXCO Diseo Severo Diseo factorial centrado de dos factores Diseo Factorial centrado de tres factores Diseo rotable centrado de n factores Problemas Superficie respuesta Introduccin Superficie respuesta Polinomio de primer orden Prueba de significancia Prueba de falta de ajuste Mxima pendiente ascendente Polinomio de segundo orden Caracterizacin de la superficie respuesta Diseo de superficie respuesta cuadrtico Superficie de respuesta cuadrtica Exploracin de superficie respuesta Punto estacionario Criterio de formas cuadrticas Anexo Referencias 282 291 295 298 300 305 308 311 323 323 323 324 325 326 328 331 333 340 350 354 367 368 387 393

7 I. II. III. IV. V. VI: VII: VIII: IX. X. XI. XII. XIII.

8

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera

PRLOGOEl objetivo primordial del presente libro es presentar los conceptospara diferentes situaciones reales que se ven a diario en el campo social, industrial y experimental. Se ha concebido primordialmente como un texto introductorio en planificacin y control de operaciones a nivel laboratorio, bach e industrial. Tambin se ha proyectado como un libro de referencia para agronomomos, alimentarios, pesqueros, biologos, medicos, civiles, gegrafos, ambientalistas, mecnicos, mineros, metalurgistas y qumicos de Pre, Postgrado y Maestra, practicantes y cientficos encargados de la planificacin y operacin de sistemas productivos tanto en la ciencia como en la ingeniera. El libro es el resultado de conferencias ofrecidas en diferentes centros acadmicos latinoamericanos. Se ha intentado resaltar los conceptos tcnicos y afirmando sin duda y sin excusas que la presentacin es exactamente fidedigna. Se presentan los conceptos que considero pueden contribuir ms a la comprensin de los principios, con referencia a los que pueden realizarse con los conocimientos bsicos y las posibilidades e instrumentos de la tecnologa actual. Se ha intentado presentar un marco conceptual que estimule la habilidad del lector de las diversas ramas del saber (Biologa, Medicina, Ciencias Sociales, Economa, Administracin, Ingenieras y reas Tcnicas) para entender la manera en que los factores (variables) interactan en un sistema real de trabajo. La orientacin del libro, no esta matemticamente sofisticado. Los conocimientos previos necesarios como el clculo, probabilidades y estadstica descriptiva. En algunas secciones se realiza el uso de operaciones elementales de matrices. El libro est diseado como un manual dividido en partes con captulos para su mejor comprensin. Se propone servir como fuente de referencia para tratar casos especfic0s de los lectores. Los ejemplos resueltos (fueron desarrollados aplicando los programas estadsticos Statgraphics Centurion y ESPC elaborado para el presente libro), sirven para ilustrar y ampliar las teoras, sin lo cual el lector sentira un vaci. Las demostraciones de procesos industriales se in9

Palacios C. Severo cluyen en ello. Los problemas suplementarios completan la revisin del material tratado en cada tema. El material cubre un curso habitual con el fin de flexibilizar, ampliar y mejorar los sistemas curriculares, siendo este un libro de consulta para inters de otros temas. No deseo finalizar sin agradecer a mi amigo Luis Solrzano Espinola por la revisin minuciosa y detallada de la presente edicin del presente libro, su tiempo y esfuerzo es un aporte a la ciencia y tecnolga como l siempre viene desarrollando en las aulas con los estudiantes de pre grado. Finalmente deseo agradecer a CONCYTEC por tan importante aporte a la educacin a nivel de nuestro pas, as mismo estoy en deuda con muchas universidades latinoamericanas gubernamentales como privadas por la cooperacin para la elaboracin del presente, de igual manera con prestigiosos colegas por su colaboracin para la culminacin de tan importante tema. Palacios C. Severo CEO Proceso SEVERO Mvil: (+511) 996696214 [email protected]

10

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera

INTRODUCCINSi su trabajo tiene que ver con la investigacin cientfica tecnolgica (ciencias e ingeniera). Probablemente se ha dado cuenta que la mayora de los libros de estadstica (bsica y avanzada) son abstractos y no ayudan mucho en el tratamiento de la base de datos, pero usted sabe que el proceso al cual estudia funciona (de manera eficiente y sin problemas), es por ello que se tuvo que realizar el esfuerzo a fin de brindar al amable lector un texto con caractersticas nuevas a fin de poder llenar muchos vacos, los cuales son parte de la experiencia. Lo que desea saber el investigador es como analizar e interpretar los datos de un proceso para tomar una decisin sobre los rangos ptimos, pero necesita saber cmo llevar a cabo una prueba experimental (laboratorio, bach e industrial); sabe que la estadstica experimental le ayudara a seleccionar los rangos (niveles) y variables (factores) significativas del procesos innovativo, pero requiere ideas sobre como seleccionar estos. En la presente obra le explicaremos y despejaremos sus dudas. La palabra estadstica se origina, en las tcnicas de recoleccin, organizacin, conservacin, y tratamiento de las diversas bases de datos propios, con que los antiguos gobernantes controlaban sus sbditos y dominios econmicos. Estas tcnicas evolucionaron a la par con el desarrollo de las matemticas utilizando sus herramientas en el proceso del anlisis e interpretacin de la informacin. Estadstica Experimental aplicada a ciencia e Ingeniera, el libro que en esta ocasin presento a los lectores de habla hispana, es un importante aporte. Por lo til y por la novedad de su enfoque, a la falta de bibliografa. Para comprender los beneficios que pueden derivarse de la utilizacin de los conceptos (fundamentos) presentados, conviene tener presente la complejidad creciente de nuestras industrias (automatizacin), impuesta por los diferentes factores que estn incidiendo en el cambio vertiginoso que caracteriza a nuestra poca (competitividad) y que, en mayor o menor grado, con mayor o menor velocidad, llega a todas las regiones y pases del mundo. Veamos algunos de los factores de complejidad en operaciones industriales. La planta recibe rdenes de produccin que deban ser procesados y cumplidos en un 11

Palacios C. Severo lapso determinado, utilizando recursos internos y externos casi siempre escasos. La importancia de los resultados, anticipado en la toma de decisiones, empieza a buscar respuestas a otro tipo de preguntas Qu es lo mejor? Cmo optimizar un determinado conjunto de variables para alcanzar un fin especfico? Que significan nuestros datos y que grado de confianza podemos tener en ello visto una prediccin. El mundo actual requiere otras herramientas analticas, aquellas que nos permitan crear modelos (lenguaje de comunicacin) y definir relaciones entre diversos factores (interacciones). Esto requiere entre otras cosas que podamos guardar conjuntos particulares de datos aparte de las rutinas de anlisis (numrico y sostenible) que se realicen en base a ella. El presente texto no pretende teorizar el saber estadstico, desde luego, no es un libro para estadsticos, ya que, adrede se obvia el rigor cientfico de lo expuesto en beneficio de la sencillez necesaria para el nefito; con un lenguaje coloquial se conduce al lector a travs del contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados. El avance tecnolgico en la informtica ha contribuido enormemente al desarrollo de la estadstica, sobre todo en la manipulacin de la informacin, pues en el mercado existen paquetes estadsticos de excelente calidad, como el SAS, SPSS, SCA, Statgraphics, amn de otros, que corren en un ordenador sin mayores exigencias tcnicas, permitiendo el manejo de grandes volmenes de informacin y de variables.

12

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera

1ESTADSTICA BSICA(...) Conseguimos obtener as la frmula estadstica para conocer aproximadamente la posicin de un electrn en un instante determinado. Pero, personalmente, no creo que Dios juegue a los dados. Albert Einstein

I.

INTRODUCCIN

En las ltimas dcadas la estadstica ha alcanzado un alto grado de

desarrollo, hasta el punto de incursionar en la totalidad de las ciencias e ingeniera; inclusive, en la lingstica se aplican tcnicas estadsticas para esclarecer la paternidad de un escrito o los caracteres ms relevantes de un idioma. La estadstica es una ciencia auxiliar para todas las ramas del saber humano; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre y la estadstica ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza. Los crticos de la estadstica afirman que a travs de ella es posible probar cualquier cosa que sucede en la naturaleza, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifactico de los mtodos estadsticos. Sin embargo muchos investigadores tendenciosos han cometido abusos con la estadstica, elaborando investigaciones de intencin, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadstica utilizando modelos inapropiados o razonamientos ilgicos y errneos que conducen al rotundo fracaso de sus investigaciones. A veces nuestras vidas parecen estar controladas por estadsticas. De informes sobre el tiempo, lectura de las presiones sanguneas, todos tenemos que ver rutinariamente con una amplia variedad de medidas estadsticas. 13

Palacios C. Severo El anlisis estadstico es til para la investigacin (tecnolgica y cientfica), pues ayuda a resumir e interpretar el gran volumen de cifras que resultan an en la encuesta ms pequea. Los principios estadsticos que se usan en la investigacin provienen en gran escala de las ciencias sociales, economa e ingeniera. Como resultado hay gran cantidad de libros enteros sobre estadstica, probablemente ms que sobre cualquier otro aspecto de la investigacin. El propsito de la presente obra es darle a usted una visin panormica de los tipos de medidas estadsticas ms importantes que se usan. Si usted requiere informacin ms detallada, consulte algunos de los muchos libros buenos en estadstica que estn disponibles1. Aunque existen centenares de medidas y pruebas estadsticas que pueden utilizar los investigadores, nosotros estudiaremos los de amplia aplicacin para desarrollar los trabajos prcticos. II. RECOPILACIN DE DATOS

El primer paso para describir un fenmeno natural es reunir los datos estadsticos necesarios. La fuente de los datos puede clasificarse como internas o externas. Los datos internos incluyen estadsticas sobre las operaciones de la empresa, tales como estadsticas de produccin, comercializacin, transformacin, etc. Los datos estadsticos no vinculados con el funcionamiento de la empresa propiamente dicha se llaman datos externos. La gerencia de produccin de una fbrica de fundicin puede necesitar informacin sobre la cantidad de cierto metal en el mercado nacional, con el propsito de estimar las ventas a 10 aos plazo. Hay enormes cantidades de datos comerciales, empresariales, farmacuticos, que pueden consultarse en las bibliotecas pblicas y en las universidades. El gobierno es el mayor editor de estadsticas anuales, mensuales, semanales, diarias. Una publicacin anual del Instituto Nacional de1

Ver referencias bibliogrficas

14

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera Estadstica contiene ms de mil pginas de datos sobre precios, educacin, produccin y otros puntos, que son de utilidad para los que procesan datos: economistas, analistas y dems profesionales. III. CUESTIONARIO COMO FUENTE DE DATOS Los datos estadsticos relativos a la opinin corriente de los consumidores sobre determinados programas de televisin, nuevos productos, candidatos polticos y otros, no pueden hallarse en publicaciones. Por ello, este tipo de informacin debe reunirse a travs de la entrevista personal, por cuestionarios o algn otro medio. La ventaja de ello es el alto porcentaje de respuestas posibles. Sin embargo, es por regla general ms costosa que enviar cuestionarios por correo. Las firmas de analistas y consultores saben que es inconveniente el formulario postal como instrumento para recopilar datos por ser relativamente bajo el porcentaje de respuestas a ciertos cuestionarios. La conveniencia principal del cuestionario como tcnica de recopilacin de datos es sus costos relativamente bajo. IV. PRESENTACIN DE DATOS Grfica de lneas simples y de barras simples. Cualquiera de estos dos tipos de grfico puede utilizarse ventajosamente para representar la tendencia general de la produccin. El cmulo de datos estadsticos dentro de una empresa, de fuentes publicadas, o recopilados por entrevistas personales, no est usualmente apta para un anlisis. Los datos deben organizarse y presentarse en una tabla o grfico, antes de efectuar ningn anlisis ni interpretacin. Si se necesitan cifras exactas de un informe convendra presentar los datos en una tabla. En caso contrario, es preferible un grfico para atraer la atencin del lector. Grfico de lneas mltiples y de barras mltiples. La tendencia o movimiento de las exportaciones de dos comercializadoras se pueden representar grficamente. Grfico de barras de componentes. El gerente de ventas de una embotelladora desea graficar el total de ventas en tres aos y tambin la variedad de los productos en relacin con el total. Podra utilizar un grfico de lneas o un grfico de barras. 15

Palacios C. Severo Grfico de barras bi direccionales. Para indicar los cambios porcentuales puede utilizarse un grfico bi direccional, que tambin es til para ilustrar ganancias y prdidas, produccin o ventas cobre lo normal o bajo lo normal de un perodo a otro. Por ejemplo, se representan los cambios porcentuales de ventas correspondientes a cinco aos de ventas:Sucursales Mercado Central Mercado Sur Mercado Norte Mercado Este Mercado Oeste 2005 10 5 2 6 10 Ventas 2010 8 7 4 3 11 Cambio Porcentual -20 +40 +100 -50 +10

V.

ANLISIS DE DATOS

Un anlisis de datos suele seguir los siguientes pasos: Anlisis exploratorio de datos: Estadstica descriptiva de cada variable por separado. Se obtienen medidas de tendencia central, variabilidad, representacin grfica, etc. Se pretende conocer cada variable as como detectar errores, valores extremos. Estadstica Bivariable: Estudia las relaciones entre pares de variables, utilizando estadsticos como el coeficiente de correlacin Chi cuadrado, t de Student, etc. y representaciones grficas diversas. Anlisis Multivariante: Analiza simultneamente dos o ms variables. Los mtodos pueden ser predictivos cuando existe una variable criterio o independiente que se explica o identifica por un conjunto de variables independientes, predoctoras o explicativas (Regresin lineal, Regresin cuadrtica, anlisis discriminante, anlisis de varianza) o reductivos cuando se estudian las relaciones entre un conjunto de variables o casos sin que exista una variable a identificar (componentes principales, anlisis factorial, correspondencia binaria, correspondencia mltiple). Usos de variables en el anlisis Las variables pueden ser definidas para medir una determinada salida o respuesta o bien para explicar por que se obtiene una determinada salida. Por ejemplo en el estudio de una enfermedad, las variables edad, antecedentes, severidad del estado, tratamiento son variables16

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera explicativas o independientes. Las variables discretas sana/no sana es la variable dependiente. En ciertos anlisis exploratorios todas las variables se usan como un nico conjunto, sin distincin entre independientes y dependientes. Anlisis apropiado de datos Son dos motivos por lo que resulta difcil la eleccin de la tcnica estadstica adecuada para un investigador con datos reales. El primero es que los libros de estadstica y los cursos curriculares se presentan en un orden lgico desde el punto de vista de la enseanza de las materias, pero desde el punto de vista del proceso del anlisis de datos. La segunda es que los datos reales contienen mezcla de tipos de datos que hacen la eleccin del anlisis arbitrario. Una buena estrategia consiste en aplicar diferentes anlisis al mismo conjunto de datos, lo que nos proporcionar informacin variada sobre el fenmeno en estudio. Para decidir el anlisis apropiado se clasifican las variables como: Independiente frente a dependientes Nominal u ordinaria frente intervalos

VI. DISTRIBUCIN DE FRECUENCIA Los problemas industriales abarcan una gran masa de datos cuantitativos a los que deben darse ciertas formas significativas antes de poder efectuar ningn anlisis e interpretacin. Una forma de uso corriente es la distribucin de frecuencia. Existen dos tipos de variables, a saber: discretas y continuas. El anlisis de la distribucin de frecuencia se refiere a datos continuos. Ordenamiento Los datos que se haya sin agrupar son difciles de analizar. Sea, por ejemplo, determinar los ingresos bajos y los elevados y un punto central de concentracin, si lo hubiere. 17

Palacios C. Severo Por lo tanto es esencial, para analizar las entradas, organizar los datos que estn sin agrupar en una forma agrupada llamada distribucin de frecuencia. Segn la naturaleza de la variable estudiada las distribuciones de frecuencias pueden ser: Datos no agrupados: se presentan cuando el nmero de valores que puede presentar la variable no es muy elevado, y en ese caso podemos observar todos los valores de esa variable. Este caso se presenta cuando la variable es discreta y continua no presenta excesivos valores. Datos en intervalos: se presenta cuando la variable es continua o cuando es discreta pero con elevado nmero de valores. En esta situacin se agrupan dichos valores en intervalos o clases. Los intervalos se notan: ei1 eies intervalo i-simo. Se llama amplitud del intervalo a la distancia que existe entre los extremos.

ai ei ei1Se llama marca de clase al punto medio de un intervalo. Este punto es importante porque es el representante del intervalo.

x i

e

i 1

e 2

i 1

Se llama densidad de frecuencia de un intervalo a la frecuencia correspondiente a cada unidad de la variable en dicho intervalo.

di

ni ai

Los intervalos se suelen tomar abiertos por la izquierda y cerrados por la derecha, salvo el primero que se toma cerrado por los dos lados. En este tipo de distribuciones se pierde parte de la informacin al18

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera agruparlas en intervalos, ya no se puede hablar de valores concretos sino de intervalos. Cuanto mayor sea la amplitud de los intervalos menos intervalos habr, y por tanto menos precisin tendremos. En cambio, cuanto menor sea la amplitud de los intervalos menos intervalos habr, y mayor ser la precisin, sin embargo la distribucin ser mas grande y ms difcil de manejar. Intervalo de clase Con el propsito de preparar una distribucin de frecuencia a partir del ordenamiento y el apuntado, los ingresos podran agruparse arbitrariamente en clases con un intervalo digamos 250 dlares. Este valor se denomina amplitud de clase. El intervalo de clase es, sencillo, la amplitud de los ingresos mensuales para cada clase. Una manera conveniente de determinarlo es encontrar la diferencia entre los lmites inferiores de dos clases adyacentes o la diferencia entre las marcas de clase adyacente. VII. CRITERIOS DE DISTRIBUCIN DE FRECUENCIA En la prctica, la cantidad total de clases vara usualmente de un mnimo de 5 a un mximo de 20. El hecho de que sean muy pocas o muchas clases no nos aclara la caracterstica esencial de los datos. Por ejemplo, si organizamos los ingresos de los operadores de computadoras solamente en dos clases:Ingreso Mensual (US$) De 250 a 400 De 400 a 600 Cantidad de operarios 25 23

Un anlisis de distribucin de frecuencia no revelara mucho acerca de la estructura de los ingresos de los operarios. Siempre que sea posible, el intervalo entre todas las clases se la distribucin de frecuencia deber ser igual. Los intervalos desiguales originan problemas al graficar y al calcular promedios y otras medias estadstica. VIII. MEDIDAS DE TENDENCIA CENTRAL Una medida de tendencia central es un nmero que representa el valor central de un conjunto de valores. Habitualmente, estas medidas se 19

Palacios C. Severo llaman promedios. He aqu algunos ejemplos: el ingreso promedio de una familia, es de US$ 1500 por ao; para el peso promedio de 60 fardos de fibra de llama utilizados para el tejido de alfombras y un dimetro promedio de pistones maquinados durante un jornal. En el presente se consideran las herramientas estadsticas que ms comnmente se usan: Media aritmtica Generalmente se le llama media o promedio. La media es simplemente la suma de una serie de datos numricos dividida por el nmero total de ellos. Es apropiado usar la media cuando los resultados son simtricos y tienen una distribucin normal. Pero existen casos que estudiaremos a continuacin: Datos no agrupados: Si los datos no estn agrupados la media aritmtica se calcula tomando todas las mediciones y dividiendo la suma por el nmero de stos. Datos agrupados: La resistencia a la traccin de varios filamentos son 6, 6, 7, 7, 8, 8, y 9,4. Estos valores se agrupan en una distribucin de frecuencia. El punto medio de cada clase se usa para representar la clase. El punto medio de la clase se multiplica entonces por el nmero de frecuencia en esa clase. La suma de estos productos se divide por la cantidad total de datos para obtener la media aritmtica. Ejemplo 1.1 La tabla 1.1 muestra los puntajes de tres artculos en una prueba de degustacin, usando preguntas cualitativas de escalas, a fin de cuantificar los valores. Todos los productos probados tienen la misma media. La media de 20 es esta escala es bastante descriptiva de la distribucin normal del producto 1, pero sera engaoso si se usara para describir el producto 2 el producto 3. La mayora de los resultados en una investigacin tienen una distribucin normal (es decir, en forma de campana alrededor de un punto medio) pero otras distribuciones son lo bastante20

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera comunes como para que se deba verificar siempre, antes de usar la media, si sta es en realidad descriptiva.

X

Xi n

i 1,2,...n

La media tiene otra debilidad sobre la que se debe estar alerta: se ve afectada por las observaciones extremas.Tabla 1.1 Puntaje de tres productos en preguntas de degustacin Nivel de Producto degustacin 1 2 3 5 10 20 0 4 5 20 50 3 70 20 50 2 5 20 0 1 10 20 0 Media 20 20 20

Ejemplo 1.2 Si los ingresos de dos profesionales se promedian con los ingresos de diez peones, el ingreso para todos los doce ser de ms de US$ 250, que obviamente es una cifra engaosa, si se evita usar la media para datos que no tengan una distribucin normal o para datos que incluyan observaciones extremas, sta es la medida estadstica ms til para describir el promedio.Tabla 1.2 Mano de obra por da para cada producto Personal Jornal (US$) Producto 1 Producto 2 Calificado 20 8 8 Semi calificado 10 5 5 No calificado 5 3 2

Media aritmtica ponderada Permite calcular un promedio que toma en cuenta la importancia o el factor que tiene cada valor sobre el total. Todas las medias aritmticas son ponderadas. Si no se dan factores especficos a todos y cada uno de los valores de la serie.X X i mi mi

Ejemplo 1.3 Una empresa desea contratar tres tipos de personal: calificado, semi calificado y no calificado, para la produccin de ciertos artefactos. La 21

Palacios C. Severo gerencia desea conocer el costo promedio de mano de obra por da para cada producto. El promedio aritmtico simple es:Y 0,644 1,661X1 0,0160X2

El costo de mano de obra promedio del producto 1 es,11,678 5 3 187,72 US $

Y para una unidad del producto 2 es,2 Ag Fe 2 AgO Fe 2

El anlisis de esta manera es incorrecto, ya que no se toma en cuenta que se trabaja con diferente personal. Ejemplo 1.4 Se compra material de construccin a tres empresas comercializadoras siendo sus costos: 80 kilo a 0,5 dlares por kilo, 20 kilo a 0,7 dlares y 10 kilos a 0,9 dlares. Determine el precio promedio por kilos de alambrn.Tabla 1,3 Precio por kilo de alambrn Precio por kilo (Xi) Kilo comprado (mi) 0,5 80 0,7 20 0,9 10 Total 110

Aplicando la frmulaX X i mi mi

X 0,50,8 / 110 ... 0,910 / 110/80 / 110 ... 10 / 110 0,5727 US$ / kilo

Comparando con el promedio simpleX1 X 900/1022

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingenieraX 0,580 0,720 0,910/ 110 0,5727 US$ / kilo

Media armnica Es el inverso del valor medio, se la utiliza con frecuencia para la medicin y anlisis de flujos volumtricos.H n 1 Xi

Ejemplo 1.5 Calcular el flujo volumtrico medio (FVM) de dos bombas que entregan combustible 10000 litros a razn de 500 litros por minuto y 10000 litros a razn de 100 litros por minuto, n = 21 H 2 166,7 litros / min 1 / 500 1 / 100

El resultado tambin puede obtenerse calculando el tiempo necesario para bombear 10000 litros con los dos flujos volumtricos y dividiendo el resultado por el nmero total de litros bombeados, es decir:r1 = 10000/500 = 20 min r2 = 10000/100 = 100 min FVM = (10000 + 10000)/120 = 166,7 l/min

Obsrvese que el valor medio es de 300 litros por minuto, casi el doble de la media armnica. Media geomtrica La media geomtrica Xg es la n-raz de los productos de la n observaciones medidas, de amplia utilidad en economa.X g n Xi

En forma logartmicaLog X g nLogX i n

Una aplicacin importante es determinar el incremento porcentual promedio en ventas, produccin u otras variables correspondientes a un lapso dado. 23

Palacios C. Severo Una modificacin de la frmula es: ltimo Lapso 1 Log X g Log Pr imer Lapso 1 n 1

Ejemplo 1.6 Supongamos que durante cinco aos de una economa inflacionaria, las entidades crediticias pagan tasas altas de inters de 10, 20, 25, 30 y 40 por ciento. Hallar la tasa de inters promedio anual de un depsito de 1000 dlares.Ao 1 2 3 4 5 Tasa de inters 10 20 25 30 40 Tabla 1.4 Economa inflacionaria Factor de crecimiento Ahorro al final de ao (US$) 2 1000*2 = 2000 3 2000*3 = 6000 3,5 6000*3,5 = 21000 4 21000*4 = 84000 5 84000*5 = 420000

El factor de crecimiento anual, ser:X 2 3 3,5 4 5/ 5 3,5 veces cada ao

Pero 3,5 = 1 + 25/10 Corresponde a una tasa de inters promedio de 20% anual. Entonces, el depsito de 1000 dlares crecer en cinco aos:SCcolumna 37 2 412 392 412 / 4 158 / 16 2,752

Este es un valor excedente al real en ms de US$ 10521 - 8,75 un error muy considerable. Usando la media geomtrica, el factor de crecimiento promedio Anual corresponde a una tasa de inters promedio de 235% anual o 3,35 = 1 + 235/100 entonces el depsito de 1000 dlares crecer en cinco aos a:SCtratamientoo 352 312 562 362 / 4 158 / 16 94,252

24

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera Siendo est la media ms apropiada para el caso. Media cuadrtica De un conjunto de nmeros Xn es denotado por la raz cuadrada de la media cuadrtica y es definida como:Xq X n2

Ejemplo 1.7 Evalu los datos que se muestran a continuacin 1, 5, 7 y 9X q 6,24

Mediana Se llama mediana de una variable estadstica a aquel valor de la variable tal que el nmero de observaciones menores que l es igual que el nmero de observaciones mayores. Se nota Me y se puede considerar como el punto de abscisas cuya ordenada en la curva vale .

N / 2 N i1 M e ei1 a AB AC i M e ei1 ai BB CC N / 2 N i1 ni ni

Datos no agrupados: La mediana es el valor correspondiente a un punto de una escala con respecto al cual la mitad superior agrupa igual cantidad de valores que la mitad inferior. Para determinar la mediana de datos no agrupados se ordenan, en primer lugar, de menor a mayor. 25

Palacios C. Severo Datos agrupados: Ordenar algunas observaciones no agrupadas de menor a mayor y elegir el valor central representa poco trabajo. Sin embargo, si son muchas las observaciones siempre es un problema ordenarla y encontrar el punto medio. En cambio, en datos cuantitativos es posible clasificarla directamente en clases y hallar una aproximacin de la mediana en funcin de la distribucin de frecuencia resultante. La mediana se puede clasificar con la frmula siguiente:n / 2 F Mediana L i f

Donde: L n F f i Lmite inferior de la clase en que se ubica la mediana Cantidad de datos Frecuencia acumulativa para la clase inmediata inferior Frecuencia en la clase media Amplitud del intervalo de clase

Ejemplo 1.8 Ordene los valores por su magnitud, obtenga la mediana. 92,3 92,6 92,5 92,8 92,4. Resulta ser la mediana 92,5 Moda La moda es la nica medida que se puede definir para caracteres cualitativos. Se define la moda de una distribucin como aquel valor que se ha presentado ms veces, es decir, es aquel que su frecuencia absoluta es mxima. Si la distribucin es agrupada en intervalos se habla de intervalo modal. Una moda en una distribucin no tiene por qu ser nica, puede haber ms de una en una misma distribucin, y entonces se habla de distribuciones bimodales, trimodales, o en general plurimodales. Datos no agrupados: El modo se define como el valor de la observacin que aparece con mayor frecuencia. Cuando existe solo un mo26

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera do, la distribucin se llama unimodal, si existen dos valores que aparecen con frecuencia, la distribucin recibe la denominacin bimodal. Datos agrupados: El modo observado para datos agrupados en una distribucin de frecuencia es el punto medio de la clase en donde se encuentra el mayor nmero de frecuencia. IX. MEDIDAS DE DISPERSIN

Las medidas de dispersin nos van a informar sobre el grado de esparcimiento de la distribucin, es decir, nos van a decir si los valores que aparecen estn ms o menos concentrados. Por tanto, nos van informar tambin sobre el grado de representatividad de la medida de posicin, pues cuanto ms concentrados estn los valores que toma la variable mejor representar un solo valor a toda la distribucin. Varianza La varianza es una medida de dispersin que mide el grado de esparcimiento de una distribucin alrededor de la media aritmtica. Cuanto ms grande sea la varianza ms esparcidos estarn los valores de la variable. La varianza se suele notar 2 y se calcula:

X

i

X ni N

X i X f i

Al igual que en la media aritmtica los Xi representan a los valores de la variable si es una distribucin no agrupada y a las marcas de clase si es una distribucin agrupada en intervalos. La varianza es la suma de las desviaciones de los valores de la variable sobre la media aritmtica ponderada por las frecuencias. Por lo tanto, cuanto menor sea la varianza ms agrupada estar la distribucin en torno a su media aritmtica. La varianza viene expresada en las mismas unidades que la variable pero al cuadrado. Desviacin tpica La desviacin tpica se define para obtener una medida de dispersin que venga expresada en las mismas unidades que la variable. Se define como la raz cuadrada de la varianza. 27

Palacios C. Severo

Coeficiente de variacin Tanto la varianza como la desviacin tpica son medidas de dispersin absoluta, es decir, nos hablan de la dispersin de la variable que estamos estudiando, pero no nos permiten comparar la dispersin de dos distribuciones distintas. El coeficiente de variacin es una medida de dispersin relativa que nos va permitir comparar dos distribuciones distintas, se define como el cociente entre la desviacin tpica y la media aritmtica.

CV

X

El coeficiente de variacin es un coeficiente adimensional y solo se puede definir cuando la media aritmtica es distinta de cero. Para comparar la dispersin de dos distribuciones basta con comparar sus coeficientes de variacin, aquella que su coeficiente de variacin sea menor es la que esta ms concentrada en torno a su media aritmtica.

28

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera Problemas (1) (2) Un operario que trabaja a jornal gana por mes US$ 150, otro mes US$ 120 y otro mes US$ 140. Cunto gana en promedio mensualmente? Los ingresos sobre ventas en una tienda comercial se evalan cada semestre. Los siguientes datos representan, los ingresos (en dlares) por cada mes: 300, 280, 350, 320, 290 y 325 Determine el ingreso medio de la muestra. Durante dos semanas se ha observado la temperatura en C al medio da, siendo los resultados: Determine la temperatura media de la muestra. Calcular la media de los datos agrupados:Y n 40 3 41 4 42 6 43 2 44 2 45 3 46 1 47 1 12 8 10 9 14 11 18 10 9 11 8 10 10 11

(3)

(4) (5)

(6)

Un grupo de micro empresarios, trabajan con obreros eventuales. Ciertos das trabajan con seis, ocho y cuatro. En la mayora de las veces trabajan con siete obreros, siendo en total ocho micro empresas. Cul es el promedio de obreros por micro empresa Supongamos que se han registrado 50 observaciones referentes a los pesos de 50 garrafas de gas licuado, la muestra fue obtenida de la produccin por hora y las unidades estn dadas en kilogramo9.8 9,2 9,4 9,4 9,4 9.3 9,3 9,5 9,2 9,3 9,5 9,5 9,4 9,5 9,4 9,2 9,3 9,4 9,3 9,3 9,4 9,4 9,2 9,2 9,4 9,2 9,3 9,4 9,3 9,3 9,3 9,2 9,6, 9,2 9,3 9,3 9,1 9,6 9,3 9,4 9,5 9,3 9,3 9,4 9,2 9,4 9,3 9,1 9,6 9,4

48 2

49 2

50 4

(7)

(8) (9)

Calcule el peso promedio de las garrafas Si el peso estndar es de 10 kilos cuanto de gas falta en promedio La temperatura registrada en un vivero, a cierta hora de un da cualquiera, en grados centgrados, fueron 30, 32, 39, 32, 33, 31, 38, 37, 32 y 31. Determine la media en grados Fahrenheit. Un proyecto econmico muestra que el consumo de alimentos de un barrio marginal de 350 personas es en promedio de US$ 120 mensuales. Halle la media del gasto diario en alimentacin. El ingreso percapite mensual en un pas es US$ 250. El sector del magisterio constituye el 60% de la poblacin que percibe el 29

Palacios C. Severo 2/5 del ingreso total. Calcule el ingreso medio por habitante del sector. Una empresa A tiene 80 empleados con un sueldo promedio mensual de 180 dlares por empleado. La empresa B tiene 120 empleados con un sueldo promedio mensual por empleado de 200 dlares por empleado, calcular: Cul es el sueldo promedio mensual de las dos empresas en conjunto Se agrega una tercera empresa con 40 empleados y un sueldo promedio mensual de 250 dlares por empleado. Cul es el sueldo promedio de las tres empresas en conjunto? Se compran 100 kilos de carne de res a 2,3 dlares por kilo, 50 kilos de carne de cerdo a 2,8 dlares por kilo y 20 kilos de carne de cordero a 1,8 dlares por kilo. Un plato de Buffet tiene un costo de 8 dlares en donde se incluyen los tres tipos de carnes a razn de 1:0,5:0,2 respectivamente. Determine el promedio de platos Buffet que podrn prepararse y cuanto de carne sobra? Una empresa industrial fabrica azulejos a 60 dlares por metro cuadrado, jarrones a 20 dlares la unidad y floreros a 5 dlares por unidad. Un decorador desea adquirir dichos productos pero cuenta tan slo con 500 dlares y tiene un ambiente de 20 metros cuadrados. Determine el promedio de cada producto para la decoracin del ambiente? Un proyecto minero posee cuatro ingenios aurferos. El ingenio A tiene una ley de cabeza de 8 gramos por tonelada y trabajan 20 mineros. El ingenio B tiene una ley de cabeza de 4 gramos por tonelada y trabajan 12 mineros. El ingenio C tiene una ley de cabeza de 12 gramos por tonelada y trabajan 25 mineros. El ingenio D tiene una ley 2 gramos por tonelada y trabajan 25 mineros. Determine la media aritmtica y la media geomtrica de la ley de cabeza? Si el costo real del oro es de 30,2 dlares por gramo. Evalu el costo de mano de obra, siend0 la relacin de produccin de A=2B, C=5D, A=3D en cada ingenio? En que ingenio se trabaja a perdida? Se tiene sospecha de que en las aguas subterrneas las concentraciones de nitritos superan las normas establecidas para la crianza de peces, dicha concentracin es de 0,03 mg NO2/l. Para tratar de verificar la sospecha, se midieron los niveles de nitritos

(10)

(11)

(12)

(13)

(14)

30

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera en diez puntos aleatorios del acufero y se obtuvieron los siguientes datos. Estime el nivel de confianza al 90% que las concentraciones de nitritos superan las normas establecidas para que sea factible la existencia de vida pisccola en la zona. Los datos obtenidos de una muestra aleatoria simple de tamao 30 de la distribucin X, porcentaje de incremento del contenido de alcohol en la sangre de una persona, despus de ingerir cuatro cervezas es.X 41,20,05 0,03 0,05 0,04 0,06 0,07 0,03 0,04 0,03

0,02

(15)

s 2,1

Calcular un intervalo de confianza del 90% para el porcentaje medio de alcohol en la sangre de una persona, despus de tomar cuatro cervezas. Si se calcula un intervalo de confianza del 95%, cual ser el de mayor o menor amplitud. (16) El 2000 se reforestaron ms de 3 millones de acres con dos mil millones de plantas de viveros. Una grave sequa durante las siguientes estaciones mat a muchas de estas plantas. Se obtuvo una muestra de 1000 plantas y se descubri que 300 estaban muertas. Obtener un intervalo de confianza del 90% de la proporcin de plantas del vivero muertas. Utilizar dicha informacin para estimar el nmero de plantas muertas en la poblacin. (17) La capacidad de los equipos de vidrio producido en una determinada empresa de vidrio tiene una distribucin normal. Una muestra aleatoria de 7 de ellas dio como resultado un varianza de 62 mililitros. Dar una estimacin, mediante un intervalo de confianza del 95% de la varianza de la capacidad del equipo de vidrio que fabrica dicha empresa. (18) Se quiere estudiar la eficacia de un tratamiento para eliminar una bacteria de un pino. En una muestra aleatoria de 150 pinos sometidos al tratamiento, 118 resultaron sanos. En otra muestra aleatoria de 130 pinos no tratados, los pinos sanos fueron 91. Construir un intervalo de confianza del 95% para la diferencia en la taza de pinos sanos entre los tratados y los no tratados. A que conclusin llega respecto a la efectividad del tratamiento. (19) Para estudiar el rendimiento de dos tipos de cereales se hacen 20 determinaciones en parcelas donde se ha sembrado cereal del tipo A y 18 determinaciones en parcelas con cereales tipo B con los resultados siguientes.X A 14,5 Kg / rea

s A 3,23

Kg / rea

X B 15,3

Kg / rea

s B 1,85

Kg / rea

31

Palacios C. Severo Son igualmente efectivos para el cultivo los cereales A y B al nivel de confianza del 90% (20) Se realiz un estudio para comparar en lcteos el contenido de sodio en el plasma y en leche. Se obtuvieron las siguientes observaciones sobre el contenido de sodio (mili moles por litro de leche), en 10 envases aleatoriamente seleccionadas.Envase Leche Plasma 1 93 147 2 104 157 3 95 142 4 81 141 5 95 142 6 95 147 7 76 148 8 80 144 9 79 144 10 87 146

Hallar un intervalo de confianza del 95% de la diferencia media de los niveles de sodio en los fluidos del lcteo (21) En el departamento de control de calidad de una empresa, se quiere determinar si ha habido un descenso significativo de la calidad de su producto entre las producciones de dos semanas consecutivas a consecuencia de un incidente ocurrido durante el fin de semana. Deciden tomar una muestra de la produccin de cada semana, si la calidad de cada artculo se mide en una escala de 100, obtienen los resultados siguientes: Suponiendo que las varianzas de la puntuacin en las dos producciones son iguales, construye un intervalo de confianza para la diferencia de medias al nivel de 95%. Interpreta los resultados obtenidos. (22) Sospechamos que nuestro cromatgrafo est estropeado, y queremos determinar si los resultados que nos proporciona son lo suficientemente precisos. Para ello, realizamos una serie de 8 mediciones del contenido de una solucin de referencia que, sabemos, contiene 90% de un determinado compuesto. Los resultados que obtenemos son: 93,3 86,8 90,4 90,1 94,9 91,6 92,3 96,5 Construir un intervalo de confianza al nivel de 95% para la varianza poblacional. Qu conclusiones podemos realizar? (23) Se ha hecho un estudio sobre la proporcin de enfermos de cncer de pulmn detectados en hospital que fuman, obtenindose que de 123 enfermos 41 de ellos eran fumadores. Obtener un intervalo de confianza para dicha proporcin. Estudiar si dicha proporcin puede considerarse igual a la proporcin de fumadores en la poblacin si sta es de un 29%. (24) Para estudiar la efectividad de un medicamento contra la diabetes se mide la cantidad de glucemia en sangre antes y despus de la administracin de dicho medicamento, obtenindose los resultados siguientes:32 Semana I Semana II 93 93 86 87 90 97 90 90 94 88 91 87 92 84 96 93

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingenieraAntes Despus 7,2 5,2 7,3 5,4 6,5 5,3 4,2 4,7 3,1 4,1 5,3 5,4 5,6 4,9

Estimar la reduccin producida por el medicamento. (25) Eres el encargado de un departamento de produccin en una fbrica y recibes un lote de 2000 piezas necesarias para la fabricacin de un artculo. Tienes la responsabilidad de aceptar o rechazar el lote, si estimas que la calidad de ste no es suficiente. El fabricante te asegura que, en este lote, no hay ms de 100 piezas defectuosas, pero decides tomar una muestra para estimar la proporcin de las mismas. a) Cuntas piezas decides examinar para que, con un nivel de confianza del 95%, el error que cometas en la estimacin de la proporcin poblacional de defectuosas no sea mayor que 0.05? b) Si decides tomar una muestra de 100 artculos escogidos al azar en el lote y realizas el recuento de piezas defectuosas en esta muestra, encontrado 4 artculos defectuosos. Construye para la proporcin de defectuosos en el lote, un intervalo de confianza al nivel de 95% de confianza. Se debe rechazar el lote? (26) Los tiempos de reaccin, en mili segundos, de 17 sujetos frente a una matriz de 15 estmulos fueron los siguientes: Suponiendo que el tiempo de reaccin se distribuye Normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%. (27) Se considera una poblacin representada por una variante , de suerte que la media poblacional es igual a 25 y la varianza poblacional es igual a 240. Supuesto extradas muestras de tamao 100, muestreo aleatorio simple, determinar la probabilidad de que el estadstico media muestral, Ax, este comprendido entre los valores 23; 55 y 28,1. (28) La duracin aleatoria de las unidades producidas de un artculo, se distribuye segn la ley normal, con desviacin tpica igual a seis minutos. Elegidas al azar cien unidades, resulto ser la duracin media de 14,35 minutos. Elaborar el intervalo de confianza del 99% para la duracin media de las unidades producidas. (29) Se estudiaron 40 muestras de aceite crudo de determinado proveedor con el fin de detectar la presencia del nquel mediante una prueba que nunca da un resultado errneo. Si en 5 de dichas muestras se observo la presencia de nquel podemos creer al proveedor cuando asegura que a lo sumo el 8% de las muestras contienen nquel? 33448 534 460 523 514 452 488 464 592 562 490 584 507 507 513 461 492

Palacios C. Severo (30) La resistividad elctrica de ciertas barras de aleacin de Cromomolibdeno es una variable N(12,5; 4,1).Un investigador acaba de calibrar un aparato que mide dicha resistividad y para comprobar que lo ha hecho bien utiliza el sistema consistente en medir cuatro barras y aceptar que el calibrado es bueno si encuentra al menos un valor inferior y otro superior a 12,5. Determinar el nivel de significacin del contraste que esta llevando a cabo. Es sensible el contraste a una mayor o menor dispersin de la variable resistividad? (31) En una muestra de 65 sujetos las puntuaciones en una escala de extroversin tienen una media de 32,7 puntos y una desviacin tpica de 12,64. a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la poblacin. b) Indique, con un nivel de confianza del 95%, cual sera el mximo error que podramos cometer al tomar como media de la poblacin el valor obtenido en la estimacin puntual. (32) En una muestra aleatoria de 90 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene X 132 mg/dl y s2=109. Construir el intervalo de confianza al 95%. (33) Para evaluar una vacuna para la gripe se selecciona un grupo de 200 individuos de riesgo. Se eligen 100 de ellos y se les suministra la vacuna; de ellos 10 pasan la gripe. Construir un intervalo de confianza al 95% para la probabilidad de pasar la gripe si se esta vacunado. En los otros 100 pacientes sin vacunar la pasan 20. Es eficaz la vacuna? (34) Se analizan 9 zumos de fruta y se ha obtenido un contenido medio de fruta de 22 mg por 100 cc de zumo. La varianza poblacional es desconocida, por lo que se ha calculado la desviacin tpica de la muestra que ha resultado ser 6,3 mg de fruta por cada 100 cc de zumo. Suponiendo que el contenido de fruta del zumo es normal, estimar el contenido medio de fruta de los zumos tanto puntualmente como por intervalos al 95% de confianza. (35) Una firma comercial encuesta a 100 individuos para conocer sus opiniones sobre la eleccin de dos productos alternativos A y B recientemente fabricados. El resultado de la encuesta arroja que el producto A lo han elegido 55 individuos y el producto B 45. Hallar un intervalo de confianza al 95% para la proporcin de individuos que eligen cada producto. (36) En un proceso de fabricacin de pilas alcalinas se sabe que su duracin media es de 1100 horas y que dicha duracin sigue una distribucin normal. El nuevo proceso busca reducir la disper34

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera sin de la duracin de las pilas por lo que se hace necesario construir intervalos de confianza para la citada dispersin con coeficientes de confianza 90% y 98%. Construir dichos intervalos a partir de una muestra de tamao 20 cuya dispersin es 2240 horas. Se sabe que la longitud de los dimetros de los tornillos fabricados por una mquina sigue una distribucin normal y se busca un intervalo en el cual se encuentre la variabilidad de las longitudes de los tornillos fabricados por la mquina con una probabilidad del 80%. Construir dicho intervalo sabiendo que una muestra de 16 tornillos presenta una variabilidad cuantificada en 30. Un granjero dispone de dos criaderos diferentes A y B con varias granjas cada una para la cra de pollos. Con el objetivo de estudiar la mortalidad de los pollos en las dos criaderos observa el nmero de pollos muertos tomando una muestra de 4 granjas en el criadero A y otras 4 granjas en el criadero B obteniendo los siguientes resultados: N de pollos muertos en las granjas del criadero A: 16 14 13 17 N de pollos muertos en las granjas del criadero B: 18 21 18 19 Suponiendo normalidad en los criaderos, se trata de estudiar si la mortalidad de los pollos puede considerarse diferente en los dos criaderos con un nivel de confianza del 95%. Resolver el problema bajo la hiptesis adicional de varianzas iguales en los criaderos. Al analizar 40 muestras de una aleacin de bajo punto de fusin de tipo babit se ha detectado ausencia de cadmio en 12 de ellas. Determinar un intervalo de confianza para la proporcin de muestras de dicha aleacin que no contienen cadmio. La cantidad de azufre encontrado en plantas secas de mostaza sigue una distribucin normal X. se ha observado una muestra de extensin 9 con los siguientes resultados 0,7 0,8 0,6 0,95 0,65 1 0,9 0,2 0,55. Si aceptamos como valor de el valor calculado de la desviacin tpica muestral S , Cul sera el tamao mnimo de la muestra que habra de ser considerada para que el intervalo de confianza al 95% para el nivel medio de azufre tenga una longitud inferior a 0,1? La prdida de peso de un determinado producto diettico en 16 individuos despus de un mes fue (en kg): 3,2 2 2,5 3,3 5 4,3 2,9 4,1 3,6 2,7 3,5 4,2 2,8 4,4 3,3 3,1 35

(37)

(38)

(39)

(40)

(41)

Palacios C. Severo Determinar un intervalo de confianza para la varianza con nivel de confianza del 99%, si la prdida de peso es aproximadamente normal. Se consideran lo siguientes tiempos de reaccin de un producto qumico, en segundos: 1,4 1,2 1,2 1,3 1,5 1,3 2,2 1,4 1,1 Obtener un intervalo de confianza del 90% para el tiempo de reaccin. Suponer la variable normal con desviacin tpica poblacional conocida = 0,4. El tiempo, en minutos, que esperan los clientes de un determinado banco hasta que son atendidos sigue distribucin normal de media desconocida y desviacin tpica igual a 3. Los tiempos que esperaron diez clientes elegidos al azar fueron los siguientes: 1,5 2 2,5 3 1 5 5,5 4,5 3 3 Determinar un intervalo de confianza de coeficiente de confianza 0,95, para el tiempo medio de espera. La duracin en minutos de un determinado viaje es una variable aleatoria con distribucin normal de media desconocida y desviacin tpica igual a 3. En una muestra tomada al azar de diez realizaciones del viaje en cuestin se obtuvieron los siguientes tiempos: 10,1 6,5 5,5 7,9 8,2 6,5 7,0 8,1 6,9 7,7 a) Realizar la estimacin de mxima verosimilitud de la duracin media del viaje. b) Calcular la probabilidad de que, en valor absoluto, la diferencia entre media estimada la real sea menor que 1 minuto. Las velocidades de difusin del bixido de carbono a travs de la porosidad del suelo son distintas.20 19 27 30 22 32 23 28 23 15 28 26 23 35 26 18 22 25 26 35 20 19 22

(42)

(43)

(44)

(45)

Comprobar si se puede afirmar que las velocidades de difusin son distintas al nivel de confianza del 95% (46) Una transformadora de productos lcteos recibe diariamente la leche de dos granjas. Se desea estudiar la calidad del producto acopiado, se extraen dos muestras al azar y se analiza el contenido en materia grasa, obtenindose los siguientes resultados.Granja A Granja B

Arenoso Arcilloso

X A 8,7%

2 s A 1,02% 2

X B 10,9%

Se pide construir un intervalo de confianza del 95% para la diferencia del contenido medio en grasa de leche de ambas granjas. (47) En una determinada raza de ganado vacuno los terneros incrementan 12 kg. de peso cada semana, en los primeros meses de36

2 s B 1,73% 2

n A 33 nB 27

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera vida. Para comprobar se someti al pesado de ocho terneras al cumplir las cuatro semanas y posteriormente dos semanas.Ternero Peso 4 semanas Peso 6 semanas 1 130 138 2 125 140 3 128 139 4 127 141 5 129 137 6 123 137 7 131 142 8 130 142

(48)

(49)

(50)

(51)

(52)

Comprobar si la suposicin es cierta calculando los intervalos de confianza al 95% para la diferencia media de peso. Se ha realizado un estudio sobre la tasa de supervivencia de pjaros adultos en trpico y en zonas templadas. Inicialmente se marcaron 500 pjaros adultos en las patas y se liberaron a una regin tropical. Un ao despus, se volvi a capturar 445. Suponiendo que los no recuperados fueron victimas de un depredador, la tasa de supervivencia estimada de un ao para los pjaros adultos en la regin es 0,80. Un experimento similar en otra zona templada, dio como resultado de 252 de los 500 pjaros con una tasa de supervivencia estimada de 0,504. Hallar un intervalo de confianza del 90% de la diferencia en las tasas de supervivencia de un ao para las dos zonas. Una muestra de tamao 10 de una poblacin de mujeres presenta una altura media de 172 cm. y una muestra de 12 varones de otra poblacin presenta una altura media de 176,7 cm. Sabiendo que ambas poblaciones son normales con varianzas 225 y 256 respectivamente, se trata de analizar si con una probabilidad del 95% se puede asegurar que los varones son ms altos en media que las mujeres o viceversa. Los responsables municipales de la salud miden la radiactividad en el agua de una fuente natural en una zona abundante en granito. Realizadas 12 mediciones en diferentes fechas del ao se observ una media de 3,6 picocurios con una desviacin tpica de 0,82. Determinar, al 95% y al 99%, intervalos de confianza para la radiacin media y para la varianza. En una muestra de 65 sujetos las puntuaciones en una escala de extroversin tienen una media de 32,7 puntos y una desviacin tpica de 12,64. a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la poblacin. b) Indique, con un nivel de confianza del 95%, cual sera el mximo error que podramos cometer al tomar como media de la poblacin el valor obtenido en la estimacin puntual. Los tiempos de reaccin, en mili segundos, de 17 sujetos frente a una matriz de 15 estmulos fueron los siguientes: 448, 460, 514, 488, 592, 490, 507, 513, 37

Palacios C. Severo 492, 534, 523, 452, 464, 562, 584, 507, 461 Suponiendo que el tiempo de reaccin se distribuye normalmente, determine un intervalo de confianza para la media a un nivel de confianza del 95%. (53) De una poblacin cuya distribucin se desconoce se obtiene una muestra aleatoria de 2000 valores en que la media muestral resulta ser 225 y la desviacin tpica muestral 10. Suponiendo que la varianza muestral coincida con la de la poblacin, estimar un intervalo para la media de la poblacin con un nivel de confianza del 95% (54) En una muestra de 100 personas de un barrio de Lima se ha observado una proporcin de 0,18 personas que leen el peridico diariamente. Puede ser que la verdadera proporcin de personas que leen el peridico en ese barrio sea 0,20?

38

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera X. ESTIMACIN DE PARMETROS

Otra cosa que los investigadores tratan de hacer con frecuencia es obtener inferencias sobre la poblacin con base en los resultados de una experiencia a partir de una muestra. El hecho de que 50 personas en una prueba prefieran el producto A al producto B por un margen de dos a tres, es importante solo en la medida en que le permita concluir en que la poblacin como un todo tambin prefiere el producto A. Esto es se llama inferencia estadstica, tomar una decisin sobre la poblacin entera en base a las caractersticas de una muestra. Para hacer una inferencia sobre la poblacin, usted debe de aplicar un lmite de confianza o un intervalo de confianza al resultado que encontr en el estudio. Ejemplo 1.9 En un estudio X se encontr que el 30% de los informantes tienen conocimiento del producto A, es poco factible que exactamente el 30% de la poblacin entera tenga ese conocimiento del producto A, pero la cifra de la poblacin deber estar cerca del 30%. S la muestra es lo suficientemente grande y estuvo bien tomada. A la diferencia entre los resultados de la muestra y la poblacin se la llama error muestral. El intervalo que se conexa al resultado de la encuesta para estimar o inferir la cifra de la poblacin se llama intervalo de confianza. XI. DIFERENCIAS SIGNIFICATIVAS A veces en un proyecto de investigacin se propone comparar resultados entre dos muestras. Las comparaciones ms comunes son: Dos o ms subgrupos dentro de una misma muestra Tienen las personas con ingresos superiores de US$ 10000, opiniones diferentes de las que tienen las personas con ingresos por debajo de Sus 10000? Son distintas las evaluaciones de productos confeccionados por los varones a las evaluaciones hechas por las mujeres? Muestras tomadas en diferentes puntos en el tiempo Aument el conocimiento del producto durante el ao pasado? Es la participacin en las Universidades mayor de lo que era hace cinco aos? Lo primero que usted hace, es observar los resultados en forma simple y directa. 39

Palacios C. Severo Si las respuestas de los hombres y mujeres son iguales, usted no necesita de una prueba estadstica adicional. Si la participacin en las Universidades no ha cambiado desde hace cinco aos usted ya tiene una respuesta. Pero si los resultados son distintos entre cualquiera de sus sub-grupos entonces usted tiene que confrontar dos preguntas bsicas Es la diferencia de los resultados tan pequea como para sugerir que sta probablemente ocurri por azar? est si usted repite la prueba. Hay una buena probabilidad de que el resultado sea el contrario? Es el resultado lo bastante grande como para que probablemente sea el resultado de una verdadera diferencia? s usted repite la prueba varias veces, Es muy factible que sta resulte igual cada vez? Antes de hacer una prueba estadstica, usted debe tener una hiptesis es decir una relacin que usted querr probar como verdadera o falsa. En estadstica, usualmente se supone que dos poblaciones son iguales hasta que se pruebe lo contrario. Esto se llama hiptesis nula. Empezamos con la hiptesis nula, si la diferencia entre dos muestras es lo bastante pequea como para que fcilmente pudiera haber ocurrido por azar, entonces la hiptesis nula no puede ser rechazada y usted debe concluir que la diferencia entre las dos muestras no es estadsticamente significativa al nivel de significacin del 95 por ciento (o cualquier nivel de, significacin que usted elige). En cambio, si la diferencia en los resultados de la toma de datos es tan grande que no es factible que esto haya ocurrido por azar, usted rechaza la hiptesis nula y concluye que la diferencia entre las dos muestras es estadsticamente significativa al nivel de significacin del 95 por ciento. Adems de estas medidas de la diferencia en dos muestras, hay otras pruebas estadsticas que son tiles para evaluar diversas clases de resultados. XII. DISPERSIN DE LOS DATOS PROBLEMAS La varianza mide la dispersin de los datos con respecto a la media aritmtica y la desviacin estndar es simplemente la raz cuadrada positiva de la varianza. Daremos las definiciones para su aplicacin. Datos no agrupdos: La varianza tambin se basa en desviaciones a partir de medias. Para hallar la varianza a de un producto, se eleva al cuadrado las desviaciones a partir de las medias X X , luego tambin2

40

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera se suman X X 2 y se promedian dividiendo por el nmero total de productos, o sea n. X X ni

2

Como la media verdadera no se conoce prcticamente, la desviacin estndar verdadera es una magnitud terica. Sin embargo a puede obtenerse aproximadamente a partir de la desviacin estndar estimada S(X).S X X X n 1i

2

En el anlisis estadstico se utiliza una cantidad denominada grados de libertad que designaremos para el futuro como GL. Esta cantidad permite tener en cuenta y corregir, desde el punto de vista matemtico, las restricciones impuestas a los valores. En este caso al calcular la desviacin estndar, el nmero n de observaciones sta fijado y la desviacin estndar estimada se puede calcular a partir de la media. De la n observaciones slo n-1 pueden variar, el ltimo valor queda determinado por X y n. Por lo tanto al estimar la desviacin estndar a partir de una muestra de la poblacin de datos, solo hay n-1 grados de libertad. Elevando al cuadrado la desviacin estndar estimada se tiene la varianza estimada S X 2 . Ejemplo 1.10 Se han realizado cinco anlisis de un producto para determinar la concentracin de un componente X. Los resultados fueron: 98 97,7 87 96 y 93 X 94,32S X 982 97,7 2 87 2 96 2 932 471,6 2 4,54 5

Datos agrupados: Para ilustrar el clculo de la desviacin estndar para datos agrupados veamos los siguientes jornales de obreros. En primer trmino se hallan los puntos medios X de cada clase de jornal. Luego se eleva al cuadrado las X X 2 se multiplican por el nmero adecuado de frecuencia de clase para dar f X 2 . 41

Palacios C. SeveroS X Jornal (US$) 3a5 5a7 7a9 Total Cantidad (f) 2 5 3 10

fX X2 nXX2

2

fX

2

fX

4 6 8

16 36 64

32 180 192 404

8 30 24 62

S X

404 62 1,4 US$ 10 10

2

La desviacin estndar puede emplearse como denominador comn para colectar la dispersin de las dos distribuciones y la representatividad de las dos medias. Otra aplicacin es la desviacin estndar como instrumento de anlisis se da en su relacin con la media de una distribucin normal. Una relacin se halla en funcin del porcentaje de observaciones dentro de una desviacin estndar debajo de la media y una desviacin estndar incluye un 95% de las observaciones. La X 3(S ) incluye alrededor de 99,7% de las observaciones. Desviacin media Otra medida de la dispersin de los valores es la desviacin media real, se trata simplemente de la media aritmtica de las desviaciones de las medias sin tener en cuenta lo siguiente:md X X i

X mediana n

Para una desviacin normal, la desviacin estndar verdadera es aproximadamente igual 1,25 veces la desviacin media. Ejemplo 1.11 Calcular la desviacin media del ejemplo 1.10. md = 3,456 La dispersin de los resultados ser 3,45642

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera Problemas (55) Calcule el valor medio, mediana y moda de la siguiente distribucin de datos:X 110 -119 100 109 90 99 80 89 70 79 60 69 50 59 40 49 30 39 20 29 10 - 19 Y 1 0 2 5 10 13 9 4 5 0 1

(56) Se recibe materia! de dos fuentes de abastecimiento. Los anlisis de muestras provienen de las dos fuentes que se indican a continuacin. Se desea saber si se justifica que existe diferencia entre las dos fuentes. (57) El anlisis de gas natural indica el siguiente concentrado de CO2 en volumen: 24,6 23,7 23,4 23,8 24,1 23,9 Calcule el intervalo de confiabilidad de la media verdadera? (58) En una refinera de plata, se analiza el contenido de plata en los residuos para establecer su concentracin en los lingotes. Las muestras obtenidas durante dos turnos dieron los resultados.Hora Turno 1 Turno 2 1 89 87 2 92 87 3 98 97 4 97 97 5 98 97 6 97 98 7 97 97 8 98 97 Fuente 1 Fuente 2 85 79 74 71 76 75 88 77 73 79 84 77 77 78

Trate de saber si la diferencia entre los anlisis de los dos turnos es significativa. (59) La informacin obtenida de cuatro reactores qumicos diferentes, acerca del efecto de la temperatura sobre cierta reaccin es la siguiente:Temperatura (C) 800 900 980 1 10,4 10,9 12,1 Rendimiento del reactor 2 3 4 12,9 11,7 13,5 10,8 10,6 13,5 11,6 12,8 10,2

Determinar mediante anlisis de varianza de dos caminos, si la varianza entre los reactores y entre la temperatura es altamente significativo. (60) Un fabricante de hipoclorito sabe que la cantidad de cloro contenido en su producto decrece con el tiempo y eventualmente se 43

Palacios C. Severo estabiliza en torno al 0,3%. El fabricante desea estimar la cantidad de cloro en el hipoclorito para un tiempo dado, con el fin de informar a los vendedores y retirar el producto caducado. Para ello se analizan sobre los porcentajes de cloro disponible por unidad de producto restante de 8 a 42 semanas despus de fabricado.Semanas desde la fabricacin 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 Cantidad disponible de cloro (%) 0,49 0,48 0,46 0,45 0,44 0,46 0,42 0,41 0,42 0,41 0,41 0,4 0,41 0,40 0,41 0,40 0,39 0,39 0,49 0,47 0,46 0,43 0,43 0,45 0,42 0,41 0,40 0,40 0,40 0,40 0,40 0,38 0,40 0,48 0,45 0,43 0,43 0,43 0,40 0,40 0,41 0,38 0,47 0,43

Realizar el anlisis de regresin y anotar la ecuacin del modelo lineal, el coeficiente de correlacin. (61) Se sabe por experiencia, que el incremento de peso de los embriones de pollo al transcurrir el tiempo sigue la ley de tipo exponencial. En un experimento se obtuvieron los pesos (gramos) de un embrin desde el sexto da de su nacimiento hasta e decimosexto que aparecen a continuacin. Crear una tabla con la variable das y peso con datos anteriores. Realizar un anlisis de regresin para comprobar que valores siguen la ley exponencial. Grfique los datos y la lnea de regresin ajustada. Estime el peso de un pollo a los 7,5 a los 16 y a los 18 das de su nacimiento. Justificar si alguna de las estimaciones obtenidas es poco fiable. (62) En la siguiente tabla se refiere al nmero Y de bacterias por unidad de volumen presentes en un cultivo despus de X horas.X Y 0 32 1 47 2 65 3 92 4 132 5 190 6 275 Da Peso 6 0,02 7 0,05 8 0,07 9 0,13 10 0,18 11 0,26 12 0,43 13 0,74 14 1,13 15 1,88 16 2,81

44

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera Ajustar los datos a una curva del tipo Y = aXb Calcular los valores del coeficiente de correlacin Visualizar la lnea de regresin y los datos obtenidos Estimar el valor de Y para un valor de X = 3,5 (63) La tabla adjunta muestra cinco observaciones de un fenmeno cintico El investigador sugiere un modelo de ajuste del tipo U = ke-bT Estimar los parmetros k y b. (64) La presin de un correspondiente a diferentes volmenes V se dan en la tabla. Obtenga por regresin el coeficiente de correlacin de los modelos lineales, exponenciales y cuadrticos. (65) En una reunin medica se probo con una droga fue tomada por 14 personas, de las cuales 6 lo hacen por primera vez y 8 ya son habituales de ella. La droga produjo en el primer grupo sueos de duracin 11, 12, 13, 16, 17 y 15 horas, mientras que en el segundo grupo 8, 7, 9, 10, 6, 7, 9 y 8 horas. a) Media y desviacin tpica de cada grupo b) Formar el estadstico que se distribuye segn una t de Student de 12 grados de libertad, sabiendo que las poblaciones tienen la misma media y desviacin tpica. (66) Segn una encuesta realizada sobre una muestra de 2500 personas elegidas al azar, el 80% est decidido a votar en las ltimas elecciones. a) Puede ser cierto que llegue a votar el 85% de la poblacin? b) Con un 99% de nivel de confianza ente qu valores estar el porcentaje de los votantes de la poblacin (67) Suponga que de una poblacin consistente en los valores 0, 2, 4, 6 y 8, se toman muestras de tamao 2 con reemplazo.X 0 2 4 6 8 Frecuencia 1 1 1 1 1 Frecuencia relativa 1/5 = 0,2 1/5 = 0,2 1/5 = 0,2 1/5 = 0,2 1/5 = 0,2 V (cm) P (Kg/cm) 50 60 60 54 70 46 90 24 100 10 U T 103 0 102 1 10 2 1 3 0,1 4

Demostrar que es razonable aproximar la distribucin muestral de por una distribucin normal, una vez que se conoce la media y la desviacin estndar de la distribucin muestral. (68) En un experimento de laboratorio se mide el tiempo de una reaccin qumica. Se ha repetido el experimento 98 veces y se 45

Palacios C. Severo obtiene que la media de los 98 experimentos es de 5 segundos con una desviacin de 0,05 segundos. Cul es la probabilidad de que la media poblacional m difiera de la media muestral en menos de 0,01 segundos? (69) Se establece un control de calidad para un proceso de produccin de balas. Se ha dispuesto que cuando el proceso est bajo control, el dimetro de las balas es de 1 cm., con una desviacin tpica de 0,003 cm. Cada hora se toman muestras de nueve balas y se miden sus dimetros. Los dimetros de media de diez muestras sucesivas, en centmetros, son: 1,0006 0,9997 0,9992 1,0012 1,0008 1,0012 1,0018 1,0016 1,0020 1,0022 Establecer cules son los lmites de control y explicar qu concluyes sobre el proceso de produccin en estos instantes. (70) Un investigador quiere estimar la media de una poblacin usando una muestra suficientemente grande para que la probabilidad de que la media muestral no difiera de la media poblacional en ms del 25% de la desviacin tpica sea 0,95. Hallar el tamao de muestra necesario. (71) La efectividad en das de un determinado antibitico, sigue una distribucin normal de media 14 das y desviacin tpica desconocida. Fue administrada a 16 enfermos, obtenindose una desviacin tpica muestral de 1,4 das. Determinar la probabilidad de que la efectividad media en la muestra no supere los 3 das, que es el tiempo mnimo de efectividad requerido. (72) Se realiza un anlisis de la duracin de 40 pilas alcalinas obtenindose los siguientes resultados:Duracin Xi 1,55 1,95 1,95 2,45 2,45 2,95 2,95 3,45 3,45 3,95 3,95 4,45 4,45 4,95 Frecuencia absoluta nj 2 1 4 15 10 5 3

Ajustar las duraciones de las pilas alcalinas a una distribucin normal con media 3,5 y desviacin tpica 0,7. (73) Un estudio de gentica con reses consisti en varios machos apareados con grupos separados de hembras. Cuando nacan terneros, se usaban en un estudio de pesos hereditarios. En la siguiente tabla se presentan los pesos al nacer de ocho terneros de cada uno de los cinco grupos de apareamiento.Macho 177 61 100 56 Peso al nacer 113 99 103 75 62

46

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera200 201 202 203 75 58 57 59 102 60 56 46 95 60 67 120 103 57 59 115 98 57 58 115 115 59 121 96 98 54 101 105 94 100 101 75

Escriba el modelo lineal, explique cada trmino, calcule el anlisis de varianza y muestre los cuadrados medios esperados. Pruebe la hiptesis nula Ho: 2 = 0 para los machos. (74) Los datos del ejercicio 3.5 corresponden a las concentraciones de colesterol en anlisis de laboratorio a 2 muestras de cada uno de 8 pacientes. Suponga un modelo aleatorio para el estudio. Escriba el modelo lineal, explique cada trmino, calcule el anlisis de varianza y muestre los cuadrados medios esperados. Estime las componentes de la varianza para pacientes y muestras y determine intervalos de confianza medios al 90%. (75) Un patlogo de plantas tom cuatro muestras, de 3 libras cada una, de lotes de 50 toneladas de semilla de algodn acumulada en varias cosechas durante la temporada de limpia. Las muestras se analizaron en el laboratorio para buscar aflatoxin, que es una toxina producida por organismos asociados con las semillas. A continuacin se proporcionan las concentraciones de aflatoxin en partes por billn para las muestras de ocho lotes.Lote 3469 72 3849 52 3721 24 3477 80 3669 72 3873 76 3777 80 3461 - 64 39 56 64 29 38 11 23 10 Afloxin (ppb) 57 63 13 25 83 88 55 21 66 53 49 34 0 5 11 23 66 31 71 51 81 10 20 37

(76) Suponga que los lotes y sus muestras son efectos aleatorios. Escriba el modelo lineal para el estudio, explique los trminos, calcule el anlisis de varianza completo y muestre los cuadrados medios esperados. (77) Piense en problemas de investigacin en su rea de inters que requieran muestras (u observaciones) de la unidad experimental debido a que no sea posible medir la unidad en su totalidad. Escriba un modelo lineal para su estudio; identifique los trminos y bosqueje el anlisis de varianza, muestre las fuentes de variacin, los grados de libertad y los cuadrados medios esperados. (78) Se realiz en conjunto un estudio sobre cartuchos para filtrado de partculas de alta energa, usados en respiradores comercia47

Palacios C. Severo les para proteccin contra partculas de materia. Una prueba especfica incluy tres filtros elegidos al azar de cada uno de dos fabricantes, se hicieron tres rplicas de prueba independientes de cada filtro, las medidas fueron el porcentaje de penetracin por medio de una prueba estndar de aerosol.Filtro 1 1,12 1,10 1,12 Fabricante I 2 3 0,16 0,15 0,11 0,12 0,26 0,12 4 0,91 0,83 0,95 Fabricante II 5 6 0,66 2,17 0,83 1,52 0,61 1,58

Escriba un modelo lineal para este estudio, explique los trminos, calcule el anlisis de varianza y muestre los cuadrados medios esperados. Pruebe la hiptesis de que no existen diferencias entre la penetracin porcentual promedio de los filtros de los dos fabricantes. Calcule las medias, sus errores estndar y las estimaciones del intervalo de confianza de 95% para las medias de cada fabricante. (79) Un cientfico de suelos estudi el crecimiento de plantas de cebada en tres niveles diferentes de salinidad en un medio controlado. Tena dos contenedores rplica de cada tratamiento, en un diseo totalmente aleatorizado y midi tres plantas de cada rplica. Los pesos en seco de las plantas, en gramos, son los siguientes:Salinidad Control 6 barras 12 barras Contenedor 1 2 3 4 5 6 11,29 7,37 5,64 4,20 4,83 3,28 Peso (g) 11,08 6,55 5,98 3,34 4,77 2,16 11,10 8,50 5,69 4,21 5,66 2,69

Escriba un modelo lineal para un anlisis de datos, explique los trminos, calcule el anlisis de varianza y muestre los cuadrados medios esperados. Pruebe la hiptesis de que no hay diferencia entre las medias de los niveles salinos. Calcule el error estndar de una media de nivel salino. Haga una particin de las sumas de cuadrados para la salinidad en dos sumas de cuadrados polinomiales ortogonales (lineal y cuadrtica), cada una con 1 grado de libertad y pruebe la hiptesis nula de que no hay regresin lineal o cuadrtica. (80) El ndice de porosidad es una medida usada por los cientficos de suelos para ayudar en la prediccin del movimiento, almacenamiento, disponibilidad del agua y las condiciones de oxigena48

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera cin del subsuelo. Un cientfico de suelos us un diseo de muestreo especial para tomar muestras del suelo de una de las granjas experimentales de la universidad para medir el ndice de porosidad del suelo. Se hizo una particin de la granja en campos de aproximadamente 4 hectreas, cada una con 8 secciones. El plan de muestreo incluy una seleccin aleatoria de los campos dentro de las secciones. A continuacin se presenta el ndice de porosidad de cada sub muestra:Seccin 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Porosidad 3,846 3,712 5,629 2,021 5,087 4,621 4,411 3,357 3,991 5,766 5,677 3,333 4,355 6,292 4,940 4,810 2,983 4,396 5,603 3,683 Campo 9 10 11 12 13 14 15 Seccin 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Porosidad 5,942 5,014 5,143 4,061 3,835 2,964 4,584 4,398 4,193 4,125 3,074 3,483 3,867 4,212 6,247 4,730

Campo 1 2 3 4 5 6 7 8

Suponga que todos los efectos son aleatorios. Escriba un modelo lineal para el estudio, explique cada trmino, calcule el anlisis de varianza para los datos y muestre los cuadrados medios esperados. Estime las componentes de la varianza para campos, secciones y muestras.

49

Palacios C. Severo XIII. DISTRIBUCIONES Al tratar con grandes cantidades de datos, es conveniente ordenarlos de tal manera que la frecuencia de la aparicin de rangos de valores dados, puedan ser tabuladas y graficadas. Este ordenamiento se realiza estableciendo rangos llamados intervalos de clase la frecuencia relativa de los intervalos de clase se denomina distribucin emprica y se utilizan para estimar las distribuciones tericas. Ensayos estadsticos Existen varios tipos de ensayos estadsticos que se emplean para determinar si la diferencia entre dos conjuntos de valores es real y significativa o a errores azarsticos. Ensayo t La distribucin t de Student aparece al comprobar la hiptesis de la media de una totalidad general de distribucin normal siendo incgnita la varianza. n 1 1n 2 X 2 f (X ) 1 N n a 2

Ejemplo 1.12 Consideremos los datos del ejemplo 1.10, se trata de saber si la diferencia entre el valor medio y el supuesto valor medio 96 es significativa.S X 2,03 S X 4,54 Hiptesis : o GL 4 X 94,32

t

X o

SX 0,82

50

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera El valor tabulado de t para un nivel de significacin del 99% y 4 GL, es igual 3,75, como el valor calculado de t es inferior al valor tabulado, la hiptesis no es rechazada. Chi-cuadrado Esta prueba puede utilizarse para comparar los resultados de una encuesta con frecuencia terica o esperada.X2 f f f2

Ejemplo 1.13 La alimentacin de flujo continuo que se realiza a cuatro reactores industriales que han sufrido un total de cuarenta fallas durante un ao, la distribucin de las fallas, por bombas fue:Bomba 1: Bomba 2: Bomba 3: Bomba 4: 16 9 6 9

El capataz de mantenimiento sostiene que la bomba 1 ha sufrido un nmero excesivo de fallas, en comparacin con los resultados posteriores se trata de saber si esta afirmacin es justificada. Como hay cuatro categoras posibles de nmeros y como el nmero total est dado, el nmero de GL es tres. Esto corresponde a un nmero de probabilidades aproximadamente igual a 0,25 e indica que, si todas las bombas operan en las mismas condiciones, el valor del Chicuadrado sera de 5,4 es decir una vez cada cuatro, por la sola accin del azar. Por lo tanto la probabilidad que la hiptesis de mantenimiento esta equivocado es del 25 por ciento en la poblacin, La prueba puede usarse siempre que los resultados, las respuestas o los encuestadores se pueden organizar en varias categoras. Distribucin F El anlisis de varianza que se realiza mediante el ensayo F permite la separacin de la varianza total de un proceso, en sus componentes. Con el ensayo F el nmero de GL correspondiente a las dos varianzas no necesita ser idnticas. 51

Palacios C. Severo La mayora de los textos de estadstica tabulan valores de F para los niveles de probabilidad 0,05 y 0,01. El nmero de GL, con la varianza en el numerador, se indica normalmente en la parte superior de la tabla, mientras que el nmero de GL con la varianza en el denominador se encuentra en la columna de la izquierda. Ejemplo 1.14 Para un ensayo de laboratorio de rutina, se ha propuesto un procedimiento analtico simplificado. Es necesario determinar si el procedimiento propuesto arroja los mismos resultados que el convencional, es decir, si los valores medios de un ensayo por duplicado son iguales y si la precisin del ensayo propuesto es igual al antiguo.Convencional 89,7 89,6 89,5 89,6 89,8X 1 89,64 GL 4 S12 ( X ) 0,013

Propuesto 89,8 89,6 89,4 89,5 90,0 89,7 89,2X 1 89,6 GL 62 S 2 ( X ) 0,07

Los valores medios de las muestras con los dos mtodos son similares pero la diferencia con la varianza es significativa al nivel del 0,05 de probabilidad. Consultado la tabla de valores F indica el valor de 6,2 para el nivel de probabilidad correspondiente y el nmero de GL existente. Para determinar si los valores de varios conjuntos de medicin, es necesario el clculo de varianza de los valores medios de los conjuntos. Si la varianza de los valores medios es slo normal resulta. Ejemplo 1.15 Tres reactores ubicados en diferentes lugares, que emplean sin embargo el mismo proceso. Se desea saber si los valores medios correspondientes a los tres reactores son similares. Entre valores mediosS 2 X 3,82552

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera Entre conjuntosS X 0,39882

FReactor

S2 X2

S X

9,592 11,6 12,4 12,9 11,9 48,8 12,2 3 9,80 10,9 10,4 10,1 41,2 10,3

Suma de conjunto Media

1 10,4 10,0 11,8 11,2 43,4 10,85 2 SC / K 1490,612 X / K 1482 ,96

2 , X 1492 2

La tabla F para los GL establecido indica los valores de 4,26 y 8,02 respectivamente. Como el valor calculado es mayor que el valor tabulado, se concluye que los valores medios de los tres reactores son significativamente diferentes. Logaritmo normal La distribucin logartmica normal es de amplio uso en la fsica estadstica, geologa estadstica, estadstica econmica, biologa. Logstica La funcin de distribucin se diferencia un poco de la funcin normal de distribucin, se utiliza en las investigaciones mdico-biolgicas para analizar la eficiencia de diferentes medicamentos, nutrientes, venenos, etc. Pareto La distribucin de Pareto encuentra amplia aplicacin en los problemas de la estadstica econmica. Weibull-Gnedenko Se usa con frecuencia en la teora de fiabilidad para describir el tiempo de funcionamiento sin fallo de los instrumentos. 53

Palacios C. Severo Pearson Se usa ampliamente en la estadstica matemtica para suavizar las distribuciones de los datos empricos. XIV. INTERVALOS DE CONFIANZA El desarrollo del anlisis estadstico implica la determinacin terica de la distribucin de ciertos valores, como el valor medio, la desviacin estndar y la varianza, que se puede esperar si slo acta al azar. La teora estadstica constituye una herramienta poderosa, para determinar, en un grado razonable de certidumbre, si las diferencias observadas son debidas al azar. Por definicin:Reordenando Z X n Intervalo de confianza

Z X

/ n

Por lo tanto, para un cierto nivel de probabilidad que determina el valor de Z, puede afirmarse que el intervalo de confiabilidad de estar dado por,X Z Z X n n

Si no se conoce la desviacin estndar verdadera, an puede determinarse un intervalo de confiabilidad. Esta estimacin utiliza la distribucin t en lugar de la distribucin Z porque el concepto t incluye la variacin adicional introducida por la estimacin de la desviacin estndar, reordenando:X tS X n X tS X n

Ejemplo 1.16 Establecer el intervalo de confiabilidad para la media verdadera de los datos del ejemplo 1.10.GL 4 S X 4,54 t0,95 2,78 t0,99 4,654

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingenieraNivel

95% 99%

Intervalo 94,32 2,784,54 / 5 99,96 y 88,68

94,32 4,604,54 / 5 103,65 y 84,94

Se observa que para un nivel de confiabilidad del 95% ser ms correcto afirmar el resultado del anlisis como 5,64 por ciento en lugar de 94,32%. XV. MUESTREO Nadie necesita beber todo un vaso de leche daada para poder decir que esta mala - una muestra es suficiente. Realizar un muestreo es ms barato y ms rpido que hacer un censo de toda una poblacin. Y en la mayora de los casos, desde luego, tomar una muestra es la nica alternativa factible para la investigacin simplemente no es prctico pensar siquiera en encuestas a toda la poblacin. Pero si la muestra se desarrolla con propiedad, sta puede proporcionar suficiente precisin para propsitos de toma de decisiones. El muestreo en la investigacin requiere estas dos dimensiones: a) Seleccionar las unidades de la poblacin que se incluir en el estudio. b) Interpretar los resultados del estudio con el fin de estimar los parmetros de la poblacin a partir de los datos de la muestra y probar hiptesis, usualmente sobre la diferencia entre dos muestras o entre una muestra y un resultado esperado. XVI. MTODOS DE MUESTREO Hay dos grandes mtodos de muestreo: Probabilstico y no probabilstico. a) Muestreo probabilstico

Este es el tipo de muestreo ms objetivo y cientfico. Un requisito del muestreo probabilstico es que cada unidad en la poblacin tenga una probabilidad igual y conocida a ser seleccionada para la muestra. El criterio de investigador no debe influir en la seleccin de los informantes. Hay varias formas de muestreo: 55

Palacios C. Severo Muestreo simple al azar Es el tipo ms bsico. Implica seleccionar informantes completamente al azar; es tal como si los nombres se sacarn de un sombrero. Obviamente, esto requiere un marco de muestreo perfecto; es decir, una lista completa de todas las unidades en el universo. Muestreo estratificado al azar Implica primero agrupar la poblacin en segmentos homogneos y luego hacer el muestreo de datos de cada segmento o estrato. Muestreo de agregados Implica tomar muestras de grupos de entrevistados como unidad y no como elemento individual. Con el fin de lograr eficiencia en entrevistas de muestreo a muestreo. Muestreo sistemtico Se incluye cada n-simo elemento de la poblacin en la muestra. Este es un procedimiento comn que se puede combinar con un muestreo de agregados y muestreo estratificado. La ventaja principal del muestreo probabilstica es su precisin. Es el mejor camino para desarrollar una muestra que sea perfectamente representativa de la poblacin. El muestreo probabilstica tiene varias desventajas importantes que resulta su utilizacin amplia: a) Para seleccionar una muestra probabilstica es necesario tener una lista o un marco de muestreo, correspondiente a toda la poblacin. b) A pesar de los mejores intentos de muestreo, los errores de no respuesta pueden afectar la precisin del resultado. c) El muestreo probabilstica es muy costoso de realizar, es especial para estudios de muestra a muestra. Errores Si bien es cierto que buenos mtodos de muestreo pueden producir resultados muy costosos, ninguna muestra es absolutamente precisa.

56

ESTADISTICA EXPERIMENTAL Aplicada a ciencia e ingeniera Ejemplo 1.17 Supongamos que una muestra probabilstica local indica que el 40% de los hogares entrevistados se tiene un gato para erradicar las ratas transmisoras del virus Hanta. Es poco probable que un censo de todos los hogares revele que exactamente en el 40% de ellos haya un gato. Si la muestra original fue bien tomada, bien ejecutada y fue suficientemente grande hay una buena probabilidad de que el nmero real de hogares con gatos, revelado al censo est cerca del 40%; pero probablemente no ser exacta mente esa cifra. Esto