estadistica inferencial.doc

43
 ESTADÍSTICA  INFERENCIA ESTA DÍSTICA INTRODUCCIÓN. El empleo de encuestas es uno de los métodos de investigación más utilizados en la actualidad. La realidad, en continuo cambio y con muchísimas opciones diferente s, es muy difícil de abarcar en su totalidad. Por este motivo se hace necesario seleccion ar una  parte lo más peue!a posible, pero representativa del total, en la ue sea posible medir las car ac ter ísticas de sea das. Esta necesi da d ha obl iga do a cre ar un ins tru me nto matemático ue llamamos muestreo. Las muestras ue se eli"an para hacer un estudio deben ser lo más peue!as  posible por e#igencias de tiempo y coste. $demás, el aumento del n%mero de datos no siempre acarrea una mayor certeza, ya ue más importante ue escoger muchos datos es ue los datos estén bien seleccionados, con el fin de ue sean representativos de la  población ue se desea estudiar. &e verá como el azar "uega un papel importante en la elección de la muestra para ue ésta sea representativa. En este tema estudiaremos dos parámetros de una población' la media de una determinada característica numérica y la proporción o porcenta"e de la población ue comparte un determinado rasgo com%n. La inferencia estadística se basa en resultados de la teoría de la probabilidad, los cuales nos aseguran, ue al estudiar la media o la proporción de muestras, tomadas adecuadamente en la población, estas características serán muy similares a las de la  población total. El método de inferencia estadística hace estimaciones de lo ue ocurre en toda la  población estudiando lo ue ocurre en una parte de la misma (la muestra). *omo se  pretende sacar conclusiones sobre el total de la población a partir de una muestra de la misma, estas conclusiones estarán su"etas a error. La teoría de la probabilidad permite también acompa!ar a la estimación muestral de una media o de una proporción, en una  población, de la probabilidad de ue el error cometido no e#ceda de un determinado valor, o del riesgo (probabilidad de euivocación) ue se corre al aceptar o al rechazar una hipótesis sobre los valores de la media o de la proporción de la población. $h ora bi en , la in fere ncia se hace a pa rt ir de muestras u e de be n es ta r  debidamente escogidas. Por esta razón trataremos previamente a los métodos de la inferencia, las técnicas de muestreo, es decir, las diversas formas de poder seleccionar una muestra ue sea adecuada para realizar las inferencias, controlando el posible error. Para traba"ar este tema se necesita el mane"o de los n%meros combinatorios como herramienta de cálculo y el conocimiento y uso de la distribución normal y sus  propiedades. +inalmente, insistir en la importancia de la inferencia estadística como disciplina fundamental en todas las áreas científicas, tanto naturales como sociales. Inferencia estadística. 1

Upload: andesnet

Post on 05-Oct-2015

23 views

Category:

Documents


0 download

TRANSCRIPT

INFERENCIA ESTADSTICA

ESTADSTICA

INFERENCIA ESTADSTICAINTRODUCCIN.

El empleo de encuestas es uno de los mtodos de investigacin ms utilizados en la actualidad. La realidad, en continuo cambio y con muchsimas opciones diferentes, es muy difcil de abarcar en su totalidad. Por este motivo se hace necesario seleccionar una parte lo ms pequea posible, pero representativa del total, en la que sea posible medir las caractersticas deseadas. Esta necesidad ha obligado a crear un instrumento matemtico que llamamos muestreo.

Las muestras que se elijan para hacer un estudio deben ser lo ms pequeas posible por exigencias de tiempo y coste. Adems, el aumento del nmero de datos no siempre acarrea una mayor certeza, ya que ms importante que escoger muchos datos es que los datos estn bien seleccionados, con el fin de que sean representativos de la poblacin que se desea estudiar. Se ver como el azar juega un papel importante en la eleccin de la muestra para que sta sea representativa.

En este tema estudiaremos dos parmetros de una poblacin: la media de una determinada caracterstica numrica y la proporcin o porcentaje de la poblacin que comparte un determinado rasgo comn.

La inferencia estadstica se basa en resultados de la teora de la probabilidad, los cuales nos aseguran, que al estudiar la media o la proporcin de muestras, tomadas adecuadamente en la poblacin, estas caractersticas sern muy similares a las de la poblacin total.

El mtodo de inferencia estadstica hace estimaciones de lo que ocurre en toda la poblacin estudiando lo que ocurre en una parte de la misma (la muestra). Como se pretende sacar conclusiones sobre el total de la poblacin a partir de una muestra de la misma, estas conclusiones estarn sujetas a error. La teora de la probabilidad permite tambin acompaar a la estimacin muestral de una media o de una proporcin, en una poblacin, de la probabilidad de que el error cometido no exceda de un determinado valor, o del riesgo (probabilidad de equivocacin) que se corre al aceptar o al rechazar una hiptesis sobre los valores de la media o de la proporcin de la poblacin.

Ahora bien, la inferencia se hace a partir de muestras que deben estar debidamente escogidas. Por esta razn trataremos previamente a los mtodos de la inferencia, las tcnicas de muestreo, es decir, las diversas formas de poder seleccionar una muestra que sea adecuada para realizar las inferencias, controlando el posible error.

Para trabajar este tema se necesita el manejo de los nmeros combinatorios como herramienta de clculo y el conocimiento y uso de la distribucin normal y sus propiedades.

Finalmente, insistir en la importancia de la inferencia estadstica como disciplina fundamental en todas las reas cientficas, tanto naturales como sociales.

POBLACIN Y MUESTRA.

En el campo de la Estadstica el concepto de poblacin se encuentra prximo a la nocin general de grupo o conjunto.

Definicin.

POBLACIN.

Se llama poblacin o universo a cualquier conjunto, colectivo o coleccin finita o infinita de individuos o elementos.

Una poblacin puede ser, no slo un conjunto de personas, sino tambin un conjunto de animales, objetos, fenmenos, medidas, .....

Ejemplo:Si pasamos un test a todos los alumnos espaoles de una determinada edad, los resultados obtenidos constituyen una poblacin de medidas de la capacidad a la que se derige el test.

Definicin.CENSO.Se da el nombre de censo a la enumeracin y anotacin de ciertas caractersticas de todos los elementos de una poblacin.

Ejemplo:

El profesor-tutor de un grupo de un instituto realiza un listado de los alumnos/as de su tutora, en la incluye, nombre y apellidos, nombre de los padres, domicilio, telfono, nmero de hermanos y asignaturas pendientes del curso anterior. Este sera un ejemplo de censo de la poblacin formada por el alumnado del grupo en cuestin.

Las poblaciones en Estadstica pueden ser finitas o infinitas. Una poblacin es finita cuando consta de un nmero limitado de unidades, y una poblacin es infinita cuando su tamao es indefinidamente grande.

Ejemplo:

Si consideramos el nmero de hermanos que tienen los alumnos/as de un curso de un instituto determinado, estaramos hablando de una poblacin finita. Habra tantos valores como alumnos/as haya en dicho curso.

Si obtenemos una serie de medidas del tiempo que tarda un alumno en resolver una divisin de dos cifras, estas medidas pueden consideradas parte de un conjunto mucho mayor, de tamao indefinidamente grande, constituido por todas las medidas que obtendramos si repitisemos la experiencia una y otra vez.

Supongamos que se lanza un dado en reiteradas ocasiones, y anotamos el valor de la cara superior. Tal experiencia puede ser repetidamente hasta el infinito, por lo que cualquier conjunto de resultados podra ser considerado una parte extrada de una poblacin indefinidamente grande.

En definitiva, con frecuencia, las poblaciones en Estadstica suelen ser consideradas infinitas.

El gran tamao que presentan algunas poblaciones es precisamente la principal razn que hace recomendable reducir su estudio a muestras obtenidas de ellas.

Definicin.MUESTRA.Se define muestra como una parte o subconjunto de una poblacin, debidamente elegida, que se somete a observacin cientfica en representacin de la misma, con el propsito de obtener resultados vlidos para el total de la poblacin.

Para que una muestra se considere vlida debe cumplir que:

Su tamao sea proporcional al tamao de la poblacin.

No haya distorsin en la eleccin de los elementos de la muestra.

Sea representativa.

Un estudio exhaustivo cuyos datos se utilizan para multitud de trabajos e investigaciones es el Censo de Poblacin. Requiere un gran esfuerzo tanto econmico como de medios y en l se recaba informacin de todos los habitantes de un pas. Sin embargo, para el conocimiento de algunas caractersticas de la poblacin, se utilizan mtodos alternativos que reducen el costo y el tiempo. Los modelos reducidos de la poblacin, constituidos por las muestras, tienen como finalidad obtener resultados que puedan ser aplicables (extrapolables) a la poblacin.

Las principales razones que inducen a tomar muestras son:

a) El coste temporal. Estudiar una poblacin de tamao considerable exige una dedicacin de tiempo que retrasara enormemente las investigaciones en marcha y prolongara en exceso la realizacin de los estudios. A veces, esto ltimo podra entrar adems en conflicto con el carcter vivo, cambiante, en continua evolucin de las realidades que ocupan el inters de los investigadores en el campo de las ciencias sociales, cuyo estudio desde una perspectiva sincrnica, requiere la concrecin en segmentos temporales limitados. Por ejemplo, si queremos saber cmo ha afectado a la intencin de voto de los espaoles determinadas declaraciones de un destacado lder poltico no disponemos de un tiempo indefinido, porque otros hechos o declaraciones posteriores influiran en las opiniones y tendencias de la poblacin. En este caso, sera necesario recurrir a un muestreo que permita abordar el estudio con un bajo coste temporal.

b) El coste econmico. La inversin en recursos temporales y humanos necesaria para abordar algunos problemas de investigacin sera elevada si pretendiramos abarcar a la poblacin. La recogida de los datos que posteriormente van a ser analizados estadsticamente requiere desplegar estrategias que exigen disponer de recursos. El envo de cuestionarios por correo, la realizacin de entrevistas por parte de personas especializadas, el desplazamiento de observadores a los lugares estudiados, etc., suponen un coste econmico que queda reducido si nos limitamos al estudio de una muestra extrada de la poblacin.

c) El impacto sobre la realidad estudiada. Cuando el estudio realizado pudiera provocar efectos en los sujetos, parece adecuado limitar la realizacin de experimentos a mbitos reducidos. Por ejemplo, la medicin de los resultados de un nuevo mtodo de aprendizaje de la lectura habra de hacerse sobre un nmero reducido de alumnos, sin extender a toda la poblacin la nueva metodologa hasta no confirmar los resultados positivos de la misma.

d) Una poblacin homognea. Si la poblacin es homognea se pueden obtener muy buenos resultados a partir de cualquier muestra.

e) La falta de personal. Si no se dispone de suficiente personal preparado para llevar a cabo un estudio exhaustivo, tambin resulta aconsejables hacer un muestreo.

Por otro lado, el uso del muestreo presenta limitaciones, entre estas destacamos:

a) El riesgo que supone la toma de una muestra que pueda no ser representativa.

b) Cuando es necesaria informacin de todos los elementos de la poblacin.

c) Cuando no se domina bien la tcnica de muestreo.

d) Cuando la poblacin est formada por un nmero muy pequeo de elementos, ya que una ligera equivocacin en la toma de la muestra puede originar grandes errores.

Para el investigador tienen especial inters las muestras en la medida en que permiten generalizar los resultados de un estudio a las poblaciones de las que fueron extradas. Para que ello sea posible es necesario que el muestreo se realice siguiendo determinados procedimientos que garanticen la representatividad de la muestra y, por tanto, las posibilidades de generalizacin.

PARMETRO Y ESTIMADOR DE UN PARMETRO.

La Estadstica Descriptiva se ocupa del estudio de series de puntuaciones, para las cuales se calculan las medias, varianza, desviacin tpica, etc.

Definicin.

PARMETRO.

Se denomina parmetro a todo valor que sirva para describir un conjunto de datos.

Ejemplo:

Supongamos que tenemos la estatura, medida en centmetros, de un grupo de diez jvenes: {170, 172, 180, 175, 178, 194, 178, 165, 170, 178}. La estatura media es de 176 centmetros y la desviacin tpica es (aproximadamente) de 7.5 centmetros. La media y la desviacin tpica son valores que describen al conjunto de estaturas, y seran ejemplos de parmetros.

En cambio, en la Estadstica Inferencial se estudian conjuntos de puntuaciones, las muestras, con el fin de generalizar los resultados a conjuntos de puntuaciones ms amplios, las poblaciones, de las que fueron extrados.

Definicin.

ESTADSTICO Y ESTIMADOR DE UN ESTADSTICO.

Los valores que describen a las poblaciones recibirn el nombre de parmetros o estadsticos, mientras que las medidas que describen el comportamiento de una muestra se denomina estimador del parmetro o estimador del estadstico.

Ejemplo:

A partir del valor alcanzado por la media en una muestra podramos intentar estimar el valor de la media de en la poblacin. As, si los diez jvenes del ejemplo anterior son alumnos/as elegidos al azar de una escuela de baloncesto, intentaramos deducir la estatura media de los integrantes de dicha escuela, tomando como referencia los 176 centmetros obtenidos.

TIPOS DE MUESTREO.

Definicin.

MUESTREO.

Se llama muestreo al procedimiento mediante el cual elegimos a las unidades estadsticas que forman la muestra, dentro del conjunto que constituye la poblacin.

Diremos que el muestreo es probabilstico cuando todos los elementos de la poblacin poseen un probabilidad conocida (o calculada de antemano), no nula, de ser elegidos para formar parte de la muestra. Se contrapone al llamado muestreo no probabilstico, en el que, o bien no se conoce la probabilidad de que los elementos de la poblacin sean seleccionados para la muestra, o bien para parte de ellos esta probabilidad es nula y, por tanto, no es posible llevar a cabo inferencias estadsticas.

Lgicamente, el muestreo que se encuentra en la base de la mayora de los mtodos de la Estadstica Inferencial es el muestreo probabilstico. Para llevarlo a cabo es necesario que la seleccin pueda considerarse como una prueba o experimento aleatorio o de azar, de los que constituyen la base de la teora de la probabilidad en la cual se fundamenta la estadstica matemtica.

Las generalizaciones de resultados, a partir del estudio de muestras extradas mediante procedimientos de muestreo no probabilstico, nos impiden conocer el margen de error con el que hacemos las generalizaciones a la poblacin. En cambio, el muestreo probabiltico permite hacer inferencias sobre la poblacin, y gracias a los procedimientos de la Estadstica Inferencial podemos conocer el error con el que se realizan las generalizaciones.

En las pginas siguientes, se describen muestreos probabilsticos (muestreo aleatorio con y sin reposicin, muestreo aleatorio sistemtico, muestreo estratificado, muestreo por conglomerados, muestreo polietpico) y muestreos no probabilticos (muestreo intencional, por cuotas, incidental y accidental), pero antes incluiremos dos conceptos que aparecen al referirnos al muestreo: factor o coeficiente de elevacin y fraccin de muestreo.

Definiciones.

FACTOR DE ELEVACIN.

Se denomina factor o coeficiente de elevacin al cociente entre el tamao de la poblacin y el tamao de la muestra, . Representa el nmero de elementos que hay en la poblacin por cada elemento de la muestra.

FRACCIN DE MUESTREO.

Se denomina fraccin de muestreo al cociente entre el tamao de la muestra y el tamao de la poblacin, . Si se multiplica por 100, representa el porcentaje de la poblacin que representa la muestra.

A) MUESTREOS PROBABILSTICOS.

Muestreo aleatorio simple con y sin reposicin. Se denomina muestreo aleatorio simple a aquel en que todos los elementos de la poblacin tienen la misma probabilidad de formar parte de la muestra y sta es determinada nicamente por el azar. Se trata de un tipo de muestreo probabilstico que permite con facilidad llevar a cabo inferencias estadsticas y calcular la probabilidad de error asociada a las mismas.

Concretando, el muestreo aleatorio simple consiste en seleccionar n elementos con o sin reemplazamiento de entre los N elementos que componen la poblacin, de tal modo que todas las muestras de tamao n que se puedan formar tengan la misma probabilidad de ser elegidas.

Si la muestra se selecciona sin reemplazamiento (es decir, cuando un elemento ha sido extrado queda descartado de cara a la siguiente extraccin) se habla de muestreo aleatorio sin reposicin, tambin llamado muestreo irrestrictamente aleatorio.

Si la muestra se selecciona con reemplazamiento (es decir, el elemento elegido en cada extraccin vuelve a ser incluido en la poblacin antes de extraer el siguiente elemento) se habla de muestreo aleatorio con reposicin, tambin llamado generalmente muestreo aleatorio simple.

Si bien los dos mtodos son distintos, cuando el tamao de la poblacin es infinito o tan grande que pueda considerarse como infinito, ambos mtodos llegan a las mismas conclusiones. Si la fraccin de muestreo es mayor de 0.1 (se muestrea ms del 10 % de la poblacin) la diferencia entre ambos mtodos puede ser apreciable, llegando a conclusiones contradictorias segn se aplique un mtodo u otro.

Ejemplo:

En el muestreo aleatorio sin reposicin, el nmero de muestras de tamao n que se pueden formar es: , y, por tanto, la probabilidad de elegir una muestra determinada es: .

La probabilidad de que un elemento determinado de la poblacin forme parte de la muestra viene dada por .

En efecto:

.

En la prctica el procedimiento de muestreo aleatorio consiste en extraer al azar los elementos que constituyen la muestra, obteniendo la muestra unidad a unidad. Para ello, si la poblacin es finita, se enumeran los elementos de la poblacin desde 1 hasta N, y se extraen a continuacin n elementos usando una urna o un bombo. Este procedimiento, aunque sencillo, requiere tener unos medios materiales: un bombo o una urna, papeles numerados o bolas numeradas, etc., por lo que se suelen utilizar otras alternativas como las tablas de nmeros aleatorios o la generacin de nmeros aleatorios con la calculadora.

Las tablas de nmeros aleatorios son tablas de nmeros colocados de tal forma que no exista ninguna relacin entre ellos sea cual sea el sentido en que los leamos. Al final de los contenidos tericos de este tema aparece una tabla de nmeros aleatorios.

Ejemplo:

Si en una poblacin de 834 individuos deseamos extraer una muestra de 42, asignaramos un nmero a cada uno de los 834 elementos de la poblacin. Para determinar los 42 elementos de la muestra, marcaramos un nmero en la tabla de nmeros aleatorios al azar y a partir de ste leeramos en dicha tabla nmeros de tres dgitos en cualquier direccin, desestimando los que superen 834.

Tambin podramos encontrar estos 42 nmeros generando nmeros de forma aleatoria con la calculadora. As:

Con la calculadora Texas Instruments TI-92, utilizando la orden rand(834), obtendramos nmeros entre 1 y 834.

Con la calculadora CASIO fx-180P, debemos utilizar la sucesin de teclas, INV () RAN, y descartamos los nmeros que superen 834.

Muestreo aleatorio sistemtico. El muestreo aleatorio sistemtico resulta ser un procedimiento ms cmodo que el muestreo aleatorio, con o sin reposicin, cuando la poblacin o la muestra que vamos a extraer son grandes. En lugar de recurrir a papeletas, bolas, tablas de nmeros aleatorios o calculadora, puede determinarse la muestra eligiendo sistemticamente, en una relacin ordenada de los individuos de la poblacin, aquellos que se encuentren a una distancia determinada. Suponiendo que el tamao de la muestra es N y que la muestra que queramos extraer constara de n individuos, procederamos del siguiente modo:

a) Calculamos el coeficiente de elevacin, .

b) Elegimos aleatoriamente un nmero m comprendido entre 1 y k.

c) Determinamos la muestra sumndole repetidamente k al nmero, m, elegido.

La muestra estar constituida por los individuos:

Para que la muestra conserve el carcter aleatorio, debemos procurar que la ordenacin de los individuos de la poblacin no presente tendencias que hagan recaer la eleccin sistemtica sobre unidades que no sean representativas de la heterogeneidad de la poblacin.

Ejemplo:

Supongamos que queremos hacer una investigacin en un instituto de 720 alumnos y alumnas, de los que queremos tomar una muestra de 80 individuos. En primer lugar, ordenar todos los alumnos y alumnas alfabticamente sera un buen criterio de ordenacin. Sin embargo, disponer los alumnos situando una tras otra las listas de los alumnos/as de cada clase, en las que estos aparezcan por orden de calificaciones, podra llevar a que se seleccionaran sistemticamente los alumnos/as con calificaciones altas y no los de las calificaciones bajas, o viceversa.

Una vez ordenados adecuadamente, calculamos el coeficiente o factor de elevacin . Elegimos aleatoriamente un nmero entre 1 y 9 (tabla de nmeros aleatorios, calculadora, .....). Si el nmero obtenido fuese 6, los individuos seleccionados seran:

{6, 15 (= 6+9), 24 (= 6+2 9), 33 (=6+3 9), ........, 717 (=6+79 9)}

Evidentemente, k no suele ser un nmero entero. Si se desprecian los decimales ocurrir que una parte de los sujetos que se encuentran al final de la ordenacin pierden toda posibilidad de ser elegidos. Una solucin podra consistir en mantener los decimales del coeficiente k y redondear el resultado de las sumas al nmero entero ms prximo, una vez que se han realizado todas ellas. Otra sera, sumar alternativamente las cantidades Ent(k) y Ent(k) +1.

Adems del procedimiento que acabamos de exponer, existen otras formas de muestreo que tambin se consideran muestreos sistemticos. Por ejemplo, para elegir una muestra de personas, podemos seleccionar una o varias letras del abecedario y tomar como muestra todos los sujetos cuyo apellido comience por esa(s) letra(s).

Muestreo estratificado. El muestreo estratificado se realiza cuando queremos garantizar cierta representatividad de la muestra respecto de alguna caracterstica. Para ello, en funcin de esa caracterstica, dividimos la poblacin de tamao N en K estratos o subpoblaciones de tamaos respectivos y elegimos de forma aleatoria (mediante sorteo, tablas, procedimientos sistemticos, .....) submuestras de tamaos en cada estrato, asegurndonos de este modo de que todas las subpoblaciones estarn representadas en la muestra. La muestra total ser la suma de las submuestras elegidas en cada estrato, es decir, .

Cabe diferenciar entre muestreo estratificado con asignacin proporcional o de afijacin proporcional, muestreo estratificado con asignacin constante o de afijacin igual y muestreo estratificado con asignacin ptima.

En el muestreo estratificado con asignacin proporcional, o de afijacin proporcional, se respeta la importancia cuantitativa de cada estrato, asignando en la muestra un nmero de individuos proporcional al tamao del estrato en la poblacin.

En el muestreo estratificado con asignacin constante, o de afijacin igual, todos los estratos contribuyen a la muestra con idntico nmero de individuos, con independencia de cual sea la importancia numrica de dicho estrato.

Finalmente, se habla de muestreo estratificado con asignacin ptima cuando la contribucin de cada estrato se determina a partir de parmetros ya conocidos de la poblacin.

Ejemplo:

Se desea extraer una muestra de 60 alumnos y alumnas de un centro escolar en el que hay 500 matriculados, de los que 300 son nios y 200 son nias, para estimar la estatura media.

Si se utiliza un muestreo estratificado de afijacin igual deberamos seleccionar 30 nios y 30 nias.

Si se utiliza un muestreo estratificado de asignacin proporcional deberamos escoger 36 nios y 24 nias.

Si conocemos la variabilidad de la caracterstica considerada, y sabemos que la varianza en el caso de los alumnos es de 15 cm y en las alumnas 5 cm, la proporcin de alumnos a alumnas sera de 3 : 1, y usando un muestreo estratificado de asignacin ptima, los tamaos de las submuestras deberan ser de 45 nios y 15 nias.

Lgicamente, el menos recomendable de los tres tipos de muestreo estratificado es el de asignacin constante, ya que asigna el mismo tamao a cada estrato, y como consecuencia se favorece a los estratos de menor tamao y perjudica a los grandes, en cuanto a la precisin de los resultados que obtengamos.

Muestreo por conglomerados. El muestreo por conglomerados se utiliza cuando las unidades de la poblacin presentan alguna forma de agrupamiento, que permite elegir grupos en lugar de individuos. De esta forma, el acceso a la muestra queda facilitado considerablemente, al quedar reunidos en una serie de grupos los individuos que la constituyen. Al realizar el muestreo, seleccionaramos aleatoriamente una serie de grupos o conglomerados, tratando de reunir el nmero total de individuos que pretendemos incluir en la muestra. Los conglomerados deben ser lo ms representativos posible de la poblacin, es decir, deben representar la heterogeneidad de la poblacin del estudio y ser entre s homogneos.

Este procedimiento no requiere construir censos o listados completos de los elementos de la poblacin, que son sustituidos en este caso por los censos de conglomerados. En realidad, el muestreo por conglomerados no es ms que la aplicacin de los muestreos aleatorios con o sin reposicin, sistemtico o estratificado al caso en que la unidad de muestreo no son los individuos sino los grupos de individuos. Usando este procedimiento se evita la dispersin de unidades a la que conducen otros tipos de muestreo, y se reducen los costes y el tiempo de un trabajo de recogida de datos.

Cuando los conglomerados se corresponden con zonas geogrficas, y se define el conglomerado como un rea o parte bien limitada del terreno, se denomina muestreo por reas.

Ejemplo:

Si queremos hacer un estudio sobre la influencia de un determinado pienso en el engorde de cerdos criados en granjas, podemos seleccionar aleatoriamente las granjas y luego dentro de ellas estudiar los pesos de los cerdos, bien de todos los cerdos de cada granja o de una muestra representativa de la poblacin de cerdos de la misma.

Muestreo polietpico. En el muestreo polietpico las unidades que finalmente componen la muestra se determinan en etapas sucesivas. Se trata de un caso particular del muestreo por conglomerados, en el que la unidad final no son los conglomerados sino subdivisiones de stos. Por tanto, ser interesante aplicarlo cuando los conglomerados contengan un elevado nmero de individuos y resulte aconsejable hacer una seleccin entre ellos.

Si nicamente desarrollamos dos etapas, muestreo bietpico, el procedimiento consistira en la seleccin de los conglomerados en la primera etapa, y la seleccin de los individuos en la segunda.

No obstante, el muestreo polietpico puede extenderse a ms de dos etapas dando lugar a una seleccin sucesiva de unidades cada vez menores, que estn jerarquizadas de tal modo que la unidades de la primera etapa son divisibles en unidades de la segunda etapa, stas a su vez en unidades de la tercera etapa, y as hasta alcanzar las unidades que finalmente constituirn la muestra. Estas unidades finales no necesariamente han de ser los individuos.

En cada etapa, la seleccin de las unidades podr hacerse siguiendo procedimientos de muestreo aleatorio, sistemtico o estratificado.

Ejemplo:

En el ejemplo anterior referido al estudio sobre la influencia de un determinado pienso en el engorde de cerdos, supongamos que el estudio se realiza a nivel de toda Espaa. Entonces, en una primera etapa, podramos seleccionar de forma aleatoria una serie de provincias; en segundo lugar, en cada una de las provincias seleccionar tambin aleatoriamente algunas comarcas (bien delimitadas); posteriormente, dentro de cada comarca elegir al azar un grupo de granjas; y finalmente, en cada una de ellas estudiar todos los cerdos o una muestra de ellos elegida adecuadamente.

B) MUESTREOS NO PROBABILSTICOS.

Muestreo intencional u opintico. En el muestreo intencional u opintico la representatividad depende de la intencin u opinin de la persona que selecciona la muestra, y que, segn su criterio, procura que sea representativa. Por tanto, la evaluacin de la representatividad es subjetiva. En este caso, la composicin de la muestra puede estar influida por las preferencias o tendencias, aun las inconscientes, del individuo que la obtiene, y no slo por factores objetivos que son los que deben tenerse en cuenta de modo riguroso, como ocurre en el muestreo probabilstico.

Ejemplo:

Se pretende hacer una encuesta en un instituto, entre los alumnos de 4 de E.S.O., para saber la modalidad de Bachillerato que seguirn los que continen estudiando. El Jefe de Estudios pregunta a unos cuantos alumnos de cada grupo de 4 de E.S.O., con el nico criterio de que piensa que esos seguirn estudiando.

Este tipo de muestreo carece, pues, de una base terica satisfactoria a pesar de lo cual su uso est bastante generalizado, especialmente el llamado muestreo por cuotas.

Muestreo por cuotas. En el muestreo por cuotas, el investigador establece estratos de la poblacin, determina el nmero de individuos a seleccionar en cada uno de ellos y elige intencionadamente individuos para completar las cuotas establecidas. Se asemeja al muestreo por estratos en cuanto que supone un conocimiento previo de la poblacin, que permite diferenciar segmentos o estratos dentro de la misma, pero se distancia de aquel por el hecho de que aqu los individuos que constituyen la cuota aportada a la muestra por cada estrato no son determinados aleatoriamente, sino en funcin de otros criterios (accesibilidad, comodidad, economa, etc.). La nica condicin impuesta es que los individuos cumplan los requisitos fijados en las cuotas.

Ejemplo:El agente visitador o entrevistador recoge informacin de personas o familias en nmero proporcional al de las que cumplen determinadas condiciones en la poblacin, y puede elegirlas a su arbitrio dentro de grupos establecidos por sexo, edad o ciertos niveles socioeconmicos. As, se podra fijar que el 15 % de la muestra ha de constar de mujeres que tengan menos de 40 aos, sean de clase media y habiten en determinado barrio, y esta sera la nica condicin para seleccionar este 15 % de la muestra.

El muestreo por cuotas no es un muestreo probabilstico, y por tanto, no permite llevar a cabo estimaciones rigurosas en las que podamos calibrar el error cometido.

Muestreo incidental. En el muestreo incidental el investigador determina deliberadamente qu individuos formarn parte de la muestra, tratando de recoger a los casos considerados tpicamente representativos de la poblacin. Los criterios de eleccin suelen basarse generalmente en el conocimiento terico sobre el tema de estudio. Pero, en definitiva, a pesar de la posible buena intencin y conocimiento del tema y de la poblacin que tenga el investigador, la muestra no servir para hacer inferencias a toda la poblacin ya que siempre cabe que pueda estar distorsionada por tendencias o preferencias subconscientes o inconscientes del investigador.

Ejemplo:

Para estimar el problema de absentismo escolar, un investigador puede seleccionar los alumnos de un centro situado en una zona de trabajadores agrcolas temporeros que han de desplazarse en determinadas pocas del ao, los alumnos de un centro situado en una barriada marginal de una gran ciudad y los de un centro residencial, dado que por su conocimiento terico del problema sabe que stos representan los diferentes tipos de comportamientos en relacin con la asistencia a clase.

Muestreo accidental. En el muestreo accidental, tambin llamado sin norma, circunstancial o errtico, se seleccionan determinados individuos o grupos de individuos sin que exista ningn criterio aparente. La muestra se toma de cualquier manera, a la aventura, por razones de comodidad o por las circunstancias que rodean al proceso o a capricho. Este tipo de muestreo se considera el ms alejado de la posibilidad de generalizar a la poblacin los resultados obtenidos.

Slo si la poblacin es homognea la representatividad de la muestra puede ser satisfactoria. A veces la uniformidad puede sustituirse por una buena mezcla antes de tomar muestras, como en el caso de los avisos agtese antes de usar, o bien cuando se barajan los naipes o se hacen girar las bolas dentro de un bombo.

Ejemplo:

Estas muestras se emplean a menudo en la vida corriente, por ejemplo, en el comercio cuando se supone que un trozo de tela o un sorbo de vino, representa bien a los artculos completos. Por otra parte, influye en la adopcin de este procedimiento en estas cuestiones de la realidad cotidiana el hecho de que, en caso de equivocacin, las consecuencias no seran demasiado graves.

Una broma final.

El uso de un muestreo no probabilstico podra llevarnos a consecuencias curiosas. Imaginemos un investigador que hace un estudio sobre la respuesta anmica ante la lluvia. Este investigador est de vacaciones en un complejo turstico de Vera, durante una semana de principios de otoo. Sabe que en Almera la probabilidad de que llueva es mnima. Curiosamente, aparecen las nubes y empieza a llover. Decide aprovechar para recoger unas entrevistas de personas de una zona muy seca en la que llueve. Pero como no tena previsto que lloviera, no ha trado paraguas, y pregunta a las personas que estn en el bar social del complejo turstico. Todos se quejan de la lluvia. En Almera no debera llover. Le sorprende la respuesta.... No ha tenido en cuenta que la muestra ha de ser tomada aleatoriamente. Y, los turistas que vienen a Almera esperan que el Sol forme parte del paisaje como el desierto de Tabernas.

INFERENCIA ESTADSTICA.Llamamos inferencia al paso de lo particular a lo general, no en el sentido de la induccin completa utilizada en matemticas, sino tal como se emplea en las ciencias de la naturaleza. Se podra decir que es una afirmacin relativa a poblaciones estadsticas, efectuada a partir de ciertas observaciones con determinada medida de incertidumbre. Podemos considerar como un problema crucial de la Estadstica el de inferir la poblacin o afirmar algo sobre ella a partir de una muestra. Esto equivale a basar conclusiones y/o decisiones en la ignorancia o incertidumbre parciales.

Para que la inferencia sea la ms satisfactoria posible en una situacin determinada se emplean tcnicas estadstico-matemticas, que permiten estimar, por medio de muestras, las caractersticas de una poblacin, sustituyendo las conjeturas ms o menos ingeniosas por procedimientos objetivos cuya representatividad puede medirse.

En conclusin, el problema fundamental que trata de resolver la Inferencia estadstica es obtener de las propiedades de la muestra las de la poblacin en estudio.

DISTRIBUCIN MUESTRAL DE UN ESTADSTICO.

Supongamos que en una poblacin de tamao N hemos atribuido a cada elemento de la poblacin un valor de acuerdo con determinada caracterstica X que hemos medido. Podemos seleccionar una muestra de tamao n y calcular un estadstico, por ejemplo, la media, para los n valores seleccionados. Si volvemos a extraer muestras aleatorias y repetimos la operacin sucesivamente, lograremos reunir un nmero elevado de medias.

Con las medias obtenidas, podemos construir una distribucin de frecuencias para los valores de las medias, . Pues bien, a medida que aumenta el nmero de muestras extradas de tamao n, esa distribucin se aproxima a una distribucin terica que denominaremos distribucin muestral del estadstico media.

Definicin.

DISTRIBUCIN MUESTRAL DE UN ESTADSTICO.

La distribucin muestral de un estadstico se define como la funcin de probabilidad (o funcin de densidad de probabilidad) del estimador de ese estadstico. Es decir, se trata de una funcin que expresa la probabilidad asociada a cada posible valor del estadstico obtenido a partir de una muestra aleatoria de tamao n.

Ejemplo:

Para ilustrar este concepto, construiremos la distribucin muestral del estadstico media, , cuando extraemos muestras aleatorias de tamao 2 en una poblacin constituida por los valores {1, 2, 3}. La muestra estar formada por los valores de las dos variables aleatorias: (resultado de la primera seleccin) y (resultado de la segunda eleccin). A su vez, la media muestral es tambin una variable aleatoria, puesto que se obtiene por combinacin lineal de las dos variables aleatorias y .

Formaremos muestras de tamao 2 recurriendo a dos vas diferentes:

a) Procedimiento emprico.- Seleccionamos al azar una muestra con reposicin de 2 elementos y calculamos su media. Repetimos el proceso hasta un total de 20 veces. Los resultados de este proceso podran ser, por ejemplo:

1122212331

2313231131

1.521.52.5221.5231

1233211331

2332122213

1.52.532.51.51.51.52.522

La distribucin de frecuencias para los valores de la media obtenidos quedara tal y como muestra la siguiente tabla:

110.05

1.570.35

260.30

2.540.20

320.10

As habremos construido una distribucin muestral emprica.

b) Procedimiento terico.- Sin tener que extraer repetidas muestras para calcular la media de los valores que las componen, podemos construir una distribucin muestral terica, valindonos de conceptos probabilsticos. As podemos determinar las 9 muestras aleatorias posibles con reposicin a partir de la poblacin considerada y calcular las respectivas medias.

111222333

123123123

11.521.522.522.53

Teniendo en cuenta las medias de las nueve muestras posibles, todas ellas equiprobables, puedo construir la funcin de probabilidad para la variable aleatoria .

111/9 = 0.11

1.572/9 = 0.22

263/9 = 0.33

2.542/9 = 0.22

321/9 = 0.11

Conociendo esta distribucin muestral terica, se tiene que la probabilidad de obtener el valor para la media de una muestra extrada al azar de la poblacin es , mientras que la probabilidad de obtener el valor es . Es decir, en un 11 % de los casos, la muestra tendr como media 1 y en un 33 % de los casos, el valor de la media de la muestra ser 2.

Como afirmbamos anteriormente, la distribucin muestral emprica de un estadstico se aproxima a la distribucin muestral terica a medida que aumenta el nmero de muestras extradas. Las frecuencias relativas obtenidas empricamente llegan a coincidir con las probabilidades tericas cuando el nmero de muestras crece indefinidamente.

Veamos someramente otro ejemplo.

Supongamos que la poblacin es P = {1, 2, 3, 5} y que representa el tiempo (en horas diarias) que cada uno de un grupo de cuatro estudiantes de la universidad dedican al estudio.

Siguiendo la misma tcnica utilizada en ejemplo anterior tenemos:

a) El conjunto de muestras de tamao 2 de la poblacin P tiene 16 elementos diferentes.

Medias de las muestras de tamao 2.

1235

111.523

21.522.53.5

322.534

533.545

La informacin que da la tabla anterior se puede organizar en una tabla de distribucin de frecuencias del siguiente modo:

Distribucin de medias muestrales (n = 2)

11

1.52

23

2.52

33

3.52

42

51

Hemos construdo la distribucin muestral de medias de tamao 2. Esa distribucin, igual que toda distribucin, tiene grfica de una determinada forma, una media, una desviacin tpica, etc.

b) El conjunto de muestras de tamao 3 de la poblacin P tiene 64 elementos diferentes. Y procediendo de un modo anlogo podemos obtener la siguiente tabla:

Distribucin de medias muestrales (n = 3)

11

4/33

5/36

27

7/39

8/39

310

10/36

11/36

43

13/33

51

As hemos construido la distribucin muestral de medias de tamao 3.

c) Igual podemos hacer la distribucin muestral de medias de tamao 4. En este caso hay 256 muestras diferentes.

Distribucin de medias muestrales (n = 4)

11

5/44

6/410

7/416

223

9/428

10/434

11/432

331

13/424

14/422

15/412

410

17/44

18/44

51

T=256

En resumen, se han construido las tres distribuciones muestrales de medias, asociadas con la poblacin P. Las caractersticas de la poblacin P y de las tres distribuciones muestrales se exponen a continuacin.

TamaoMediaDesviacin Tpica

Poblacin42.751.479016

Distribucin muestral de medias, n = 2162.751.045825

Distribucin muestral de medias, n = 3642.750.853912

Distribucin muestral de medias, n = 42562.750.73509

Distribucin de la poblacin.

Distribucin de las medias de las muestras de tamao 2.

Distribucin de las medias de las muestras de tamao 3.

Distribucin de las medias de las muestras de tamao 4.

Al observar las grficas anteriores se comprueba que la grfica de la poblacin es uniforme y los diagramas de las distribuciones muestrales van aproximndose a la curva normal a medida que el tamao de las muestras se aumenta.

Tambin vemos que las medias de las cuatro distribuciones coinciden, y en cambio, las desviaciones tpicas disminuyen a medida que aumenta el tamao de las muestras.

Veamos como se relacionan la desviacin tpica de la poblacin con la desviacin tpica de la distribucin muestral y con el tamao de las muestras. Obsrvese que:

Los tres productos dan, prcticamente, el mismo resultado que el valor de la desviacin tpica de la poblacin. En realidad, el producto entre la desviacin tpica de la distribucin muestral de las medias y la raz cuadrada del tamao de las muestras es igual a la desviacin tpica de la poblacin (la inexactitud de los resultados anteriores se debe a las aproximaciones tomadas).

Lo trabajado anteriormente nos conduce al enunciado de uno de los resultados ms tiles en estadstica: el conocido como TEOREMA DEL LMITE CENTRAL:

TEOREMA CENTRAL DEL LMITE.

Existen muchos fenmenos que se pueden considerar como una suma de una serie de efectos parciales independientes. Y puede ocurrir que, aunque esos efectos no se ajusten a una normal, el fenmeno resultante tienda a la distribucin normal. Este resultado conocido como Teorema central del lmite, fue enunciado, por primera vez, por Pierre Simon de Laplace (1.749 1.827), y fue Liapunov (1.857 1.917) dio en 1.901 una demostracin rigurosa del teorema.

TEOREMA CENTRAL DEL LMITE.

Consideramos una poblacin cuya medida es ( y cuya desviacin tpica es (. Si de esa poblacin se extraen, al azar, todas las muestras de tamao n, obtenidas con reposicin y con orden, se puede construir una distribucin de medias muestrales, la cual tiene forma aproximadamente normal cuando n es suficientemente grande. Adems, la media y la desviacin tpica de esa distribucin muestral estn relacionadas con la media y la desviacin tpica de la poblacin del siguiente modo.

Tras la lectura del teorema central del lmite, cabe preguntarse: qu entendemos por un n sufucientemente grande?.

Si la poblacin de partida es normal, la distribucin de medias muestrales tambin es normal, cualquiera que sea n. Si la poblacin de partida no es normal, la distribucin de las medias muestrales es normal n es mayor o igual que 30, .DISTRIBUCIN DE LAS MEDIAS MUESTRALES.

Definicin.

DISTRIBUCIN DE LAS MEDIAS MUESTRALES.

Dada una poblacin X. Consideramos todas las muestras posibles de tamao n en la poblacin. Y en cada una de esas muestras se determina su media. La distribucin de todas las medias muestrales se denomina distribucin de las medias muestrales, .

Cuando realizamos un muestreo sin reposicin en una poblacin finita de media ( y desviacin tpica (, la variable aleatoria tiene como media y desviacin tpica:

donde N y n son los tamaos de la poblacin y la muestra, respectivamente.

En la prctica, las poblaciones de las que se extraen las muestras son indefinidamente grandes, o al menos, el tamao de las muestras est por debajo del 5 % del tamao de las poblaciones. En estos casos el muestreo sin reposicin puede considerarse equivalente al muestreo con reposicin.

En los casos de poblaciones finitas con reemplazamiento o infinitas con o sin reemplazamiento se tiene:

Pero por el teorema del lmite central sabemos que la distribucin muestral de las medias se acerca a la distribucin normal cuando aumenta el tamao de la muestra.

Insistimos, cunto ms se aleje la distribucin poblacional del modelo normal, ms debe incrementarse el tamao de la muestra para que la distribucin muestral de la media se aproxime a una curva normal. Por tanto, en la prctica:

a) Si la poblacin es normal no habr ningn problema al afirmar que la distribucin muestral de la media es normal .

b) Si la distribucin poblacional no es normal, se asume que la distribucin muestral de las medias se aproxima a la normal cuando el tamao de la muestra es mayor o igual que 30.

Puesto que presenta una distribucin muestral normal, la variable tipificada se distribuye normalmente N (0 , 1).

Sin embargo, no siempre conocemos el valor del parmetro (. Cuando ( es desconocido, podemos utilizar una estimacin de su valor y calculamos la desviacin tpica de la media muestral (tambin llamado error tpico) por la siguiente formula:

Es decir, nos basamos en la desviacin tpica (sn) de una muestra aleatoria extrada de la poblacin.

Observacin importante:

Cuando podemos aceptar como desviacin tpica de distribucin muestral de medias la desviacin tpica de la muestra.

Ejemplos: Consideremos la poblacin P = {5, 7, 9}. Supongamos que formamos todas las posible muestras de tamao 2 extrables de esta poblacin, sin reposicin:

{5 , 7}, {5 , 9}, {7 , 5}, {7 , 9}, {9 , 5}, {9 , 7}.

En cada una estas medias calculamos la correspondiente media:

{5 , 7}( 6, {5 , 9}( 7, {7 , 5}( 6,

{7 , 9}( 8, {9 , 5}( 7, {9 , 7}( 8.

La distribucin de medias muestrales es:

678Total

Ni2226

Puedes comprobar fcilmente que:

, es igual a .

, es igual a .

Consideremos la poblacin P = {5, 7, 9}. Supongamos que formamos todas las posible muestras de tamao 2 extrables de esta poblacin, con reposicin:

{5 , 5}, {5 , 7}, {5 , 9}, {7 , 5}, {7 , 7}, {7 , 9}, {9 , 5}, {9 , 7}, {9 , 9}.

En cada una estas medias calculamos la correspondiente media:

{5 , 5}( 5, {5 , 7}( 6, {5 , 9}( 7,

{7 , 5}( 6, {7 , 7}( 7, {7 , 9}( 8,

{9 , 5}( 7, {9 , 7}( 8, {9 , 9}( 9.

La distribucin de medias muestrales es:

56789Total

Ni123219

Puedes comprobar fcilmente que:

, que es igual a .

, que es igual a .

DISTRIBUCIN MUESTRAL DE LAS PROPORCIONES.

Definicin.

DISTRIBUCIN DE LAS PROPORCIONES MUESTRALES.Dada una poblacin X. Consideramos todas las muestras posibles de tamao n en la poblacin. Y en cada una de esas muestras se determina proporcin de individuos que poseen una determinada caracterstica. La distribucin de todas las proporciones muestrales (de la caracterstica estudiada) se denomina distribucin de las proporciones muestrales, .

Se puede demostrar que:

Sea p la proporcin de individuos que poseen la caracterstica estudiada y q = 1 p la proporcin de los que no la poseen.

La distribucin muestral de las proporciones, , se distribuye aproximadamente como una distribucin normal , de media p y desviacin tpica , cuando n es suficientemente grande y p no se acerca ni a 0 ni a 1, verificando y , y la poblacin es infinita o finita con reemplazamiento.

No obstante, la extraccin de las muestras de una poblacin de tamao N se puede realizar con reemplazamiento o sin reemplazamiento, verificndose:

a) Si la poblacin es indenidamente grande (infinita) o finita con reemplazamiento tenemos:

b) Si la poblacin es finita y la extraccin se hace sin reemplazamiento, tenemos:

Ejemplo:

- Consideramos la poblacin P = {1, 2, 3}. La proporcin de cifras pares es y de cifras impares es . Las muestras con reemplazamiento de tamao 2 y sus correspondientes proporciones p de cifras pares son:

Muestra1 , 11 , 21 , 32 , 12 , 22 , 33 , 13 , 23 , 3

p00.500.510.500.50

Con todas las proporciones consideradas como valores de una variable estadstica calculamos su media y su desviacin tpica.

ni

04

0.54

11

9

Obtenemos as la distribucin muestral de las proporciones, , de media y desviacin tpica:

Pero tambin podemos obtener la desviacin tpica as:

- Consideramos la poblacin P = {1, 2, 3}. La proporcin de cifras pares es y de cifras impares es . Las muestras sin reemplazamiento de tamao 2 y sus correspondientes proporciones p de cifras pares son:

Muestra1 , 21 , 32 , 12 , 33 , 13 , 2

p0.500.50.500.5

Con todas las proporciones consideradas como valores de una variable estadstica calculamos su media y su desviacin tpica.

ni

02

0.54

6

Obtenemos as la distribucin muestral de las proporciones, , de media y desviacin tpica:

Pero tambin podemos obtener la desviacin tpica as:

ESTIMACIN DE PARMETROS.

Si ( es un parmetro caracterstico de una poblacin, cuyo valor desconocemos, a partir de las muestras extradas de esa poblacin podemos calcular un estadstico , que nos permita estimar el valor del parmetro poblacional. Por ejemplo, sea la media ( de edad de los alumnos universitarios espaoles. El estadstico calculado a partir de muestras de alumnos universitarios puede ser considerado un estimador del parmetro media, (.

En una poblacin, cualquier parmetro ( es nico. En cambio, cada una de las posibles muestras de esa poblacin puede tener diferentes valores del estadstico . El estadstico que tomamos como estimador es por tanto una variable, mientras que el parmetro es una constante. Cada uno de los valores del estimador constituye una estimacin del parmetro. En el ejemplo sobre las edades de los alumnos universitarios, extraemos 5 muestras aleatorias y calculamos la media de edad de cada una de ellas. Las respectivas medias son estimaciones (, puesto que hemos tomado el estadstico como estimador de (.

Pero para que un estadstico sea tomado como estimador de un parmetro poblacional, debemos contar con ciertas garantas de que los valores del estadstico (estimaciones) se aproximan al verdadero valor del parmetro. Una de las condiciones bsicas es que la muestra sea representativa de la poblacin, a lo que contribuye especialmente el que la muestra sea aleatoria.

Recordamos que definimos estimador como un estadstico que permite obtener un valor aproximado para alguna caracterstica de la poblacin. Cada uno de los valores de ese estadstico representan una estimacin. Mientras que el estimador es una variable aleatoria, la estimacin es un valor numrico alcanzado por esa variable aleatoria.

La estimacin de un parmetro se puede hacer mediante estimacin puntual o por estimacin por intervalos. La estimacin puntual consiste en obtener un nico valor del parmetro poblacional a partir de las observaciones muestrales, y se llama as porque se le puede asignar un punto sobre la recta real. Mientras que en la estimacin por intervalo se obtienen dos puntos, que definen un intervalo en la recta real que contendr el valor del parmetro desconocido con cierta seguridad.

ESTIMACIN POR INTERVALOS.

En la estimacin por intervalos atribuimos al parmetro desconocido un segmento de posibles valores entre los que se encuentra, con elevada probabilidad, el valor verdadero del parmetro. Es decir, para estimar el valor del parmetro (, podemos ofrecer un intervalo de puntuaciones dentro del cual se encuentra, con una probabilidad conocida, el valor buscado. Por ejemplo, podramos determinar que con una probabilidad de 0.90, el valor de ( se encuentra dentro del intervalo [a , b].

Cuando realizamos una estimacin por intervalos resulta imprescindible apoyarse en la distribucin muestral de los estadsticos utilizados como estimadores. Por ejemplo el estadstico , estimador de (. Sabemos que si extraemos muestras de una poblacin en la que la media es ( y la varianza , la distribucin muestral de tiene como media ( y como varianza . Si el tamao n de las muestras es suficientemente grande, la distribucin muestral del estadstico tiende al modelo normal .

ERROR MUESTRAL.

Siempre que tomamos una muestra en representacin de toda la poblacin se comete un error. Normalmente existe una diferencia entre los valores obtenidos a partir de la muestra y los correspondientes a la poblacin. Pero cuando hablamos del error muestral no nos referimos al error real que hemos obtenido nosotros, sino a un error determinado estadsticamente, vlido para todas las posibles muestras del mismo tamao.

Sea la media de una muestra de tamao n y sea ( la media poblacional de la poblacin de tamao N. Obteniendo todas las muestras de tamao n y calculando la media de cada una, se obtiene una distribucin normal, llamada distribucin muestral de las medias o distribucin de las medias muestrales .

La curva de Gauss representa la distribucin de todas las medias de tamao n obtenidas en la poblacin. La media de las medias coincide con la media de la poblacin, obtenindose muchas muestras cuyas medias, , son iguales o muy cercanas a ( y muy pocos casos de medias muestrales, alejadas o muy alejadas de la media proporcional (.

Definicin.

ERROR MUESTRAL.

Se define el error muestral o error de muestreo como la desviacin tpica de la distribucin muestral de las medias o de las proporciones.

Recordamos que, para la distribucin de las medias muestrales y para la distribucin de las proporciones muestrales, respectivamente:

Cuando la poblacin es finita y la extraccin es con reemplazamiento, o cuando la poblacin es infinita:

Cuando la poblacin es finita y la extraccin es sin reemplazamiento:

ERROR MXIMO ADMISIBLE.

La distribucin muestral de las medias sigue una ley normal y su representacin grfica es la curva de Gauss. Estadsticamente nunca se puede abarcar toda el rea comprendida entre la curva de Gauss y el eje OX, por ser ste una asntota de la curva, siendo preciso fijar el rea se pretende abarcar. Esta rea, (1-(), recibe el nombre de nivel de confianza porque representa el rea que contendr, probablemente, el valor de la media poblacional (. Se expresa en tanto por ciento.

Definicin.

NIVEL DE CONFIANZA.

Se denomina nivel de confianza o coeficiente de confianza a la probabilidad de que el estimador por intervalo cubra el verdadero valor del parmetro que se pretende estimar. Se expresa por 1 - (.

Estrictamente, establece el porcentaje de muestras (de un tamao dado) en las que el estadstico que deseamos estimar tiene un valor dentro del intervalo estimado. Un nivel de confianza de 90% o del 95% indica que, de toda el rea encerrada por la curva de Gauss y el eje OX, probablemente el 90% o el 95% de las veces contendr a la media poblacional (, desestimando el 10% o el 5%, restante.

Definicin.

NIVEL DE SIGNIFICACIN.

Se denomina nivel de significacin o nivel de riesgo a la diferencia entre la certeza y el nivel de confianza deseado. Por tanto, se expresa por (.

Definicin.

ERROR MXIMO ADMISIBLE.

Se define el error mximo admisible como el valor d que verifica que la probabilidad de que la media muestral y la media poblacional ( difieran en menos de la cantidad d con el nivel de confianza elegido (1 - ():

De lo anterior se deduce:

O lo que es lo mismo:

Si:

Es decir:

para un nivel de confianza del 68.26 %.

para un nivel de confianza del 95.44 %.

para un nivel de confianza del 99.73 %.

En general:

Para una variable tipificada, el valor de k se obtiene as:

(

De donde:

cuyo valor lo podemos obtener en la tabla N(0 , 1) para una valor dado (.

Valores de k, ms usuales, segn el nivel de confianza 1 -

1 - 50 %682 %90 %95 %955 %99 %997 %

K0.6711.651.9622.583

En el caso de las proporciones:

El error mximo admisible d y el error muestral o estn relacionados por el valor k obtenido a partir del nivel de confianza (1 - (). As:

Error mximo admisible para la estimacin de la media poblacional:

(poblacin infinita o finita con reemplazamiento).

(poblacin finita sin reemplazamiento).

Error mximo admisible para la estimacin de la proporcin poblacional:

(poblacin infinita o finita con reemplazamiento).

(poblacin finita sin reemplazamiento).

TAMAO DE LA MUESTRA.

Las encuestas se realizan en una muestra representativa de la poblacin. Su tamao vara de unas encuestas a otras y viene recogido en la llamada ficha tcnica. En dicha ficha tcnica debe aparecer: el tamao de la muestra, el nivel de confianza y el margen de error. El tamao n de la muestra depende del tamao N de la poblacin, del nivel de confianza (1 - () adoptado y del error mximo admisible d.

DISTRIBUCIN DE LAS PROPORCIONES MUESTRALES:

Para una poblacin infinita, o finita con reemplazamiento, a partir de la expresin que relaciona el error mximo admisible o margen de error d y el error muestral se tiene:

Cuando no se conoce la proporcin p, se estima para el caso ms desfavorable, es decir, que tanto p como q sean el 50%.

Para una poblacin finita y muestreo sin reemplazamiento se tiene, a partir de la expresin del error mximo admisible:

DISTRIBUCIN DE LAS MEDIAS MUESTRALES.

Para poblaciones infinitas o poblaciones finitas con reemplazamiento, la expresin que relaciona el error mximo admisible d y el error muestral nos permite obtener el tamao de la muestra:

Si la poblacin es finita y el muestreo es sin reemplazamiento, el tamao sera:

INTERVALO DE CONFIANZA DE LA MEDIA.

En una poblacin cuya distribucin es conocida, pero con algn parmetro desconocido, podemos estimar dicho parmetro a partir de una muestra representativa. Estamos trabajando en el caso de la estimacin de parmetros mediante un intervalo de confianza. En este apartado determinaremos el intervalo de confianza para la media.

El intervalo de confianza [a , b] debe contener a la media poblacional con un nivel de confianza 1-

El valor 1- que indica con qu probabilidad el intervalo [a , b] contiene el valor real del parmetro estimado , se elige previamente, siendo un nmero real comprendido entre 0 y 1. El valor 1- se expresa en porcentaje.

Sea X una variable aleatoria con distribucin y x1, x2, ......, xn, una muestra aleatoria de tamao n. La distribucin muestral de las medias sigue una ley normal y la variable tipificada es una distribucin N(0,1).

Recordemos que si la poblacin no es normal basta con tomar una muestra suficientemente grande.

Grficamente:

Sustituyendo:

o bien:

de donde:

En la prctica no se suelen tomar distintas muestras para calcular el intervalo de confianza, se toma una sola, de ah que .

El intervalo de confianza parte del conocimiento de un estadstico,, obteniendo en una muestra de tamao n y mediante una estimacin se obtiene un intervalo que cuenta con una probabilidad del 95%, del 90%, etc., es decir, (1-)% de contener el parmetro desconocido media poblacional .

CUANDO SE CONOCE LA DESVIACIN TPICA POBLACIONAL.

En este caso, el intervalo de confianza de la media poblacional es:

CUANDO NO SE CONOCE LA DESVIACIN TPICA POBLACIONAL.

En este caso, cuando la muestra est formada por 30 o ms de 30 individuos u observaciones, se puede obtener el intervalo de confianza de la media poblacional a partir de la expresin:

siendo s la desviacin tpica de la muestra.

Observaciones.

Para establecer los intervalos de confianza:

Cuando no se conoce la desviacin tpica de la poblacin, siendo rigurosos se debe usar el parmetro muestral raz cuadrada de la cuasi varianza, , para estimar dicha desviacin tpica poblacional.

Recordamos la expresin de la cuasivarianza: , de donde se tiene: , que sera el valor que debera sustituir a la desviacin tpica poblacional. No obstante, si se puede utilizar la desviacin tpica muestral.

En el caso de que el muestreo no sea con reemplazamiento y la poblacin sea finita, se debe multiplicar el error muestral por el factor , donde N es el tamao de la poblacin y n el tamao de la muestra. As, el intervalo de confianza sera:

INTERVALO DE CONFIANZA DE LA PROPORCIN.

Para estimar la proporcin p de elementos que posee una caracterstica de una poblacin, lo hacemos mediante una muestra de tamao n en donde es la proporcin de elementos que poseen la caracterstica determinada y q = 1 - p la proporcin de elementos que no la poseen.

La distribucin de las proporciones muestrales se distribuye de acuerdo a una normal , lo que permite tipificar la variable que sigue una distribucin N(0,1) y obtener con un nivel de confianza (1-), el intervalo de confianza para el parmetro poblacional p, a partir de la expresin:

o lo que es igual:

de donde:

El error mximo admisible , tiene el grave inconveniente de que est dado en funcin de p. Por tanto, una vez extrada la muestra y obtenida la proporcin muestral p, debemos estimar los valores de p y q, mediante: p = p y q = q.

Cuando n es grande, , (y, adems, y ) para determinar el intervalo de confianza se puede sustituir el parmetro p por de la muestra, resultando:

Ejemplos: Supongamos que deseamos valorar el grado medio de conocimientos en historia de una poblacin de varios miles de estudiantes. Sabemos que la desviacin tpica poblacional es de 2.3 puntos. Nos proponemos estimar la media poblacional, (, pasando una prueba a 100 alumnos, con un nivel de confianza del 95 %. Calculamos la media en la muestra, resultando ser de 6.32. Para hacer esta estimacin vamos a construir el intervalo de confianza de ( con un nivel de confianza del 95 %.

El intervalo de confianza para la media en poblaciones infinitas o finitas con reemplazamiento, caso que suponemos (de varios miles), es:

En nuestro ejemplo:

Como: , tenemos , y as:

De donde, operando, tenemos el intervalo de confianza buscado:

Para estimar la media de los resultados que obtendran al resolver un cierto test los alumnos de 4 % de E.S.O. de toda una comunidad autnoma, se les pasa dicho test a 400 de ellos escogidos al azar. Los resultados obtenidos en dicha muestra dan una media de 3.25 con una desviacin tpica de 1.12. A partir de ellos, pretendemos estimar el valor de la media de la poblacin con un nivel de confianza del 95 %. En este caso se procedera como en el caso anterior, slo que deberemos utilizar el valor de desviacin tpica muestral en lugar de la poblacional, cosa que se puede hacer ya que el tamao de la muestra es superior a 30. En definitiva, el intervalo de confianza para la media poblacional sera:

Y as el intervalo buscado es:

De la duracin de un proceso sabemos que la desviacin tpica poblacional es 0.5 segundos. Cul es el nmero mnimo de medidas que hay que realizar para que, con un nivel de confianza del 99 %, el error de estimacin no exceda de 0. 1 segundos?.

Al nivel de confianza del 99 % (( = 0.01), , corresponde un .

Obtenemos el tamao n de la muestra a partir de la relacin: , de donde: . Es decir, y el tamao de la muestra debe ser 166 medidas (el menor entero mayor que 165.76).

Un monitor de un gimnasio quiere estimar la estatura media de todos los asociados al mismo, con un error menor de 0.5 cm, utilizando una muestra de 30 asociados. Sabiendo que la desviacin tpica ( = 5.3 cm, cul sera el nivel de confianza con el que se realiza la estimacin?.

Como, el error d es: , tenemos: , y de aqu deducimos: . Ahora bien, , que nos permite despejar el coeficiente de significacin: , y al sustituir, . Y finalmente, el nivel de confianza, , sera del 39.7 %.

Tomada una muestra de 300 personas mayores de 15 aos en una gran ciudad, se encontr que 104 de ellas lean el peridico regularmente. Con estos datos queremos hallar, con un nivel de confianza del 90 %, un intervalo de confianza para la proporcin de lectores de peridicos entre los mayores de 15 aos.

Un nivel de confianza del 90 % nos da un , y la proporcin muestral obtenida es . As, el error mximo admisible sera , y con este dato tenemos que el intervalo buscado se obtendr como: , o lo que es lo mismo el intervalo de confianza es: . O sea, con un nivel de confianza del 90 %, la proporcin de lectores de peridicos, en el colectivo total, est entre el 30.2 % y el 39.2 %.

Teniendo en cuenta los resultados del ejemplo anterior, se pretende repetir la experiencia para conseguir una cota de error de 0.01 con el mismo nivel de confianza del 90 %. Cuntos individuos debe tener la muestra?.

De la expresin del error, , podemos despejar el tamao de la muestra: . Es decir, la muestra debe contar con un mnimo de 6132 individuos. Con esta muestra, se volvera a calcular la proporcin muestral de lectores de peridicos p, y con ella se determinara el intervalo de confianza (p- 0.01 , p + 0.01).

CONTRASTE DE HIPTESIS.

El contraste de hiptesis o la prueba de decisin estadstica permite comprobar ciertas afirmaciones que realizamos acerca de una poblacin, referidas a sus parmetros o a la forma en que se distribuye. Mediante este tipo de pruebas podramos decidir acerca del ajuste de las distribuciones observadas a distribuciones tericas, la existencia de diferencias entre grupos, relaciones entre variables, etc.

Definicin.

TEST ESTADSTICO.

Un test estadstico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida sobre el valor de un parmetro desconocido de esa poblacin.

HIPTESIS ESTADSTICAS.

En cualquier estudio sobre la realidad el investigador se plantea interrogantes a los que trata de dar respuesta o temas de inters sobre los que pretende incrementar su conocimiento. En la indagacin sobre esos interrogantes, el investigador formula hiptesis, que son posibles soluciones o respuestas a los problemas planteados. Tales hiptesis permanecern en el terreno de la conjetura hasta tanto no sean comprobadas. La estadstica permite comprobar hiptesis cientficas a partir de los datos recogidos sobre un problema, pero para ello es necesario que tales hiptesis sean formuladas en trminos estadsticos. Es decir, las hiptesis cientficas tienen que ser operativizadas previamente, expresadas en forma de afirmaciones acerca de parmetros. Por tanto, en una prueba de decisin estadstica no contrastamos directamente las hiptesis cientficas, sino que trabajamos con hiptesis estadsticas que son una traduccin de aquellas. Tras comprobar la hiptesis estadstica, podemos inferir que la hiptesis cientfica queda validada.

Las hiptesis estadsticas son proposiciones acerca de parmetros de la poblacin (media, proporciones, varianza, diferencia de medias, etc.) o de su distribucin. Cuando llevamos a cabo una prueba estadstica, estamos trabajando con una hiptesis nula, que simbolizaremos por H0. Junto a esta, consideramos la hiptesis alternativa, opuesta a la anterior, que queda simbolizada por H1.

Veamos en qu consiste cada una de ellas:

Hiptesis nula (H0). Establece una hiptesis que provisionalmente se considera como verdadera.

Hiptesis alternativa (H1). Toda hiptesis nula va acompaada de una hiptesis alternativa, la cual afirma el supuesto contrario de la hiptesis nula.

Puesto que cada una de estas hiptesis afirma lo contrario que la otra es incompatible que ambas sean ciertas. Por tanto, si llegamos a la conclusin de que la hiptesis nula no se cumple, podemos afirmar que se cumple la hiptesis alternativa y viceversa.

CONTRASTE DE HIPTESIS PARA LA MEDIA.

El proceso que se sigue para contrastar un hiptesis respecto a la media, a travs de una muestra es el siguiente:

Establecer la hiptesis nula, H0. En ella supondremos que la media, (, es igual al valor .

Esta hiptesis se denomina hiptesis nula porque parte del supuesto de que es nula la diferencia entre el valor verdadero de la media y su valor hipottico.

Establecer la hiptesis complementaria a la hiptesis nula, que es la hiptesis alternativa:

Definir la ley de probabilidad de la poblacin y de la muestra, que en nuestro caso es la ley de distribucin normal.

Se establece el nivel de confianza, 1 - (, o el correspondiente nivel de significacin, (.

Determinar la zona de aceptacin de H0. Para ello partimos del intervalo de confianza antes visto:

restando a los tres miembros y operando, se obtiene:

Si el valor de la media de la muestra est dentro del intervalo, se acepta la hiptesis nula H0 y en caso contrario se rechaza, admitiendo la hiptesis alternativa H1. La zona de rechazo se denomina regin crtica.

Un contraste de hiptesis no establece la verdad de la hiptesis, sino un criterio de aceptacin de la misma y la decisin se toma a partir de una muestra y con un determinado nivel de significacin.

CONTRASTES BILATERALES Y UNILATERALES.

Las hiptesis nula y la hiptesis alternativa deben ser mutuamente excluyentes y complementarias, y el contraste de hiptesis puede ser bilateral o unilateral.

Cuando la regin crtica se situa a ambos lados de la zona de de aceptacin de la hiptesis nula se denomina contraste bilateral o contraste de dos colas.

HIPTESIS:

Regin de aceptacin:

Regin de rechazo o crtica:

Observacin.

Cuando la desviacin tpica poblacional no sea conocida, y la muestra sea suficientemente grande podremos utilizar la desviacin tpica de la muestra o, en su caso, la indique la hiptesis.

Ejemplo:Se cree que el cociente intelectual medio de los estudiantes de una universidad es 113, con una desviacin tpica de 7. Para contrastar la hiptesis, se extrae una muestra de 180 estudiantes y se obtiene en estos estudiantes un cociente intelectual medio de 115. Podemos aceptar la hiptesis con un nivel de significacin del 5 %?.

Hiptesis nula,

.

Hiptesis alternativa,

.

Como el tamao de la muestra es superior a 30, las medias muestrales se distribuiran (si la hiptesis fuese cierta) segn una ley .

La regin de aceptacin al nivel de confianza del 95 % es

=.

En la muestra hemos obtenido una media de 115, que no pertenece a la regin de aceptacin sino que pertenece a la regin crtica. Por tanto, con un nivel de confianza del 95 % rechazamos la hiptesis nula, y aceptamos la alternativa, es decir, no podemos dar por bueno que el cociente intelectual medio de los alumnos de esa universidad sea de 113.

Cuando la regin crtica se sita en una de las dos colas, se denomina contraste unilateral o contraste de una cola.CONTRASTE UNILATERAL DERECHO. La regin crtica se sita en el lado derecho.

z

HIPTESIS:

Regin de aceptacin:

Regin de rechazo:

Observacin.

Es importante hacer notar que al quedar la regin crtica en una sola cola, determinamos , con la condicin .

CONTRASTE UNILATERAL IZQUIERDO. La regin crtica se sita en el lado izquierdo.

-z

HIPTESIS:

Regin de aceptacin:

Regin de rechazo:

Ejemplo:El peso de los pollos de una granja es una distribucin normal de media 2.6 kg y desviacin tpica 0.5. Se experimenta un nuevo tipo de alimentacin con 50 cras. Cuando se hacen adultos se les pesa y se obtiene una media de 2.78 kg. Vamos a contrastar la hiptesis de que el peso medio de la poblacin no aumenta con un nivel de significacin del 1 %.

Hiptesis nula:

Hiptesis alternativa:

Como el nivel de confianza es del 99 %, , de donde se obtiene que . Y, por tanto, la regin de aceptacin es: , o sea, . Ahora comprobamos que el valor obtenido mediante la muestra queda en la regin crtica, fuera de la regin de aceptacin, y por esto, rechazamos la hiptesis nula y aceptamos la alternativa con un nivel de significacin del 1 %. Es decir, aceptamos que la poblacin aumentar de peso con la nueva alimentacin utilizada en la granja.

CONTRASTE DE HIPTESIS PARA LA PROPORCIN.

CONTRASTE BILATERAL.

HIPTESIS:

Regin de aceptacin:

Regin crtica o de rechazo:

Ejemplo:Un dentista afirma que el 40 % de los nios de diez aos presentan indicios de caries dental. Tomada una muestra de 100 nios, se observ que 30 presentaban indicios de caries. Utilizando la aproximacin normal queremos comprobar, con un nivel de significacin del 5 %, si el resultado proporcionado por la muestra permite rechazar la hiptesis del dentista.

Hiptesis nula:

Hiptesis alternativa:

Un nivel de significacin del 5 % determina que , y tenemos la siguiente regin de aceptacin:

Es decir, si la hiptesis nula fuese cierta, con un nivel de significacin del 5 %, la proporcin de nios con indicios de caries en esa poblacin estara comprendida entre el 30.4 % y el 49.6 %. Comprobamos que la proporcin obtenida en la muestra queda en la regin crtica, y por esto, rechazamos la hiptesis nula y aceptamos la alternativa con ese nivel de significacin. Es decir, rechazamos la hiptesis del dentista, y aceptamos que el porcentaje de nios con indicios de caries es distinto del 40 %.

CONTRASTE UNILATERAL DERECHO.

HIPTESIS:

Regin de aceptacin:

Regin crtica:

Ejemplo:

Segn la ley electoral de cierto pas, para obtener representacin parlamentaria, un partido poltico ha de conseguir ms del 5 % de los votos. Poco antes de celebrarse las elecciones, una encuesta realizada sobre 1000 ciudadanos elegidos al azar revela que slo 65 de ellos votarn al partido V. Puede estimarse, con un nivel de significacin del 1 %, que V no tendr representacin parlamentaria?. Y con un nivel de significacin del 5 %?

Hiptesis nula:

Hiptesis alternativa:

Un nivel de significacin del 5 % determina que , (), y tenemos la siguiente regin de aceptacin:

Es decir, si la hiptesis nula fuese cierta, con un nivel de significacin del 1 %, la proporcin de votantes de V sera inferior al 6.6 %. Comprobamos que la proporcin obtenida en la muestra , es de un 6.5 % y queda en la regin de aceptacin, y por esto, aceptamos la hiptesis nula, y rechazamos la hiptesis alternativa, con ese nivel de significacin. Es decir, aceptamos que el partido tendr menos del 5 % de los votos y por tanto no tendr representacin parlamentaria. Si el test lo hicisemos con un nivel de significacin del 5 %, la regin de aceptacin sera y rechazaramos la hiptesis nula. Y, por tanto, con ese nivel de significacin diramos que si tendra representacin parlamentaria el partido V.

CONTRASTE UNILATERAL IZQUIERDO.

HIPTESIS:

Regin de aceptacin:

Regin crtica:

Ejemplo: En las ltimas votaciones, hace un ao, el 53 % de los votantes de un pueblo estaban a favor del alcalde. Se acaba de realizar una encuesta a 360 personas elegidas al azar y 176 de ellas estaban a favor del alcalde. Se puede afirmar con un nivel de confianza del 90 % que el alcalde no pierde popularidad?

Test de hiptesis para la proporcin (unilateral izquierdo).

Hiptesis nula:

Hiptesis alternativa:

Es decir, la hiptesis nula mantiene que la proporcin de votos favorable al alcalde es la misma de las pasadas elecciones o ha aumentado.

Un nivel de confianza del 90 %, nos da un (, interpolando).

Regin de aceptacin:

Consideramos ahora los resultados de la muestra: un 48.9 % estuvieron a favor del alcalde , y como este resultado cae fuera de la regin de aceptacin rechazamos la hiptesis nula, y aceptamos que el alcalde ha perdido popularidad. No podemos considerar que el alcaldde no la haya perdido.

ERRORES EN EL CONTRASTE DE HIPTESIS.Al aplicar un test estadstico, podemos cometer dos tipos de errores.

ERROR DE TIPO I. Se comete cuando la hiptesis nula es verdadera y, como consecuencia del contraste, se rechaza.

ERROR DE TIPO II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del contraste, se acepta.

Naturalmente, al aplicar el test ignoramos si cometemos error o no lo cometemos. Lo que si podemos hacer es intentar evaluar la probabilidad de cometer error de uno u otro tipo y disear el experimento de modo que dichas probabilidades de error se reduzcan al mximo.

Ejemplo:

Las estaturas de las alumnas de COU eran, en 1990, de media 167 cm y desviacin tpica 7 cm. Emitimos la hiptesis de que las actuales alumnas de 2 de Bachillerato tienen la misma media. Vamos a contrastar la hiptesis mediante una muestra de tamao 60 y con un nivel de significacin del 0.1.

Hiptesis nula:

Hiptesis alternativa:

La regin de aceptacin sera:

Si al extraer la muestra obtenemos una media de 168.72 cm, rechazamos la hiptesis nula. Pero podemos estar equivocados. Es decir, podemos cometer un error de tipo I.

Si al extraer la muestra obtenemos una media de 168.12 cm, aceptamos la hiptesis nula. Si estuviramos equivocados se cometera un error de tipo II.

Cuando se acepta la hiptesis nula H0 decimos que la diferencia existente entre el valor del parmetro formulado por la hiptesis nula y el valor que le correspondera, segn la informacin que proporciona la muestra, es no significativa, mientras que si se rechaza la hiptesis nula H0 para = 5% decimos que existe una diferencia significativa y para = 1% decimos que existe una diferencia muy significativa.

PROBABILIDAD DE COMETER UN ERROR DE UN TIPO U OTRO.

La probabilidad de cometer error de tipo I es precsamente (, el nivel de significacin, pues si la hiptesis es verdadera, nos exponemos a rechazar el ( 100 % de las medias muestrales. Esta probabilidad no depende del tamao de la muestra.

La probabilidad de cometer un error de tipo II depende del verdadero valor de ( y del tamao de la muestra. Si suponemos que se comete un error de tipo II, y si ( es el verdadero valor de la media y (0 el que le atribuimos mediante la hiptesis nula, estos valores son distintos.

En los grficos siguientes la curvas de lnea continua representan la verdadera distribucin de las medias muestrales (media (). Las curvas de lnea discontinua son las supuestas distribuciones (media (0). Sobre ellas se construyen los intervalos de aceptacin. El rea marcada nos da, en cada caso, la proporcin de muestras para las cuales se aceptara la hiptesis nula y, por tanto, se cometera un error de tipo II. Es claro que para muestras grandes esta probabilidad es mucho menor.

n pequeo

n grande

EMBED MSGraph.Chart.8 \s

EMBED MSGraph.Chart.8 \s

EMBED MSGraph.Chart.8 \s

EMBED MSGraph.Chart.8 \s

EMBED CDraw5

EMBED CDraw5

EMBED CDraw5

EMBED CDraw5

EMBED CDraw5

EMBED CDraw5

EMBED CDraw5

143Inferencia estadstica.

_1047147494.unknown

_1051024916.unknown

_1051039283.unknown

_1051043257.unknown

_1051047777.unknown

_1051630437.unknown

_1051631875.unknown

_1051648985.unknown

_1051986952.unknown

_1051991821.unknown

_1051991944.unknown

_1051991218.unknown

_1051991717.unknown

_1051986876.unknown

_1051986940.unknown

_1051648990.unknown

_1051649062.unknown

_1051648760.

_1051648780.

_1051648812.

_1051648773.

_1051647746.unknown

_1051647984.unknown

_1051631968.unknown

_1051630766.unknown

_1051630940.unknown

_1051631838.unknown

_1051630834.unknown

_1051630580.unknown

_1051630704.unknown

_1051630467.unknown

_1051627699.unknown

_1051629460.unknown

_1051630050.unknown

_1051630402.unknown

_1051629864.unknown

_1051629400.unknown

_1051629428.unknown

_1051627722.unknown

_1051627752.unknown

_1051625300.unknown

_1051626382.unknown

_1051627350.unknown

_1051627362.unknown

_1051627687.unknown

_1051627036.unknown

_1051626338.unknown

_1051623161.unknown

_1051624504.unknown

_1051624524.unknown

_1051623257.unknown

_1051623068.unknown

_1051046430.unknown

_1051047030.unknown

_1051047147.unknown

_1051047445.unknown

_1051047083.unknown

_1051046809.unknown

_1051046988.unknown

_1051046743.unknown

_1051046300.unknown

_1051046367.unknown

_1051046390.unknown

_1051046316.unknown

_1051045174.unknown

_1051045246.unknown

_1051043296.unknown

_1051039920.unknown

_1051041389.unknown

_1051042337.unknown

_1051042961.unknown

_1051043106.unknown

_1051042921.unknown

_1051041735.unknown

_1051042271.unknown

_1051041692.unknown

_1051040650.unknown

_1051040790.unknown

_1051041075.unknown

_1051040676.unknown

_1051040362.unknown

_1051040437.unknown

_1051040551.unknown

_1051040333.unknown

_1051039654.unknown

_1051039834.unknown

_1051039883.unknown

_1051039894.unknown

_1051039865.unknown

_1051039795.unknown

_1051039826.unknown

_1051039666.unknown

_1051039675.unknown

_1051039370.unknown

_1051039470.unknown

_1051039508.unknown

_1051039552.unknown

_1051039532.unknown

_1051039491.unknown

_1051039433.unknown

_1051039452.unknown

_1051039417.unknown

_1051039328.unknown

_1051039361.unknown

_1051039307.unknown

_1051029105.unknown

_1051030047.unknown

_1051038796.unknown

_1051039146.unknown

_1051039201.unknown

_1051039230.unknown

_1051039158.unknown

_1051039100.unknown

_1051039122.unknown

_1051039075.unknown

_1051030430.unknown

_1051037876.unknown

_1051038735.unknown

_1051030458.unknown

_1051030193.unknown

_1051029498.unknown

_1051029861.unknown

_1051029919.unknown

_1051029819.unknown

_1051029357.unknown

_1051029425.unknown

_1051029123.unknown

_1051027839.unknown

_1051028520.unknown

_1051028955.unknown

_1051027911.unknown

_1051025690.unknown

_1051027448.unknown

_1051024962.unknown

_1050081751.unknown

_1050432841.unknown

_1051024672.unknown

_1051024751.unknown

_1051024790.unknown

_1051024690.unknown

_1051023182.unknown

_1051023407.unknown

_1051023428.unknown

_1051024413.unknown

_1051023205.unknown

_1050433980.unknown

_1050434068.unknown

_1050435463.unknown

_1051022714.unknown

_1050434016.unknown

_1050433371.unknown

_1050433586.unknown

_1050433785.unknown

_1050433010.unknown

_1050424718.unknown

_1050432225.unknown

_1050432476.unknown

_1050432628.unknown

_1050432364.unknown

_1050425509.unknown

_1050425653.unknown

_1050425412.unknown

_1050343561.unknown

_1050423564.unknown

_1050423579.unknown

_1050346084.unknown

_1050082725.unknown

_1050343506.unknown

_1050081920.unknown

_1050082617.unknown

_1049922527.unknown

_1050075313.unknown

_1050081664.unknown

_1050081722.unknown

_1050075343.unknown

_1049922869.unknown

_1050074370.unknown

_1050074563.unknown

_1050074582.unknown

_1050074723.unknown

_1050074517.unknown

_1050073052.unknown

_1050073677.unknown

_1049922878.unknown

_1049922844.unknown

_1049922857.unknown

_1049922760.unknown

_1047150362.unknown

_1049658550.unknown

_1049658564.unknown

_1047150549.unknown

_1047150821.unknown

_1047148436.unknown

_1047150284.unknown

_1047147662.unknown

_988749144.unknown

_988968131.unknown

_1047068520.unknown

_1047071269.unknown

_1047071412.unknown

_1047070707.unknown

_988969424.unknown

_988996036.unknown

_988999274.unknown

_1047068402.unknown

_988996064.unknown

_988995600.unknown

_988995834.unknown

_988968892.unknown

_988969270.unknown

_988968667.unknown

_988910037.unknown

_988910243.unknown

_988967496.unknown

_988967524.unknown

_988910194.unknown

_988908535.unknown

_988909326.unknown

_988908494.unknown

_966939730.unknown

_966941058.unknown

_966942449.unknown

_966952681.unknown

_988734535.unknown

_988736130.unknown

_988749133.unknown

_988735308.unknown

_988735473.unknown

_988736120.unknown

_988735373.unknown

_988734562.unknown

_988734037.unknown

_966953103.unknown

_966950950.unknown

_966951512.unknown

_966950811.unknown

_966941909.unknown

_966942143.unknown

_966941512.unknown

_966940673.unknown

_966940978.unknown

_966939855.unknown

_966938814.unknown

_966939071.unknown

_966939654.unknown

_966938844.unknown

_966879671.unknown

_966937977.unknown

_965140647.unknown

_965146234.unknown