manual de probabilidad y estadistica

88
Manual Didáctico de Probabilidad y Estadística Tronco Común de Ingeniería de CITEC Valle de las Palmas Centro de Ingeniería y Tecnología Valle de las PalmasUABC, 2009

Upload: cristina-garcia

Post on 25-Sep-2015

53 views

Category:

Documents


2 download

DESCRIPTION

Manual probabilidad y Estadística

TRANSCRIPT

  • Captulo 2: Probabilidad

    1

    Manual Didctico de

    Probabilidad y Estadstica Tronco Comn de Ingeniera de CITEC Valle de las Palmas

    Centro de Ingeniera y Tecnologa Valle de las Palmas UABC, 2009

  • 2

    Manual Didctico de Probabilidad y Estadstica Tronco Comn de Ingeniera de CITEC Valle

    de las Palmas

  • Captulo 2: Probabilidad

    3

    Contenido ............................................................................................................................................. 2

    I. INTRODUCCION ............................................................................................................. 4

    II. DESARROLLO DE UNIDADES ........................................................................................... 5

    1.1. Poblacin y muestra .............................................................................................. 6

    1.2. Inferencia estadstica ............................................................................................. 7

    1.3. Tcnicas de muestreo ............................................................................................ 8

    1.4. Niveles de medicin ..............................................................................................12

    1.5 Distribucin de frecuencias ...........................................................................................14

    1.6 Presentacin grafica de datos. ......................................................................................16

    1.7 Medidas de tendencias controladas para datos agrupados y no agrupados, media,

    mediana y media. ................................................................................................................23

    III. REFERENCIAS ............................................................................................................23

  • 4

    I. INTRODUCCION

    Descripcin del Manual Didctico en donde se resalten las competencias a lograr.

    Acerca del Manual.-

    PROPSITO GENERAL DEL CURSO

    El curso de Probabilidad y Estadstica ubicado en el tronco comn de las ciencias de la

    ingeniera, corresponde al rea de las ciencias bsicas de la ingeniera; y est orientado al

    estudio de los fundamentos matemticos y metodologas de la probabilidad, estadstica

    descriptiva e inferencial; para el estudio y caracterizacin de sistemas y procesos, apoyndose

    en el uso de tecnologa y herramientas computacionales, para el clculo e interpretacin de

    indicadores que sustentan la toma de decisiones y optimizacin de los mismos.

    En esta unidad de aprendizaje se desarrollan habilidades en las tcnicas de muestreo,

    representacin y anlisis de informacin, as como actitudes que favorecen el trabajo en

    equipo; y proporciona las bases fundamentales para incursionar de manera competente en el

    estudio de las metodologas para la optimizacin de sistemas y procesos en las disciplinas de

    ciencias de la ingeniera.

    COMPETENCIA (S) DEL CURSO

    Estimar el comportamiento de sistemas y procesos de ingeniera, mediante la aplicacin de las

    tcnicas y metodologas de estimacin e inferencia estadstica, as como el uso de herramientas

    computacionales, para identificar reas de oportunidad que coadyuven a la solucin de

    problemas del rea de ingeniera, con disposicin al trabajo colaborativo, objetividad,

    honestidad y responsabilidad.

    EVIDENCIA (S) DE DESEMPEO

    Elaboracin, presentacin y exposicin de reportes de actividades orientadas al estudio del

    comportamiento de un sistema o proceso, en el cual especifique la tcnica de muestreo

    seleccionada, as como el desarrollo, metodologa, anlisis e interpretacin de resultados.

  • Captulo 2: Probabilidad

    5

    II. DESARROLLO DE UNIDADES

    Unidad I: Estadstica descriptiva

    Competencia de la Unidad.- Aplicar los conceptos fundamentales y herramientas de la

    estadstica, para calcular los indicadores descriptivos y representacin grfica de un conjunto

    de datos, mediante el uso de tecnologas y herramientas de cmputo, como antecedente al

    estudio de las tcnicas inferenciales, de manera proactiva y responsable.

    Introduccin

    La estadstica descriptiva nace en el siglo XVIII a partir del anlisis de las unidades polticas,

    donde se utilizaba para representar tablas y grficas de datos. Actualmente la estadstica

    descriptiva juega un papel muy importante en la inferencia estadstica, en donde se intenta

    llegar a conclusiones generales a partir de los datos generados en las muestras.

    Algunos de los ejemplos en el campo de la ingeniera son: determinar el promedio de la

    produccin en cada una de las lneas de ensamble, encontrar la temperatura promedio para

    trabajar en condiciones ptimas sin generar mayores costos a la organizacin, entre algunos

    otros.

    Un ingeniero industrial que trabaja en el rea de calidad, debe tomar decisiones a partir de

    inferencias estadsticas en menor o mayor medida y dependiendo del giro de la empresa,

    tamao, entre otras consideraciones. Si a este ingeniero se le pide que establezca los criterios

    de calidad en funcin de las necesidades de los clientes internos y externos, deber hacer uso

    sin lugar a dudas de la estadstica descriptiva para llevar a cabo esta tarea.

    Es importante sealar que si el ingeniero en cuestin no hace una recoleccin de datos

    correcta, el resultado de la inferencia estadstica ser incorrecto y traer repercusiones

    importantes para la organizacin. En la ingeniera y la direccin industrial, la estadstica ha

    tenido un impacto muy importante, debido a los problemas de produccin, al uso eficiente de

    materiales y mano de obra, a la investigacin bsica y el desarrollo de nuevos productos, por lo

    que la estadstica se ha convertido en una herramienta vital para el ingeniero, y que sin estos

    no podra apreciar, entender o aplicar gran parte del trabajo desarrollado en su rea de

    trabajo.

    Caso prctico:

    El gerente de produccin de la Dalmon Carpet Company es responsable de la fabricacin de

    alfombras en ms de 500 telares. Para no tener que medir la produccin diaria (en yardas) de

    cada telar, toma una muestra de 30 telares cada da, con lo que llega a una conclusin respecto

    a la produccin promedio de alfombras de las 500 mquinas.

  • 6

    La tabla que se presenta ms adelante exhibe la produccin de cada uno de los 30 telares de la

    muestra. Estas cantidades son los datos sin procesar a partir de los cuales el director de

    produccin de telares en su desempeo del da anterior.

    Produccin en yardas de 30 telares para alfombra

    16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8

    15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0

    16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3

    Mediante los mtodos introducidos en este captulo, podemos ayudar al director de

    produccin a llegar a la conclusin correcta.

    Ejercicio 1. A partir de los conceptos de poblacin, muestra, variable discreta, variable

    continua, medidas de tendencia central, tabla de frecuencias, sesgo, curtosis, asimetra, grfica

    circular, histograma, ojiva, polgono de frecuencias, Pareto, construye un reporte apoyado de

    Excel y Word para presentarlo al director de produccin.

    1.1. Poblacin y muestra A partir del estudio de los fenmenos econmicos y sociales en pocas pasadas segn IRWIN

    MILLER & JOHN E. FREUND (2004), se emple el trmino de poblacin para describir un

    conjunto de datos. Hoy en da, y en particular en el mbito de la ingeniera se utiliza el trmino

    poblacin para indicar un conjunto de nmeros, medidas u observaciones, y en la mayora de

    los casos, se emplea una muestra de esa poblacin para determinar alguna caracterstica de un

    producto fabricado, con la finalidad de hacer una inferencia a partir de la muestra seleccionada

    de la poblacin.

    Al recoger datos relativos a las caracterstica de un grupo de individuos u objetos, sean alturas

    y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fbrica,

    suele ser imposible nada practico observar todo un grupo, en especial si es muy grande, en

    vez de examinar el grupo entero, llamado poblacin o universo, se examina una pequea parte

    del grupo, llamada muestra.

    Poblacin

    Muestra

  • Captulo 2: Probabilidad

    7

    Una poblacin puede ser finita o infinita. Por ejemplo, la poblacin consiste en todas las

    tuercas producidas por una fbrica un cierto da es finita, mientras que la determinada por

    todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita.

    Si una muestra es representativa de una poblacin, es posible inferir importantes conclusiones

    sobre la poblacin a partir del anlisis de la muestra. La fase de la estadstica que trata con las

    condiciones bajo las cuales tal diferencia es vlida se llama estadstica inductiva o inferencia

    estadstica. Ya que dicha inferencia con es del todo exacta, el lenguaje de las probabilidades

    aparecer a la establecer nuestras conclusiones.

    La parte de la estadstica que solo se ocupa de describir y analizar un grupo dado, sin sacar

    conclusiones sobre un grupo mayor, se llama estadstica descriptiva o deductiva.

    Ejercicios de poblacin y muestra:

    Instrucciones: De los siguientes enunciados diga cul es una poblacin o una muestra.

    1. Seleccionar al azar a 5 estudiantes de un grupo de 50 estudiantes: 2. La produccin total de tela de una fbrica textil: 3. Los alumnos de 2 y 5 semestre del colegio de bachilleres: 4. Un camin repartidor de refrescos: 5. El nmero de llamadas que entran a un conmutador entre las 11:00 y las 13:00 horas: 6. El nmero total de llamadas al da en un conmutador: 7. Preguntar a todo el personal de una fbrica sobre el deseo de implantar el servicio de

    comedor para sus empleados: 8. seleccionar a 25 personas de 1000 en una fbrica para preguntar por la comida que se

    da diariamente: 9. Poco ms de 100 mil turistas ocuparon 80% de los 28 mil cuartos de hotel, con motivo

    del puente de primavera quienes dejaron importantes ganancias a todos los prestadores de servicios, afirmo el secretario de turismo. Suponiendo que esos 22,400 cuartos de hotel son representativos del grupo de vacacionistas, a) Cul es la poblacin?, b) Cul es la muestra?

    10. Al realizar un estudio entre los 9, 000,000 de jvenes entre los 15 y los 19 aos (1995) Al realizar un estudio en 225,000 jvenes del rea metropolitana se encontr que un 95% de ellos desean seguir estudiando la universidad, a) Cul es la poblacin?, b) Cul es la muestra? , c) Variable de inters y parmetro de inters:

    1.2. Inferencia estadstica Estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una

    muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.

  • 8

    Ejercicios Inferencia estadstica:

    1. En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.

    2. En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan ms a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. Explicar qu procedimiento de seleccin sera ms adecuado utilizar: muestreo con o sin reposicin. Por qu?

    3. En cierta cadena de centros comerciales trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 en el departamento de atencin al cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores.

    a. Qu tipo de muestreo deberamos utilizar para la seleccin de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados?

    b. Qu nmero de trabajadores tendramos que seleccionar en cada departamento atendiendo a un criterio de proporcionalidad?

    4. Sea la poblacin de elementos: {22,24, 26}. Calcule la varianza de la poblacin. 5. Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16

    comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios:

    6. 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. 7. Suponiendo que los precios de este producto se distribuyen segn una ley normal de

    varianza 25 y media desconocida: Cul es la distribucin de la media muestral? 8. Las ventas mensuales de una tienda de electrodomsticos se distribuyen segn una ley

    normal, con desviacin tpica 900 . En un estudio estadstico de las ventas realizadas en los ltimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 y 5 839 . Cul ha sido la media de las ventas en estos nueve meses?

    1.3. Tcnicas de muestreo Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no

    aleatorio o de juicio y el muestreo aleatorio o de probabilidad (los elementos de la

    poblacin son escogidos en la muestra). Una muestra seleccionada por muestreo de

    juicio se basa en la experiencia de alguien con la poblacin.

    I. Muestreo probabilstico:

    Se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los

    individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y,

    consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de

    ser seleccionadas. Slo estos mtodos de muestreo probabilsticos nos aseguran la

    representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de

    los mtodos de muestreo probabilsticos encontramos los siguientes tipos:

  • Captulo 2: Probabilidad

    9

    Muestreo aleatorio simple. El procedimiento empleado es el siguiente:

    1) se asigna un nmero a cada individuo de la poblacin.

    2) A travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros

    aleatorios, nmeros aleatorios generadas con una calculadora u ordenador, etc.) se

    eligen tantos sujetos como sea necesario para completar el tamao de muestra

    requerido.

    Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica

    cuando la poblacin que estamos manejando es muy grande.

    Muestreo aleatorio sistemtico

    Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los

    dems hasta completar la muestra.

    Ejemplo:

    Si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra

    de 25 elementos, en primer lugar debemos establecer el intervalo de seleccin que

    ser igual a 100/25 = 4. A continuacin elegimos el elemento de arranque, tomando

    aleatoriamente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes

    elementos de la muestra.

    2, 6, 10, 14,..., 98

    k el resultado de dividir el tamao de la poblacin entre el tamao de la

    muestra: k=

    . El nmero i que empleamos como punto de partida ser un nmero

    al azar entre 1 y k.

    Muestreo aleatorio estratificado

    Trata de obviar las dificultades que presentan los anteriores ya que simplifican los

    procesos y suelen reducir el error muestral para un tamao dado de la muestra.

    Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen

    gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por

    ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo

    que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de

    inters estarn representados adecuadamente en la muestra. Cada estrato funciona

    independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple

    o el estratificado para elegir los elementos concretos que formarn parte de la

    muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige

    un conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades,...).

    Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de

    individuos de cada estrato proporcional al nmero de componentes de cada estrato.

  • 10

    Ejemplo:

    En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20.

    Sabemos que hay 200 trabajadores en la seccin A, 150 en la B, 150 en la C y 100 en la

    D.

    =

    X = 6.6 = 7 trabajadores de A

    =

    X = 5 trabajadores de B

    =

    X = 5 5 trabajadores de C

    =

    X = 3.3 = 3 trabajadores de D

    La distribucin de la muestra en funcin de los diferentes estratos se denomina

    afijacin, y puede ser de diferentes tipos:

    Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales.

    Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato.

    Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la desviacin.

    Muestreo aleatorio por conglomerados. Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la poblacin.

    En el muestreo por conglomerados la unidad muestral es un grupo de elementos

    de la poblacin que forman una unidad, a la que llamamos conglomerado. Las

    unidades hospitalarias, los departamentos universitarios, una caja de determinado

    producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar

    conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los

    conglomerados son reas geogrficas suele hablarse de "muestreo por reas".

    El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto

    nmero de conglomerados (el necesario para alcanzar el tamao muestral

    establecido) y en investigar despus todos los elementos pertenecientes a los

    conglomerados elegidos.

    II. Mtodos de muestreo no probabilsticos

    A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente

    costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven para

    realizar generalizaciones (estimaciones inferenciales sobre la poblacin), pues no se tiene

  • Captulo 2: Probabilidad

    11

    certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la

    poblacin tienen la misma probabilidad de ser elegidos. En general se seleccionan a los

    sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la

    muestra sea representativa.

    En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten resolver los

    problemas de representatividad aun en situaciones de muestreo no probabilstico, por ejemplo

    los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la

    poblacin.

    Entre los mtodos de muestreo no probabilsticos ms utilizados en investigacin encontramos:

    Muestreo por cuotas. Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul.

    En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de

    individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de

    25 a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se

    eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo

    se utiliza mucho en las encuestas de opinin.

    Muestreo intencional o de conveniencia. Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

    Tambin puede ser que el investigador seleccione directa e intencionadamente

    los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar

    como muestra los individuos a los que se tiene fcil acceso (los profesores de

    universidad emplean con mucha frecuencia a sus propios alumnos).

    Bola de nieve. Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

    Muestreo Discrecional. A criterio del investigador los elementos son elegidos sobre lo que l cree que pueden aportar al estudio.

  • 12

    Ejercicios de tcnicas de muestreo:

    1. un colegio tiene 120 alumnos de bachillerato. Se quiere extraer una muestra de 30 alumnos. Explica cmo se obtiene la muestra:

    a) mediante muestreo aleatorio simple. b) mediante muestro aleatorio sistemtico.

    2. Sea la poblacin de elementos: {22,24, 26}. a) Escriba todas las muestras posibles de tamao dos, escogidas mediante

    muestreo aleatorio simple. b) Calcule la varianza de la poblacin.

    3. La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1.60 m?

    4. Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado los siguientes precios: 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y media desconocida: Cul es la distribucin de la media muestral?

    5. La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria que sigue una distribucin normal con varianza 2 = 0,16 m2. construye un intervalo, de un 95% de confianza, para la media de las estaturas de la poblacin.

    6. Las ventas mensuales de una tienda de electrodomsticos se distribuyen segn una ley normal, con desviacin tpica 900 . En un estudio estadstico de las ventas realizadas en los ltimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 y 5 839 . Cul ha sido la media de las ventas en estos nueve meses?

    1.4. Niveles de medicin

    Escala de medicin: se entender por medicin al proceso de asignar el valor a una variable de un elemento en observacin. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razn. Las variables de las escalas nominal y ordinal se denominan categoras, por otra parte las variables de escala de intervalo o de razn se denominan variables numricas. Con los valores de las variables categricas no tiene sentido o no se puede efectuar operaciones aritmticas. Con las variables numricas s.

    Escala nominal: usa nombres para establecer categoras. Puede usar nmeros por estos son de carcter simblico.

  • Captulo 2: Probabilidad

    13

    Ejemplo:

    Nacionalidad

    Uso de antojos

    Numero de camiseta en un equipo de futbol.

    Escala ordinal: tambin define categoras, pero establece una relacin > 0

  • 14

    Ejercicios de niveles de medicin:

    Instrucciones: a qu nivel de medicin se refieren las siguientes variables:

    1. Genero de entrevistado 2. Edad 3. Estado civil 4. Posee vehculo 5. Peridico preferido para leer noticias

    1.5 Distribucin de frecuencias

    Frecuencia: de un valor de una variable estadstica es el nmero de veces que se

    observa dicho valor, o el nmero de casos clasificados en la clase definida por l.

    Para agrupar los datos por su frecuencia

    1) se ordenan los datos en orden creciente

    2) se cuentan la frecuencia absoluta de cada valor.

    TABLA 1

    Demanda Frecuencia absoluta

    59 1 60 2 61 0 62 3 63 1 64 0

    Frecuencia total

    7

    Rango: es la diferencia entre el mayor y el menor de los valores obtenidos. En

    nuestro ejemplo:

    64-59 = 05

    La distribucin de las frecuencias con que se presenta cada uno de los valores de la

    variable puede relacionarse mediante lo que se denomina un diagrama de barras o

    bastones, utilizando una frecuencia cartesiana sobre cuyo eje de abscisas se llevan

    los valores de la variables, mientras que sus correspondientes frecuencias de

    aparicin se llevan sobre el eje de ordenadas.

  • Captulo 2: Probabilidad

    15

    Frecuencia relativa: De un valor observado consiste en el consciente entre la frecuencia con que se presenta dicho valor y total de observaciones.

    f =

    f: frecuencia relativa

    f: frecuencia absoluta correspondiente a cada valor i.

    n: nmero total de observaciones

    n=

    Frecuencias agrupadas: Cuando un conjunto de datos estadsticos corresponde a muchas observaciones de los valores de una variable, el manejo de todos ellos puede resultar engorroso; por eso se ocurre a menudo a agrupar los datos en clases o categoras, cada una de ellas correspondiente a un grupo valores de la variable; se determina entonces la frecuencia con la que se presentan datos incluidos en cada una de las clases y se habla de frecuencia de clase.

    Intervalo de clase: Para las variables cuantitativas, la agrupacin de frecuencias se hace dividiendo el rango de la variable en intervalos consecutivos que se acostumbran tomar de la misma amplitud. Eligiendo para nuestro ejemplo un tamao de clase igual a 3.

    Los valores comprendidos entre: (59-61), (62-64), se conocen con el nombre de

    intervalo de clase, siendo cada par de valores los lmites de clase.

    TABLA 2

    Intervalo de clase Frecuencia absoluta

    59-61 3 62-64 4

    Mtodo general para la distribucin de frecuencias

    1) determine el mayor y el menor entre los datos registrados y as encontrar el rango.

    2) dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao.

    3) determinar el nmero de observaciones que caen dentro de cada intervalo de clase, es decir, encontrar las frecuencias de clase.

  • 16

    Ejercicios de distribucin de frecuencias:

    Instrucciones: Construir la tabla de distribucin de frecuencias para los siguientes

    casos.

    1. Las calificaciones de 50 alumnos en Matemticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7

    1) El nmero de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.

    2) Las puntuaciones obtenidas por un grupo de en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.

    3) Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla:

    Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)

    fi 8 10 16 14 10 5 2

    4) Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Fsica. 3, 35, 30, 37, 27, 31, 41, 20, 16, 26, 45, 37, 9, 41, 28, 21, 31, 35, 10, 26, 11, 34, 36, 12, 22, 17, 33, 43, 19, 48, 38, 25, 36, 32, 38, 28, 30, 36, 39, 40.

    1.6 Presentacin grafica de datos.

    Histograma o histograma de frecuencia. Consiste en un conjunto de rectngulos con:

    a) Bases en el eje x horizontal, centros en las marcas de clase y longitudes iguales

    a los tamaos de los intervalos de clase

    b) reas proporcionales a las frecuencias de clase.

    Si los intervalos de calase tienen todos la misma anchura, las alturas iguales a las

    frecuencias de clase. En caso de contrario, deben ajustarse las alturas.

  • Captulo 2: Probabilidad

    17

    Polgono de frecuencias. Sirve para mostrar la tendencia de la variable, se puede determinar a partir de un histograma uniendo los puntos medios superiores de cada rectngulo del histograma. Tambin, se determina el polgono uniendo los puntos formado por la marca de clase con la frecuencia absoluta del intervalo respectivo.

    Frecuencias relativas. La frecuencia relativa de un clase es su frecuencia dividida por la por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje. Por ejemplo, la frecuencia relativa de la clase 66-68 en la tabla es 42/100 = 42%. La suma de las frecuencias relativas de todas las clases da 1, o sea 100 por 100.

    Si se sustituyen las grficas de la tabla por las correspondientes frecuencias

    relativas, la tabla resultante se llama una distribucin de frecuencias relativas,

    distribucin de porcentajes o tablas de frecuencias relativas.

    La presentacin grafica de distribuciones de frecuencias relativas se puede

    obtener del histograma o polgono de frecuencias sin ms que cambiar la escala

    vertical de frecuencias a frecuencias relativas, manteniendo exactamente el mismo

    diagrama. Los grficos resultante se llaman histogramas de frecuencias relativas (o

    histogramas de porcentajes) y polgonos de frecuencias relativas (o polgonos de

    porcentajes), respectivamente.

  • 18

    TABLA 3

    Altura (in) Nmero de estudiantes

    60-62 5 63-65 18 66-68 42 69-71 27 72-74 8 Total 100

    Ojiva. Es un grfico de lnea que se disea utilizando en el eje horizontal las fronteras superiores de una distribucin de frecuencias. La informacin se obtiene de la columna de frecuencias acumuladas (absoluta o relativa). Las caractersticas son las siguientes:

    En el eje horizontal se colocan las fronteras superiores de cada intervalo

    Todos los puntos tienen la misma distancia en el eje X

    Las lneas permanecen unidas

    El primer extremo termina sobre el eje horizontal

    Los datos son numricos o continuos

    En el cambio de intervalo es posible colocar el valor de la frecuencia

    absoluta o relativa para una mejor comprensin de los datos.

    La forma general de una ojiva es la siguiente:

    Para trazar ojiva calcular la frecuencia acumulada de la distribucin agregndole

    una nueva columna a la derecha, el primer intervalo es el mismo valor de la

  • Captulo 2: Probabilidad

    19

    frecuencia absoluta, a partir del segundo se va acumulando con todos los intervalos

    anteriores.

    Diagrama de Pareto. Constituye uno sencillo y grafico mtodo de anlisis que permite discriminar entre las causas ms importantes de un problema.

    Pasos a seguir para elaboracin de un diagrama de Pareto:

    1) Seleccionar los datos que se van a analizar, as como el periodo de

    tiempos al a que se refieren dichos datos.

    2) Agrupar los datos por categoras, de acuerdo con un criterio de

    terminado.

    3) Tabular los datos comenzando por la categoras que contenga ms

    elementos y siguiendo en orden descendente, calcular:

    Frecuencia absoluta.

    Frecuencia absoluta acumulada.

    Frecuencia relativa unitaria.

    Frecuencia relativa acumulada.

    4) Dibujar el diagrama de Pareto. 5) Representar el grafico de barras

    Correspondiente que, en el eje horizontal, aparecer tambin en orden descendente.

  • 20

    6) Delinear la cuerva acumulativa. Se dibuja un punto que se represente el total de cada categora. Tras la conexin de estos puntos se formara una lnea poligonal.

    7) identificar el diagrama, etiquetndolo con datos como: ttulo, fecha de realizacin.

    8) Analizar el diagrama de Pareto.

    Grfico Circular. Se usan para mostrar el comportamiento de las frecuencias relativas, absolutas o porcentuales de las variables. Dichas frecuencias son representadas por medio de sectores circulares, proporcionales a las frecuencias.

    El ngulo de cada sector mantiene la misma proporcin de 360 que la de la clase

    representada respecto del tamao total de la muestra.

    Ejemplo, si una clase corresponde al 25% del total de la muestra, le corresponder

    un sector del crculo cuyo ngulo sea de 90, exactamente el 25% de 360.

    El grfico siguiente, representa la respuesta de 1886 alumnos de Cuarto al

    preguntrseles por su inters de seguir estudios universitarios.

  • Captulo 2: Probabilidad

    21

    De los 1886 alumnos encuestados, 1768 (93.74%) se interesa por seguir estudios

    universitarios. Los restantes 118 (6.26%), no.Para construir el grfico circular,

    debemos calcular el ngulo central del sector correspondiente a cada respuesta.

    Para el caso de los 1768 Interesados en estudios universitarios su proporcin

    respecto de la muestra total (93.74%) nos permite determinar que su ngulo del

    centro es 337 28' 34.1'' y por lo tanto, el complemento a 360 (22 31' 25.9'')

    representa a los No Interesados. Hecho este clculo, con un transportador se puede

    hacer un grfico equivalente al de la siguiente figura.

    Ejercicios de presentacin grafica de datos.

    1. Hemos preguntado a 20 personas por el nmero medio de das que practican deporte a

    la semana y hemos obtenido las siguientes respuestas:

    N das (xi) frecuencia

    absoluta (ni)

    0 1 1 2 2 4 3 7 4 1 5 1 6 3 7 1

    Total 20

  • 22

    Realiza en tu cuaderno el grafica de barras, el polgono de frecuencias y el diagrama de

    sectores correspondiente, y comprueba en la escena los resultados.

    2. Una encuesta realizada a 40 personas sobre su estado civil, obtuvo los siguientes

    datos:

    Realizar diagrama circular, grafica de barras, histograma de frecuencias, polgono de

    frecuencia.

    3. Concentracin de ozono, uno de los indicadores ms importante de la contaminacin en

    grandes ciudades es la concentracin, medida en ppb, de ozono en la atmsfera. En cierto

    sector de una ciudad se obtuvo informacin sobre ese contaminante, por medio de una

    medicin efectuada diariamente a las 13:00 hrs. Esta se resumi en la siguiente tabla:

    Concentracin de Ozono

    Intervalos Frecuencias Absolutas

    [ 0, 2] 8

    [ 2, 4] 23

    [ 4, 6] 53

    [ 6, 8] 42

    [ 8, 10] 22

    [10, 12] 12

    Compare las frecuencias por medio de un histograma.

    4. Cada de un sistema computacional. Se tiene la informacin de 80 semanas de operacin

    de un terminal de computacin conectado por va telefnica a un computador central,

    donde se registr el nmero de cadas del sistema por semanas. Los datos son los

    siguientes:

    Estado civil F

    Solteros 10

    Casados 20

    Viudos 4

    Divorciados 6

    Total 40

  • Captulo 2: Probabilidad

    23

    1 0 2 0 0 3 2 3 1 0 1 0 2 0 1 0 0 2 1 1 0 1 0 0 0 1 0 2 0 1 0 1 1 1 0 0 0 3 0 3 0 2 0 1 2 1 0 1 1 2 1 0 2 0 1 0 1 1 1 3 0 1 0 0 0 1 0 2 0 1 0 1 1 1 0 0 0 3 0 3

    Tabule los datos y represente la distribucin mediante un grfico circular.

    6. En la tabla se muestra una distribucin de frecuencia de los salarios semanales de 65 empleados de la empresa P&R. Determinar de esa tabla:

    Salarios Nmero de Empleados

    $250.00-$259.99 8

    260.00-269.99 10

    270.00-279.99 16

    280.00-289.99 14

    290.00-299.99 10

    300.00-309.00 5

    310.00-319.99 2

    Total 65

    La marca de clase(o punto medio) de la tercera clase.

    Qu porcentaje de empleados que cobran menos de 280.00 a la semana?

    7. Dada la informacin referente a la ubicacin de personas dentro de cuatro departamentos de una empresa, se pide:

    a) Tabular la informacin.

    b) Realizar grfico circular.

    c) Indique frecuencias relativas porcentuales en cada grupo.

    M A P CC A CC M P P M P CC M A M CC P P M P

    A P A M M A M A P M M A CC A A M P M M P

    Donde A abastecimiento; CC control de calidad; M mantencin; P produccin.

    1.7 Medidas de tendencias controladas para datos agrupados y no agrupados, media, mediana y media.

    Medidas de tendencia central y de dispersin

  • 24

    En todo anlisis y/o interpretacin se pueden utilizar diversas medidas descriptivas que

    representan las propiedades de tendencia central, dispersin y forma para extraer y

    resumir las principales caractersticas de los datos. Si se calculan a partir de una

    muestra de datos, se les denomina; si estadsticos se les calcula a partir de una

    poblacin se les denomina Parmetros.

    Medidas de tendencia central

    La mayor parte de los conjuntos de datos muestran una tendencia a agruparse

    alrededor de un punto "central" y por lo general es posible elegir algn valor que

    describa todo un conjunto de datos. Un valor tpico descriptivo como ese es una

    medida de tendencia central o "posicin". Las medidas de tendencia central a estudiar

    son: media aritmtica, mediana y moda.

    Media aritmtica

    La (tambin denominada media) es la medida de tendencia central que se media

    aritmtica utiliza con mayor frecuencia. Se calcula sumando todas las observaciones de

    un conjunto de datos, dividiendo despus ese total entre el nmero total de elementos

    involucrados.

    La media aritmtica de un conjunto de valores x, x., x se define como el cociente

    entre la suma de los valores y el nmero de ellos. Su smbolo es si la media

    aritmtica es de una muestra y si la media aritmtica es de una poblacin.

    a) Para datos no agrupados:

    =

    =

    b) Para datos agrupados:

    Si los datos estn ordenados en tablas de frecuencia la media aritmtica se obtiene

    como sigue:

    Muestra

    =

  • Captulo 2: Probabilidad

    25

    Poblacin

    Donde:

    x= marca de clase del intervalo i-simo

    f= frecuencia del intervalo i-simo

    n= nmero de datos de la muestra y N es el nmero de datos de la

    poblacin

    m= nmero de intervalos

    Propiedades de la media aritmtica

    Propiedad I: La media aritmtica de una constante es igual a la constante.

    :

    Valores: a a a a a

    = =

    = a

    Por lo tanto =a

    Propiedad 2: La media aritmtica de una variable ms una constante es igual a la media aritmtica de la variable ms la constante.

    =

    =

    =

  • 26

    Propiedad 3: la media aritmtica de una variable por una constante es igual al producto de la constante por la variable.

    =

    = c

    Propiedad 4: media ponderada

    Ventajas y desventajas del uso de la media aritmtica

    Ventajas Desventajas

    Estable muestra a muestra No aplicable a atributos

    Fcil clculo e interpretacin Influyen en su valor los valores extremos

    Ejemplo:

    1) De un grupo de contribuyentes se determin que el promedio de impuestos es

    de $32.200. Determinar en cada uno de los siguientes casos, la nueva media

    aritmtica:

    a) Los impuestos aumentan en un 2 %

    b) A los impuestos se les disminuye la cantidad de $2.300

    c) A cada contribuyente, se le disminuye un 3 % y adems se le condona $2.550

    Solucin:

    a) La nueva media aritmtica es $ 32.844

    b) La nueva media aritmtica es $29.900

    c) La nueva media aritmtica es$ 28.684

  • Captulo 2: Probabilidad

    27

    Mediana

    Es el valor que se encuentra en el centro de una secuencia ordenada de datos. La

    mediana no se ve afectada por observaciones extremas en un conjunto de datos.

    Por ello, cuando se presenta alguna informacin extrema, resulta apropiado utilizar

    la mediana, y no la media, para describir el conjunto de datos. Su smbolo es Me.

    Mediana para datos no agrupados

    Se deben ordenar los datos de forma creciente o decreciente. Para

    muestras con un nmero par de observaciones, la mediana es el dato que

    queda en el centro de dicha ordenacin y para muestras con nmero impar

    de observaciones la mediana es el promedio de los dos datos centrales.

    Ejemplo:

    1) Para muestra con nmero impar de datos: Me= x

    Datos: 4, 7, 5, 6, 3, 2, 7

    Datos ordenados: 2, 3, 4, 5, 6, 7, 7 Me= x

    = x =5

    2) Para muestra con nmero par de datos: Me=

    Datos: 12, 15, 14, 16, 11, 10, 10, 13

    Datos ordenados: 16, 15, 14, 13, 12, 11, 10, 10

    Me=

    =

    =

    = 12,5

    Media para datos agrupados

    Me= = L + (

    )* a

    Donde:

    = primer intervalos cuya frecuencia acumulada supera a n/2

    L = limite real inferior del intervalo de la media.

    N = nmero de datos.

    f - 1 = frecuencia absoluta del intervalo de la media.

    A= amplitud del intervalo.

  • 28

    Ejemplo: Distribucin de frecuencias de la duracin, en horas, de uso continuo de 212

    dispositivos electrnicos iguales, sometidos a un cierto control.

    Duracin f F

    350 399 4 4

    400 449 6 10

    450 499 9 19

    500 549 20 39

    550 599 31 70

    600 649 80 150

    650 699 42 192

    700 749 10 202

    750 799 8 210

    800 849 2 212

    Total 212

    El intervalo donde se encuentra la Mediana es el primer intervalo en el cual:

    F

    En este caso,

    106 < 150

    6to intervalo: =6

    A= 50

    f=70 Me = 599, 5 + (

    ) * 50

    f= 80 Me = 622 horas

    L= 599,5

  • Captulo 2: Probabilidad

    29

    Moda

    Es valor de un conjunto de datos que aparece con mayor frecuencia. Se le obtiene

    fcilmente a partir de un arreglo ordenado. A diferencia de la media aritmtica, la

    moda no se afecta ante la ocurrencia de los valores extremos. Sin embrago, solo se

    utiliza la moda para propsitos descriptivos porque es ms variable, para distintas

    muestras, que las dems medidas de tendencia central. Un conjunto de datos

    puede tener ms de una moda o ninguna. Su smbolo Mo.

    a) Moda para datos no agrupados

    Ejemplos:

    1) Datos: 2, 4, 5, 6, 7, 7, 8, 7, 6 Mo = 7

    2) Datos: 1, 1, 3, 1, 1, 2, 2, 4, 2, 3, 2, 5, 6 Mo = 1 y 2

    3) Datos: 0, 0, 2, 3, 4, 5 Mo = 0

    4) Datos: 0, 1, 2, 3, 4, 5 Mo = no existe

    b) Moda para datos agrupados

    Existe ms de una forma de calcular la moda:

    Caso a) Mo = L + (

    Donde:

    = intervalo de mayor frecuencia absoluta.

    L = limite real inferior del intervalo que contiene a la moda.

    d = diferencia entre la frecuencia absoluta del intervalo de la moda y el

    intervalo anterior: d = f -f = 1

    d = diferencia entre la frecuencia absoluta del intervalo de la moda y el

    intervalo posterior: d = f -f + 1

    a= amplitud del intervalo.

    Caso b) Mo = L + (

    Donde: es el intervalo de mayor frecuencia absoluta.

  • 30

    Ejemplo:

    Duracin f F

    350 399 4 4

    400 449 6 10

    450 499 9 19

    500 549 20 39

    550 599 31 70

    600 649 80 150

    650 699 42 192

    700 749 10 202

    750 799 8 210

    800 849 2 212

    Total 212

    Caso a) en este caso, el intervalo de mayor frecuencia absoluta es el 4to =4

    f = 80 Mo = 499,5 + (

    d = 80 9 = 71

    d= 80- 31 = 49

    L= 499,5 Mo = 529,08 horas

    A = 50

    Caso b)

    = 4

    f + 1 = f = 31

    f - 1 = f = 9

    L= 499,5

    A= 50

    Mo = 499,5 + (

    Mo = 538,25 horas

  • Captulo 2: Probabilidad

    31

    Ejercicios de medidas de tendencias controladas para datos agrupados y no agrupados,

    media, mediana y moda.

    1. Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron

    pesos de 60, 72, 55 y 65 kilos. Hallar el peso medio de los estudiantes.

    2. Hallar la media, mediana y moda de la siguiente serie de nmeros: 3, 5, 2, 6, 5, 9,

    5, 2, 8, 6.

    3. Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9. Calcular: La moda, la mediana y

    la media.

    4. En una industria dos operarios en siete das de trabajo, son capaces de producir,

    por da, y en forma individual la siguiente cantidad de rboles para fresa de 250 mm

    de longitud por 300 mm de dimetro.

    Operario A 105 106 104 102 103 100 101

    Operario B 103 102 107 101 105 102 103

    Determine:

    a) Produccin media de cada operario.

    b) Moda del operario A.

    c) Mediana del operario B.

    5. En tres cursos de un mismo nivel los promedios de las calificaciones fueron y 5,6;

    6,1 y 4,9; si los cursos tenan respectivamente 34; 30 y 36 alumnos, determine la

    calificacin promedio de los tres cursos.

    6. Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9, 1.

    Calcular: La moda, la mediana y la media.

    7. De un total de datos, 20 son 4, 40 son 5, 30 son 6 y el resto 7.

    Hallar la media y la moda.

    8. Las notas de un estudiante en sus certmenes han sido 84, 91, 72, 68, 87 y 78.

    Hallar la media, la mediana y la moda.

  • 32

    1.8 Medidas de dispersin, rango, varianza y desviacin estndar.

    Rango: Es la diferencia entre el mayo y el menor de los datos de una distribucin estadstica.

    R= Xmax X min

    Ejemplo: (4, 6, 9, 3, 7)

    El menor valor es 3

    El mayor es 9

    Entonces el rango es 9-3 R=6

    Ejercicios de rango

    Instrucciones: Calcule el rango de los siguientes listado de nmeros.

    1. 12, 2, 23, 23, 23, 12 ,123 , 12, 24

    2. 12.4 , 12, 1.5, 45, 32, 23.4, 23

    3. 2, 1, 34, 3, 44, 54, 44, 32, 234 ,23 ,23 ,434 ,32 ,34, 34

    4. 3, 45, 54,45,4534,534,543,4534,3453,3455,676,756,5

    5. 4545,5422,345,556,34,656,345,346,342,9067,5675

    6. 12.3, 234.3, 34, 344.34, 344.5

    Varianza: Es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica.

    La varianza se representa por .

  • Captulo 2: Probabilidad

    33

    PASOS PARA CALCULAR A VARIANZA.

    1. Decide que formula utilizar. Si bien ambas frmulas son correctas, la

    frmula de acceso directo es generalmente ms fcil de usar ya que

    requiere menos clculos.

    s=

    ( -

    2. calcula la suma de x. Suma todos los valores de x.

    3. calcula la suma de los cuadrantes de x. Encuentra el cuadrante de cada

    x y agrega estos valores.

    4. Sustituye los valores en la ecuacin (N= nmero de punto de datos) y

    resuelve la ecuacin. # interpreta los resultados. Por desgracia, debido a

    que la unidad resultante se eleva al cuadrado, hace que cualquier

    interpretacin no tenga sentido. Por lo general, la variacin entre los dos

    conjuntos de datos se comparan y el numero menos indica una menor

    variacin dentro de ese conjunto de datos.

    Ejercicios de varianza.

    Instrucciones: Calcule la varianza de los siguientes datos:

    1) 9, 3, 8, 8, 9, 8, 9, 18

    2)

    xi fi (xi fi) xi2 fi

    (10, 20) 15 1 15 225

    (20, 30) 25 8 200 5000

    (30,40) 35 10 350 12 250

    (40, 50) 45 9 405 18 225

    (50, 60 55 8 440 24 200

    (60,70) 65 4 260 16 900

    (70, 80) 75 2 150 11 250

    3) 12, 6, 7, 3, 15, 10, 18, 5.

    4) 2, 3, 6, 8, 11.

    5) 12, 6, 7, 3, 15, 10, 18, 5.

  • 34

    Desviacin estndar:

    =

    Ejercicios de desviacin estndar.

    Instrucciones: Calcule la DSTD de los siguientes datos.

    1) 9, 3, 8, 8, 9, 8, 9, 18

    2)

    xi fi (xi fi) xi2 fi

    (10, 20) 15 1 15 225

    (20, 30) 25 8 200 5000

    (30,40) 35 10 350 12 250

    (40, 50) 45 9 405 18 225

    (50, 60 55 8 440 24 200

    (60,70) 65 4 260 16 900

    (70, 80) 75 2 150 11 250

    3) 12, 6, 7, 3, 15, 10, 18, 5.

    4) 2, 3, 6, 8, 11.

    5) 12, 6, 7, 3, 15, 10, 18, 5.

  • Captulo 2: Probabilidad

    35

    1.9 Sesgo y Curtosis

    Sesgo:

    Error que aparece en dicho resultado de alguna investigacin, esto puede deberse a

    los factores que dependen de la recoleccin de datos que nos podran conducir a

    conclusiones que pueden ser verdaderas o falsas de lo podramos llamar la

    realidad.

    Curtosis:

    Este tipo de medida determina el grado de concentracin que presentan los valores

    en la regin central de la distribucin. Por medio de esta podremos saber si existe

    una gran concentracin de valores que podramos llamar: Leptocurtica, o una

    concentracin normal de los datos que se le podra llamar: Mesocurtica y en el

    ltimo caso una baja concentracin o aglomeracin de datos que le llamamos:

    Platicurtica.

  • 36

    Unidad 2: Probabilidad

    2.1 funcin e importancia de la probabilidad

    La importancia de la probabilidad radica en que, mediante este recurso matemtico,

    es posible ajustar de la manera ms exacta posible los imponderables debidos al azar

    en los ms variados campos tanto de la ciencia como de la vida cotidiana.

    En efecto, la probabilidad es una estrategia mediante la cual se intenta estimar la

    frecuencia con la que se obtiene un cierto resultado en el marco de una experiencia en

    la que se conocen todos los resultados posibles. As, el ejemplo ms tradicional

    consiste en definir cul es la prevalencia de obtener un nmero al arrojar un dado.

    Sobre seis resultados posibles (todas las caras), slo es posible lograr un nmero por

    cada vez que el dado es arrojado. En este caso, la probabilidad puede expresarse como

    uno en seis, un sexto, la sexta parte o, en trminos matemticos precisos, 0.16 16

    2.2 clasificacin de la probabilidad

    Probabilidad Clsica o a Priori

    Si un suceso puede ocurrir de N maneras mutuamente excluyentes e igualmente

    probables, y m de ellas poseen una caracterstica A

    Ejemplo 1: P(de que salgan dos caras al tirar 2 monedas)

    P(de que salga una cara al tirar 2 monedas )

    Ejemplo 2: P(de que salga un varn al tomar 2 bebs y observar su sexo)

  • Captulo 2: Probabilidad

    37

    Ejercicios.

    1. Supn que un cdigo "cohffkugjbnsta" de tres letras distintas seguidas de tres dgitos distintos. Calcula la probabilidad de que el cdigo

    2. Se saca al azar una carta de una baraja corriente de 52 cartas. Encuentra la probabilidad de que la carta sea:

    3. Calcula la probabilidad de que al tirar una moneda corriente 4 veces se obtenga: a) Que las 4 sean iguales

    b) Que tengan ms caras que sellos

    c) Exactamente 2 caras y no seguidas

    d) Slo sea 1 sello

    4. Una pareja de recin casados planea tener 3 hijos, encuentra la probabilidad de los siguientes eventos

    a)Al menos 2 varones b)Exactamente 1 varn

    Probabilidad subjetiva

    Se basan en las creencias e ideas en que se realiza la evaluacin de las probabilidades y

    se define como en aquella que un evento asigna el individuo basndose en la evidencia

    disponible (el individuo asigna la probabilidad en base a su experiencia).

    La probabilidad subjetiva puede tener forma de frecuencia relativa de ocurrencia

    anterior o simplemente puede consistir en una conjetura inteligente N.

    Para clarificar lo antes dicho un ejemplo muy comn es el pronstico del tiempo,

    muchos individuos como nosotros realizamos una prediccin personal de cmo sern

    las condiciones climticas para el da, basadas mas en nuestra experiencia personal

    pero que muchas veces sustentamos en experiencia de eventos pasados.

    La asignacin de probabilidad subjetiva se dan generalmente cuando los eventos

    ocurren solo 1 vez y a lo mximo unas cuantas veces ms.

    a)Comience con vocal b)Termine en nmero par

    c)Contenga la letra B d)Tenga slo vocales y dgitos impares

    a)Jota b)Figura

    c)Negra d)Figura roja

  • 38

    2.3 EVENTOS Y EL ESPACIO MUESTRAL

    Se obtienen datos al observar ya sea eventos no controlados en la naturaleza o situaciones

    controladas en un laboratorio. Usamos el trmino experimento para describir cualquiera de los

    dos mtodos de recoleccin de datos.

    Definicin: Un experimento es el proceso mediante el cual se obtiene una observacin (o

    medicin).

    La observacin o medicin generada por un experimento puede o no producir un valor

    numrico. A continuacin veamos algunos ejemplos de experimentos:

    Registrar la calificacin de un examen

    Medir la cantidad de lluvia diaria

    Entrevistar a un dueo de casa para obtener su opinin sobre un reglamento para

    distribuir por zonas un rea verde.

    Probar una tarjeta de circuito impreso para determinar si es un producto defectuoso o

    aceptable.

    Lanzar al aire una moneda y observar el lado que aparece. Cuando se realiza un experimento, lo que observamos es un resultado llamado evento simple, con

    frecuencia denotado por la mayscula E con un subndice.

    Definicin: Un evento simple es el resultado que se observa en una sola repeticin del

    experimento. Experimento: Lance un dado y observe el nmero que aparece en la

    cara superior. Haga una lista de los eventos sencillos del experimento. Solucin Cuando el dado se lanza una vez, hay seis posibles resultados. Hay los eventos sencillos

    citados a continuacin:

    Evento E1: observar un 1 Evento E2: observar un 2 Evento E3: observar un 3

    Evento E4: observar un 4 Evento E5: observar un 5 Evento E6: observar un 6.

    Ahora podemos definir un evento como un conjunto de eventos sencillos, a menudo denotado

    por una letra mayscula.

    Definicin: Un evento es un conjunto de eventos sencillos.

  • Captulo 2: Probabilidad

    39

    Podemos definir los eventos A y B para el experimento de lanzar al aire un dado: A: observar un

    nmero imparB: observar un nmero menor a 4

    Como el evento A se presenta si la cara superior es 1, 3 o 5, es un conjunto de tres eventos

    sencillos y escribimos A {E1, E3, E5}. Del mismo modo, el evento B ocurre si la cara superior es

    1, 2 o 3 y est definido como una serie o conjunto de estos tres eventos sencillos: B {E1, E2,

    E3}.

    A veces, cuando ocurre un evento, significa que no puede ocurrir otro.

    Definicin: Dos eventos son mutuamente excluyentes si, cuando ocurre un evento, los otros

    no pueden ocurrir y viceversa.

    En el experimento de lanzar al aire un dado, los eventos A y B no son mutuamente excluyentes,

    porque tienen dos resultados en comn, si el nmero de la cara superior del dado es 1 o 3.

    Ambos eventos, A y B, ocurrirn si se observa E1 o E3 cuando se realiza el experimento. En

    contraste, los seis eventos simples E1, E2, . . . , E6 forman un conjunto de todos los resultados

    mutuamente excluyentes del experimento. Cuando el experimento se realiza una vez, puede

    ocurrir uno y slo uno de estos eventos sencillos.

    Definicin: El conjunto de todos los eventos sencillos se denomina espacio muestral, S.

    OPERACIN SOBRE EVENTOS:

    Unin: se representa con el smbolo U

    La unin entre dos conjuntos A y B, de define como los elementos que estn en A, o estn en B,

    se representa por (AUB)

    Interseccin: se representa con el smbolo

    Se define como los elementos que estn en A y en B (AB)

    Complemento

    El complemento de un evento A se define como todos los elementos de que no estn en A.

    se representa como Ac , A-

  • 40

    Diferencia:

    La diferencia entre 2 conjuntos A y B, define como los elementos de A que no estn en B, se

    representa como A-B, A\B

    Ejemplo

    = {1,2,3,4,5,6,7,8,9}

    A={1,2,3,9,8} B={2,5,4,6,7}

    Hallar: i) AUB ii) AB

    i) AUB={1,2,3,4,5,6,7,8,9} =

    ii) AB= {2}

    TIPOS DE EVENTOS :

    Eventos mutuamente excluyente (M.E): los cuales A y B son M.E sino tienen puntos mustrales

    en comn.

    Eventos independientes: los eventos A y B son independientes si la ocurrencia de a no afecta la

    ocurrencia de B

    Ejemplos

    1.P(AUB)= P(A) + P(B) - P(AB)

    A: aprobar matemtica

    B: aprobar estadstica

    2.P(A)=0.3 P(B)= 0.4 P(AB)= 0.125

    a) cul es la probabilidad de aprobar al menos una de las dos materias ?

    b) Cul es la probabilidad de aprobar exactamente una materia ?

    c) cul es la probabilidad de reprobar las dos materias?

    Resp a) P(AUB)= P(A) + P(B) - P(AB)

    = 0.3 + 0.4 -0.125

    = 0.57

  • Captulo 2: Probabilidad

    41

    Resp b) P(aprobar exactamente una materia)

    = P(AUB) - P(AB)

    = 0.57 - 0.125

    =0.44

    Resp c) P(AUB)c = 1 P(AUB)

    = 1 0.57

    = 0.43

    Problemas

    1. Las proporciones de fenotipos sanguneos A, B, AB y O en la poblacin de todos los de

    raza caucsica en Estados Unidos se publican como .41, .10, .04 y .45,

    respectivamente.1 Si al azar se escoge una persona de este origen tnico en la

    poblacin, cul es la probabilidad de que l o ella tengan tipo de sangre A o tipo AB?

    2. Un plato contiene un dulce amarillo y dos rojos. Usted cierra los ojos, del plato escoge

    dos dulces, uno por uno y anota sus colores. Cul es la probabilidad de que ambos

    dulces sean rojos?

    3. Tiro de un dado Un experimento consiste en tirar un solo dado. stos son algunos

    eventos:

    A: observar un 2B: observar un nmero parC: observar un nmero mayor a 2 D: observar

    A y BE: observar A o B o ambosF: observar A y C

    3. Haga una lista de eventos sencillos del espacio muestral.

    4. Haga una lista de eventos sencillos en cada uno de los eventos A al F.

    5. Qu probabilidades debe asignar a los eventos sencillos?

    6. Calcule las probabilidades de los seis eventos A al F sumando las probabilidades

    apropiadas de evento simple.

    4. Tiros libres Una jugadora de baloncesto acierta en 70% de sus tiros

    Cuando ella lanza un par de tiros libres, los cuatro eventos sencillos posibles y tres de sus

    probabilidades asociadas se dan en la tabla:

  • 42

    2.4 TECNICAS DE CONTEO.

    El principio fundamental en el proceso de contar ofrece un mtodo general para contar el

    nmero de posibles arreglos de objetos dentro de un solo conjunto o entre varios conjuntos.

    Las tcnicas de conteo son aquellas que son usadas para enumerar eventos difciles de

    cuantificar.

    Para facilitar el conteo examinaremos las siguientes tcnicas.

    PRINCIPIO DE LA MULTIPLICACION.

    FORMULA.- N1 x N2 x ..........x Nr maneras o formas

    Problema.

    1) Se dispone de 3 vas para viajar de C1 a C2 y de 4 vas para viajar de C2 a C1. De cuntas

    formas se puede organizar el viaje de ida y vuelta de C1 a C2.

    Respuesta: (3) (4)=12

    PRINCIPIO ADITIVO.

    FORMULA.- M+N+.W maneras o formas.

    Problema

    2) Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que puede

    seleccionar de entre las marcas Whirlpool, Easy y General Electric, cuando acude a hacer la

    compra se encuentra que la lavadora de la marca W se presenta en dos tipos de carga ( 8 u 11

    kilogramos), en cuatro colores diferentes y puede ser automtica o semiautomtica, mientras

    que la lavadora de la marca E, se presenta en tres tipos de carga (8, 11 o 15 kilogramos), en dos

    colores diferentes y puede ser automtica o semiautomtica y la lavadora de la marca GE, se

    presenta en solo un tipo de carga, que es de 11 kilogramos, dos colores diferentes y solo hay

    semiautomtica. Cuntas maneras tiene esta persona de comprar una lavadora?

  • Captulo 2: Probabilidad

    43

    RESPUESTA:

    M = Nmero de maneras de seleccionar una lavadora Whirlpool

    N = Nmero de maneras de seleccionar una lavadora de la marca Easy

    W = Nmero de maneras de seleccionar una lavadora de la marca General Electric

    M = 2 x 4 x 2 = 16 maneras

    N = 3 x 2 x 2 = 12 maneras

    W = 1 x 2 x 1 = 2 maneras

    M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora

    PRINCIPIO DE LA SUMA O ADICION.

    FORMULA.- m+n maneras

    Problema.

    3) Una pareja que se tiene que casar, junta dinero para el enganche de su casa, en el

    fraccionamiento lomas de la presa le ofrecen un modelo econmico un condominio, en el

    fraccionamiento Playas le ofrecen un modelo econmico como modelos un residencial, un

    californiano y un provenzal. Cuntas alternativas diferentes de vivienda le ofrecen a la pareja?

    PRESA PLAYAS

    Econmico Residencial

    Condominio Californiano

    Provenzal

  • 44

    RESPUESTA:

    m=2 n=3

    2+3= 5 maneras

    PRINCIPIO DE PERMUTACION.

    FORMULA.- nPr = n!/(n-r)!

    Donde:

    n= nmero total de objetos

    r= nmero de objetos seleccionados

    != factorial, producto de los nmeros naturales entre 1 y n.

    Problema.

    4) Como se puede designar los cuatro primeros lugares de un concurso, donde existen 15

    participantes?

    RESPUESTA:

    n P r = n! (n - r)! = 15! = 15*14*13*12 *11*10*9*8*7*6*5*4*3*2*1 (15-4)!

    11*10*9*8*7*6*5*4*3*2*1 = 32760

    PRINCIPIO DE COMBINACION.

    FORMULA.- nCr = n!

    Problema.

    5) En una compaa se quiere establecer un cdigo de colores para identificar cada una de las

    42 partes de un producto. Se quiere marcar con 3 colores de un total de 7 cada una de las

    partes, de tal suerte que cada una tenga una combinacin de 3 colores diferentes. Ser

    adecuado este cdigo de colores para identificar las 42 partes del producto?

  • Captulo 2: Probabilidad

    45

    RESPUESTA:

    n C r = n! = 7! = 7! = 35

    PROBLEMAS DE TECNICAS DE CONTEO:

    1. De cuntas maneras se pueden acomodar en un estante 5 libros diferentes si se

    toman todos a la vez?

    2. De un grupo de 11 edecanes se deben seleccionar a cuatro para que asistan a una

    exposicin. Determinar el nmero de selecciones distintas que se pueden hacer.

    3. Un vendedor tiene una cartera de 15 empresas. Cuntas recorridos distintas puede

    realizar para visitar a seis de estos clientes en un da determinado?

    4. Un asesor financiero cuenta con ocho opciones para invertir y ofrece a sus clientes

    carteras con cinco de estas opciones. Cuntas carteras diferentes puede ofrecer?

    5. Una caja contiene ocho dulces de menta y cuatro de fresa

    De cuantas maneras distintas se pueden tomar al azar cinco de estos dulces sin diferenciar el

    color?

  • 46

    2.5 AXIOMAS

    Los axiomas de probabilidad son las condiciones mnimas que deben verificarse para que una

    funcin definida sobre un conjunto de sucesos determine consistentemente sus

    probabilidades.

    Primer axioma:

    La probabilidad de que ocurra un evento A cualquiera se encuentra entre cero y uno.

    0 p(A) 1

    Ejemplo: La probabilidad de sacar par en un dado equilibrado es 0,5. P(A)=0,5

    Segundo Axioma:

    La probabilidad de que ocurra el espacio muestral d debe de ser 1.

    p(d) = 1

    Ejemplo: La probabilidad de sacar un nmero del 1 al 6 en un dado equilibrado es "1".

    Tercer Axioma:

    Si A y B son eventos mutuamente excluyentes, entonces la,

    p(AB) = p(A) + p(B)

  • Captulo 2: Probabilidad

    47

    Ejemplo: La probabilidad de sacar en un dado "as" o sacar "nmero par" es la suma de las

    probabilidades individuales de dichos sucesos.

    Segn este axioma se puede calcular la probabilidad de un suceso compuesto de varias

    alternativas mutuamente excluyentes sumando las probabilidades de sus componentes.

    Generalizando:

    Si se tienen n eventos mutuamente excluyentes o exclusivos A1, A2, A3,.....An, entonces;

    p(A1A2.........An) = p(A1) + p(A2) + .......+ p(An)

    Ejemplo:

    Para el experimento aleatorio de tirar un dado, el espacio muestral es W = {1, 2, 3, 4, 5, 6}. En

    este espacio el conjunto de sucesos es P(W) = {, {1}, {2}, ...{1,2}, {1,3}, ...{1,2,3,4,5,6}}. Para

    establecer una probabilidad hay que asignar un nmero a todos esos sucesos.

    Sin embargo si se ha asignado a los sucesos elementales p({1})= p({2})= ...= p({6})= 1/6, por la

    propiedad ii), p.e. la probabilidad del suceso {1, 3} es p({1,3})= p({1})+ p({3})=2/6.

    Nota: El suceso {1} es: "el resultado de tirar el dado es la cara 1", el suceso {1, 3} es: "el

    resultado de tirar el dado es la cara 1, o la 3", el suceso {1, 3, 5} es: "el resultado de tirar el

    dado es una cara impar".

    TEOREMAS

    TEOREMA 1. Si f es un evento nulo o vaco, entonces la probabilidad de que ocurra f debe ser

    cero.

    p(f)=0

  • 48

    Ejemplo: La probabilidad de que un estudiante sea mujer es "1 menos la probabilidad de que

    no sea varn".

    DEMOSTRACIN:

    Si sumamos a un evento A cualquiera, como f y A son dos eventos mutuamente excluyentes,

    entonces p(Af)=p(A) +p(f)=p(A). LQQD

    TEOREMA 2. La probabilidad del complemento de A, Ac debe ser,

    p(Ac)= 1 p(A).

    DEMOSTRACIN:

    Si el espacio muestral d, se divide en dos eventos mutuamente exclusivos, A y Ac luego d=AAc,

    por tanto p(d)=p(A) + p(Ac) y como en el axioma dos se afirma que p(d)=1, por tanto, p(Ac)= 1 -

    p(A) .LQQD

    TEOREMA 3. Si un evento A B, entonces la p(A) p(B).

    DEMOSTRACIN:

    Si separamos el evento B en dos eventos mutuamente excluyentes, A y B \ A (B menos A), por

    tanto, B=A(B \ A) y p(B)=p(A) +p(B \ A), luego entonces si p(B \ A)0 entonces se cumple que

    p(A)p(B). LQQD

    TEOREMA 4. La p( A \ B )= p(A) p(AB)

    DEMOSTRACIN: Si A y B son dos eventos cualquiera, entonces el evento A se puede separar

    en dos eventos mutuamente excluyentes, (A \ B) y AB, por tanto, A=(A \ B)(AB), luego

    p(A)=p(A \ B) + p(AB), entonces, p(A \ B) = p(A) p(AB). LQQD

  • Captulo 2: Probabilidad

    49

    TEOREMA 5. Para dos eventos A y B, p(AB)=p(A) + p(B) p(AB).

    DEMOSTRACIN:

    Si AB = (A \ B) B, donde (A \ B) y B son eventos mutuamente excluyentes, por lo que p(A B)

    = p(A \ B) + p(B) y del teorema anterior tomamos que p(A \ B) = p(A) p(AB), por tanto,

    p(AB) = p(A) + p(B) p(AB). LQQD

    PROBLEMAS:

    1) Sea.

    Calcule:

    1 2 3

    4

    5 6 7

    2) Una urna tiene ocho bolas rojas, 5 amarillas y siete verdes. Si se extrae una bola al azar

    calcular la probabilidad de:

    1) Sea roja.

    2) Sea verde.

    3) Sea amarilla.

    4) No sea roja.

    5) No sea amarilla.

  • 50

    2.6 PROBABILIDAD CONDICIONAL E INDEPENDENCIA

    CONDICIONAL.- Si A y B son dos eventos, se define la probabilidad de A dado B como la

    probabilidad de que ocurra el evento A cuando el evento B ya ocurri o se tiene la certeza de

    que ocurrir, y se calcula como

    P ( A B ) = P ( B )

    P ( A B ) ; P ( B ) 0

    De la misma manera, se define la probabilidad de B dado A como la probabilidad de que ocurra

    el evento B cuando el evento A y ocurri o se tiene la certeza que de ocurrir. Esta probabilidad

    se calcula como

    P ( B A ) = P ( A )

    P ( A B ) ; P ( A ) 0

    Independiente: Dos eventos A y B son independientes si la probabilidad de A dado B es igual a

    la probabilidad de A, y tambin la probabilidad de B dado A es igual a la probabilidad de B, es

    decir, si la ocurrencia o no ocurrencia de un evento no modifica en nada la probabilidad de

    ocurrencia de otro. Esto es, A y B son independientes si:

    P ( A B ) = P ( A ) y tambin P ( B A ) = P ( B )

    Ejemplo resuelto:

    En una familia con dos hijos, se desea calcular las siguientes probabilidades:

    A) La probabilidad de que los dos hijos sean varones.

    B) La probabilidad de que si uno de los hijos es varn, los dos lo sean.

    RESOLUCIN: Para poder resolver el problema es necesario empezar por definir algunos

    eventos. Sean A: el evento de que los dos hijos sean varones, y B: el evento de que al menos

    uno de los hijos sea varn.

    a) Si observamos en el espacio muestral

    S = { (h, h), (h, m), (m, h), (m, m) }

    Y consideramos que todos los eventos simples son igualmente probables, es claro que

    P ( A ) = 1 / 4 = 0.25 y P ( B ) = 3 / 4 = 0.75

  • Captulo 2: Probabilidad

    51

    b) Se desea calcular P ( A B ).

    Utilizando la definicin de probabilidad condicional se obtiene

    P ( A B ) = 1/3

    PROBLEMAS:

    Se lanzan dos dados balanceados y se definen los eventos

    A: el resultado del lanzamiento del primer dado es par.

    B: el resultado del lanzamiento del segundo dado es 4.

    C: el resultado del lanzamiento del primer dado es 3.

    Calcular:

    a) P ( A || B ) f) P ( B )

    b) P ( B || C ) g) P ( C )

    c) P ( A || C )

    d) P ( C || A )

    e) P ( A )

    2.7 TEOREMA DE BAYES.

    Aplicando en el numerador la Regla de Multiplicacin P(Ai i) P(B|Ai) y en el

    denominador el Teorema de Probabilidad Total P(B) = P(A1) P(B | A1) + P(A2) P(B | A2) + . . . +

    P(An) P(B | An), obtenemos la ecuacin que representa al:

    EJEMPLO:

    Una fbrica que produce material para la construccin tiene 3 mquinas, a las que se les

    denomina A, B y C. La mquina A produce tabique, la B adoqun y la C losetas. La mquina A

    produce el 50% de la produccin total de la fbrica, la B el 30% y la C el 20%. Los porcentajes de

    artculos defectuosos producidos por las mquinas son, respectivamente, 3%, 4% y 5%. Si se

    selecciona un artculo al azar y se observa que es defectuoso, encontrar la probabilidad de que

    sea un tabique.

  • 52

    Solucin:

    Definamos el evento D como sea un artculo defectuoso. De acuerdo a esto tenemos que:

    P(A) = 0.5 P(D | A) = 0.03

    P(B) = 0.3 P(D | B) = 0.04

    P(C) = 0.2 P(D | C) = 0.05

    Si el artculo del que deseamos calcular la probabilidad es un tabique, significa que es

    producido por la mquina A. Tambin observamos que en la solucin solamente participan los

    artculos defectuosos, ya que se pone por condicin esta caracterstica. Por lo tanto:

    PROBLEMAS :

    1) A un congreso asisten 100 personas, de las cuales 65 son hombres y 35 son mujeres. Se

    sabe que el 10% de los hombres y el 6% de las mujeres son especialistas en

    computacin. Si se selecciona al azar a un especialista en computacin Cul es la

    probabilidad de que sea mujer?

    2) El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas.

    El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas

    tambin, mientras que los no ingenieros y los no economistas solamente el 20% ocupa

    un puesto directivo. Cul es la probabilidad de que un empleado directivo elegido al

    azar sea ingeniero?

  • Captulo 2: Probabilidad

    53

    3) La probabilidad de que haya un accidente en una fbrica que dispone de alarma es 0.1.

    La probabilidad de que suene esta s se ha producido algn incidente es de 0.97 y la

    probabilidad de que suene si no ha sucedido ningn incidente es 0.02.En el supuesto

    de que haya funcionado la alarma, cul es la probabilidad de que no haya habido

    ningn incidente?

    4) Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1 negra y C con

    2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos una bola. Si la bola ha

    sido roja, cul es la probabilidad de haber sido extrada de la urna A?

    5) En una clase hay 40 alumnos entre chicos y chicas, cuya cantidad puedes variar. Se

    escoge una comisin de tres personas. Calcular

    Probabilidad de que la formen dos hombres y una mujer.

    Probabilidad de que la segunda persona elegida sea mujer

    Probabilidad de obtener hombre, mujer y hombre, en este orden.

    Si la segunda persona elegida ha sido una mujer, cual es la probabilidad de que

    la primera fuera un hombre.

  • Captulo 3: Distribuciones de probabilidad

    1

    Captulo 3: Distribuciones de probabilidad

  • 2

    Captulo 3: Distribuciones de probabilidad

    Distribucin de probabilidad normal

    Ahora se calcular el valor (z) para una media poblacional , una desviacin estndar

    poblacional y una x determinada.

    Ejemplo

    Los ingresos semanales de supervisores de turno en la industria del vidrio tienen una

    distribucin normal con media $1000 (dlares) y una desviacin estndar $100. Cul es el

    valor z correspondiente al ingreso de un supervisor que gana $1100 a la semana? Y para un

    supervisor que tiene un ingreso semanal de $900?

    Solucin

    Utilizando la frmula (7.1), los valores z para los dos valores indicados de x ($1100 y $900) son:

    El valor de z= 1.00 indica que el ingreso semanal de $1100 se encuentra a una desviacin

    estndar sobre la media; una z = -1.00 indica que el ingreso de $900 se encuentra a una

    desviacin estndar por debajo de la media. Observe que ambos ingresos ($1100 y $900) estn

    a la misma distancia ($100) de la media.

    reas bajo la curva normal

    Antes de examinar diversos usos de la distribucin de probabilidad normal estndar, se

    consideraran tres reas bajo la curva normal que sern muy utilizadas en los siguientes

    captulos. En el captulo 4 estas reas tambin se conocen como la Regla Emprica.

    1. Aproximadamente 68% del rea bajo la curva normal est entre la media ms una y

    menos una desviacin estndar y se expresa 1.

    2. Alrededor de 95% del rea bajo la curva normal est entre la media ms dos y

    menos dos desviaciones estndar, lo que se expresa 2.

    Para X = $1100:

    = 1.00

    Para X = $900

    = -1.00

  • Captulo 3: Distribuciones de probabilidad

    3

    3. Prcticamente toda el rea bajo la curva normal est entre la media y tres

    desviaciones estndar (a uno y otro lados del centro), es decir 3.

    En trminos de porcentajes, lo anterior se indica grficamente as:

    Transformar las mediciones a valores z(o desviaciones normales estndar) modifica las escalas.

    Las conversiones se muestran en el siguiente diagrama. Por ejemplo, +1 se convierte en el

    valor z de +1.00. De manera semejante, -2 se transforma en el valor z de -2.00. Observe que

    el centro de la distribucin z es cero, lo que indica que no hay desviacin respecto a la media .

  • 4

    Ejemplo

    Una prueba del tiempo de vida de bateras alcalinas tipo D, revelo que su tiempo medio de vida

    es 19.0 horas (h). La distribucin de los tiempos de vida se aproxima a una distribucin normal.

    La desviacin estndar de la distribucin es 1.2 h.

    1. Entre qu par de valores falla alrededor de 68% de las bateras?

    2. Entre qu par de valores falla aproximadamente 95% de las bateras?

    3. Entre qu par de valores fallan prcticamente todas las bateras?

    Solucin

    Para responder a estas preguntas se pueden usar los resultados de la Regla Emprica.

    1. Aproximadamente 68% de las bateras falla entre 17.8 h y 20.2 h, valores obtenidos de

    19.0 1(1.2)h.

    2. Alrededor de 95% de las bateras falla entre 16.6 h y 21.4 h, que se obtiene de 19.0

    2(1.2)h.

    3. Prcticamente todas las bateras fallan entre 15.4 h y 22.6 h, que se obtiene de 19.0

    3(1.2)h.

  • Captulo 3: Distribuciones de probabilidad

    5

    Esta informacin se resume en el siguiente diagrama:

    Auto examen 7.2

    La distribucin de los ingresos anuales de un grupo de empleados a nivel gerencia media, en la

    empresa Compton Plastics, sigue aproximadamente una distribucin normal con media $37200

    (dlares) y desviacin estndar $800.

    a) Entre qu par de cantidades esta aproximadamente 68% de los ingresos?

    b) Entre cules dos valores se encuentra aproximadamente 95% de los ingresos?

    c) Entre qu par de valores estn prcticamente todos los ingresos?

    d) Cules son la mediana y la moda de los ingresos?

    e) Es simetra de la distribucin de los ingresos?

  • 6

    Ejemplo

    Refirase a la informacin sobre los ingresos semanales de los supervisores de turno en la

    industria del vidrio. Los ingresos semanales siguen una distribucin normal con media $1000 y

    desviacin estndar $100. Cul es la probabilidad de elegir a un supervisor de turno en la

    industria del vidrio cuyo ingreso:

    1. Est entre $790 y $1000?

    2. Sea inferior a $790?

    Solucin

    Primero se calcula el valor de (z) que corresponde a un salario semanal de $790. De la frmula

    7.1 se tiene que:

    Consulte el apndice D. Bajando por el margen izquierdo se encuentra el rengln

    correspondiente a 2.1 y recorriendo ese rengln se llega a la columna cuyo encabezado es 0.00.

    El valor es 0.4821. Sin embargo, como la distribucin normal es simtrica, el rea entre 0 y una

    z negativa es igual a la que existe entre 0 y z. La probabilidad de encontrar a un supervisor que

    gane entre $790 y $1000 es de 0.4821.

    z 0 0,01 0,02

    2,0 0,4772 0,4778 0,4783

    2,1 0,4821 0,4826 0,483

    2,2 0,4861 0,4864 0,4868

    2,3 0,4893 0,4896 0,4898

    Ejercicios

    1. Una poblacin tiene media 20.0 y desviacin estndar 4.0

    a) Calcule el valor z correspondiente a 25.0

    b) Qu proporcin de la poblacin est entre 20.0 y 25.0?

    c) Qu proporcin de la poblacin es menor que 18.0?

  • Captulo 3: Distribuciones de probabilidad

    7

    2. Una poblacin normal tiene media 12.2 y desviacin estndar 2.5

    a) Calcule el valor (z) correspondiente a 14.3

    b) Qu proporcin de la poblacin est entre 12.2 y 14.3?

    c) Qu proporcin de la poblacin es menor que 10.0?

    3. Un estudio reciente de los sueldos por hora del personal de mantenimiento en aerolneas

    importantes mostr que el salario medio por hora era $16.50 (dlares), con una desviacin

    estndar de $3.50. Si se selecciona al azar un elemento de la tripulacin, Cul es la

    probabilidad de que gane:

    a) Entre $16.50 y $20.0 por hora?

    b) ms de $20.00 por hora?

    c) menos de $15.00 por hora?

    4. La media de una distribucin normal es 400 libras (lb.). La desviacin estndar es 10 lb.

    a) Cul es el rea entre 415 lb y la media de 400 lb?

    b) Cul es el rea entre la media y 395 lb?

    c) Cul es la probabilidad de seleccionar un valor al azar y encontrar que tiene un valor

    inferior a 395 lb?

    Una segunda aplicacin de la distribucin normal estndar es la combinacin de dos reas o

    probabilidades, una est a la derecha y la otra a la izquierda de la media.

    Ejemplo

    Volviendo a la distribucin de ingresos semanales de los supervisores de turno de la industria

    de vidrio. Los ingresos semanales siguen una distribucin normal con media $1000 (dlares),

    desviacin estndar $100, Cul es el rea bajo la curva normal entre $840 y $1200 dlares?

    Solucin

    El problema se divide en dos partes. Para el rea entre $840 y la media $1000:

  • 8

    Para el rea entre la media de $1000 y $1200:

    El rea bajo la curva para obtener un valor z de -1.60 es 0.4452 (tomada del apndice D). El

    rea bajo la curva para z = 2.00, es 0.4772. Al sumar ambas reas se tiene:

    0.4452+0.4772=0.9224. De esta forma, la probabilidad de seleccionar un ingreso entre $840 y

    $1200 es 0.9224. En otras palabras, 92.24% de los supervisores tiene un ingreso semanal entre

    $840 y $1200. Mostrado en un diagrama:

  • UNIDAD 4

  • Man

    ual

    Did

    cti

    co d

    e P

    rob

    abili

    dad

    y E

    stad

    sti

    ca

    1

    Capitulo 4: teora de estimacin

    4.1 Estimacin para una variable

    4.2 Distribuciones de Muestreo

    4.2.2 Distribucin t-student

    4.2.3 Distribucin ji-cuadrada

    4.2.4 Distribucin Fisher

    4.3 Estimacin por intervalos de confianza para una poblacin

    4.3.1 Media

    4.3.2 Proporcin

    4.3.3 Varianza

    4.4 Estimacin por intervalos de confianza para dos poblaciones

    4.4.1 Diferencia de medias

    4.4.2 Diferencia de proporciones

    4.4.3 Razn de varianzas

  • Man

    ual

    Did

    cti

    co d

    e P

    rob

    abili

    dad

    y E

    stad

    sti

    ca

    2

    4.5 Estimacin para dos variables

    Diagrama de dispersin

    El diagrama de dispersin nos apoyar de manera visual para definir el tipo de relacin

    involucrada en las variables de estudio. Para poder construirlo, primero localizamos los

    valores de la variable independiente X sobre el eje horizontal y los de la variable

    dependiente Y, sobre el eje vertical. Cada par, lo representaremos en el grfico mediante

    un punto en el plano (X,Y).

    Ejemplo: Supongamos que queremos encontrar la relacin que tienen los promedios de

    calificacin obtenidos en la preparatoria con los obtenidos a nivel Universitario. Los datos

    van del 0 al 10, este como calificacin mxima. Denotamos con X el promedio obtenido

    en nivel preparatoria y Y el promedio obtenido en la Universidad. Podramos pensar que

    si a un estudiante le va bien en la preparatoria, tambin le ir bien en la universidad.

    Veamos si esto tiene o no relacin. Elaboramos un grfico de dispersin, tenemos los

    siguientes datos:

    Como mencionamos, cada punto en el plano del diagrama de dispersin viene dado por

    (X,Y), por lo tanto, el primer punto de nuestro diagrama viene dado por el par: (3,5),

    segundo punto: (2,4), tercer punto: (4,4), y as sucesivamente hasta llegar al dcimo y

    ltimo punto en este ejemplo que sera (5,6).

    Regresin lineal y coeficiente de regresin

    La regresin lineal nos ayuda a estudiar la relacin existente entre variables. Este estudio,

    nos permite realizar dos diferentes conclusiones. La primera, conocer si la relacin entre

    dichas variables tiene o no, algn significado. Y la segunda es de predecir el

    comportamiento de una variable dependiente (Y) con valores de una variable

  • Man

    ual

    Did

    cti

    co d

    e P

    rob

    abili

    dad

    y E

    stad

    sti

    ca

    3

    independiente (X), por ejemplo, si nos interesa saber o predecir la calificacin final de

    cierto estudiante conociendo sus calificaciones anteriores, o bien, la talla de cierta

    persona conociendo su estatura.

    Esta relacin entre variables puede representarse grficamente mediante una lnea recta.

    Para poder obtener los datos que nos ayudarn a concluir y graficar dichas variables es

    necesaria una ecuacin de regresin lineal. La ecuacin la obtenemos con apoyo de los

    datos obtenidos en una muestra. Uno de los mtodos ms comunes y sencillos de utilizar,

    para obtener dicha ecuacin, es el mtodo de mnimos cuadrados.

    El mtodo de mnimos cuadrados nos ayudar a que la recta de la ecuacin elegida sea

    tal, que la suma de los cuadrados de las distancias verticales entre los puntos y la lnea

    recta sea la ms pequea posible.

    Entonces, una recta de regresin simple toma la forma: Donde:

    a = La interseccin con el eje Y, es decir, es el punto donde la recta y el eje de las Y se

    encuentran.

    b = La pendiente de la recta, es decir, el cambio en la variable dependiente Y por cada

    cambio de la variable independiente X.

    Para poder obtener la ecuacin de regresin lineal simple tenemos que calcular los

    valores para a y b con las siguientes frmulas:

    Donde:

    Y = El promedio o media de la variable dependiente Y.

    X = El promedio o media de la variable independiente X.

    n = El nmero total de observaciones que contiene la muestra.

    X = Variable independiente.

    Y = Variable dependiente.

    Veamos el ejercicio 1: Supongamos que queremos predecir la calificacin de los

    estudiantes de universidad conociendo los promedios de calificacin de la preparatoria

    (en la escala de 0 10 puntos). Para esto, recopilamos informacin de 10 estudiantes.

    Queremos llegar a la ecuacin de regresin lineal simple:

  • Man

    ual

    Did

    cti

    co d

    e P

    rob

    abili

    dad

    y E

    stad

    sti

    ca

    4

    Los valores que integran la muestra se muestran en la tabla.

    Observando las frmulas comienzo a calcular los valores que se me estn pidiendo.

    Vamos a calcular, primeramente, el valor de b. A la tabla anterior, que contiene los

    datos de la muestra, le agrego dos nuevas columnas las cuales tendrn el cuadrado de

    cada valor de X y la multiplicacin de ambas variables (XY).

    Al finalizar con estas operaciones, realizo las sumatorias de los datos de cada columna

    obteniendo los siguientes resultados:

  • Man

    ual

    Did

    cti

    co d

    e P

    rob

    abili

    dad

    y E

    stad

    sti

    ca

    5

    Calculamos los promedios de las variables X y Y:

    Despejamos valores en las frmulas y obtenemos:

    Y = 6.5

    X = 6.3

    n = 10

    XY =452

    2X =465