libro estadistica coor1

221
Estadística 1 CAPITULO 1 DEFINICIONES GENERALES Se ha definido la Estadística como la rama de las matemáticas que trata de los datos: su compilación, análisis e interpretación. Una definición más moderna, declara que la Estadística es la ciencia de la toma de decisiones frente al azar e incertidumbre cuando la información es imperfecta y no bien comportada. La estadística es una ciencia que sirve para la recopilación organización, y análisis de datos; puede decirse además que es la rama de las matemáticas que se encarga de enseñar las reglas para colectar, presentar y analizar los datos al repetir varias veces un experimento. En la actualidad, la estadística ha llegado a ser un instrumento de uso cotidiano para todos los profesionistas que están en contacto con fenómenos de naturaleza aleatoria, y que a partir del conocimiento de ciertos datos cuantitativos del fenómeno y que deben tomar decisiones sobre su comportamiento general. Entre otras de las aplicaciones que se tienen de la estadística, se pueden citar las siguientes: Presentar en forma ordenada y resumida la información registrada en una encuesta, entrevista, cuestionario, etc. Pronosticar el comportamiento futuro del mercado de la madera aserrada en México. Establecimiento de los sistemas de control de calidad, en cualquiera de los renglones de la economía nacional. Pronosticar el consumo de la energía eléctrica para el año 2050, tomando como base el crecimiento poblacional.

Upload: seba-oj

Post on 28-Jun-2015

207 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Libro estadistica coor1

Estadística

1

CAPITULO 1

DEFINICIONES GENERALES Se ha definido la Estadística como la rama de las matemáticas que trata de los datos: su compilación, análisis e interpretación. Una definición más moderna, declara que la Estadística es la ciencia de la toma de decisiones frente al azar e incertidumbre cuando la información es imperfecta y no bien comportada. La estadística es una ciencia que sirve para la recopilación organización, y análisis de datos; puede decirse además que es la rama de las matemáticas que se encarga de enseñar las reglas para colectar, presentar y analizar los datos al repetir varias veces un experimento. En la actualidad, la estadística ha llegado a ser un instrumento de uso cotidiano para todos los profesionistas que están en contacto con fenómenos de naturaleza aleatoria, y que a partir del conocimiento de ciertos datos cuantitativos del fenómeno y que deben tomar decisiones sobre su comportamiento general. Entre otras de las aplicaciones que se tienen de la estadística, se pueden citar las siguientes: • Presentar en forma ordenada y resumida la información registrada en una

encuesta, entrevista, cuestionario, etc. • Pronosticar el comportamiento futuro del mercado de la madera aserrada

en México. • Establecimiento de los sistemas de control de calidad, en cualquiera de

los renglones de la economía nacional. • Pronosticar el consumo de la energía eléctrica para el año 2050, tomando

como base el crecimiento poblacional.

Page 2: Libro estadistica coor1

Estadística

2

• Establecer relaciones de comportamiento del recurso forestal maderable de una región específica y a partir de ésta información, generar políticas de explotación, en función de uso de recurso.

Para su estudio, la Estadística se divide en: 1.1. ESTADISTICA DESCRIPTIVA Y ESTADISTICA INFERENCIAL. La Estadística Descriptiva se encarga de la recopilación, organización, resumen y presentación de los datos numéricos obtenidos de la observación de un fenómeno, no trata de sacar conclusiones a partir de los datos obtenidos del fenómeno o de la población en estudio (es una fotografía del experimento bajo las condiciones y tiempo que se dan en le momento del análisis). La Estadística Inferencial tiene por objeto, obtener conclusiones probables sobre el comportamiento general del fenómeno, a partir de algunas observaciones particulares del mismo; implica además el análisis pleno de los datos para poder inferir sobre los mismos, así como dar respuesta al ¿ qué pasa si ? . Elementos Básicos en un Problema Estadístico El objetivo de la Estadística es hacer inferencias (predicciones, decisiones) a cerca de una población, sobre la base de información contenida en la muestra. PUNTOS BÁSICOS DE UN PROBLEMA ESTADÍSTICO 1. Definición clara del objetivo del experimento y de la población a analizar. 2. El diseño del experimento o procedimiento de muestreo. 3. La recolección y análisis de datos

Page 3: Libro estadistica coor1

Estadística

3

4. Procedimiento (s) para hacer referencias acerca de la población, basado en la

información muestral. 5. La Provisión de una medida de bondad (confiabilidad) para la inferencia. Es muy importante en un estudio estadístico seguir la secuencia presentada, esto garantiza la realización de un análisis eficiente y eficaz. Inicialmente será tratada la Estadística Descriptiva en éste apartado, dejando para trabajos posteriores el caso de la Estadística Inferencial. Para iniciar un estudio de Estadística Descriptiva, es necesario el conocimiento de los conceptos básicos citados a continuación: Recopilación: es un proceso que implica la captación de datos de un experimento estadístico que permite explicar el comportamiento de un fenómeno determinado. Experimento: se le denomina experimento, a cualquier proceso de observación, cuando éste se realiza varias veces y es posible obtener un grupo de resultados llamados datos u observaciones. Así mismo es expresado como todo proceso capaz de generar información. Población (N): está dada como un conjunto de objetos llamados comúnmente elementos, que tienen en común una o varias características particulares que se desean estudiar esta puede ser finita o infinita. Muestra (n): es definida como un subconjunto de la población. Si la misma es seleccionada y obtenida adecuadamente se tiene que el subconjunto de elementos de la población (o muestra) representan todas las características de los objetos más que a los objetos mismos. De lo anterior se tiene que una población podrá definirse como el conjunto

Page 4: Libro estadistica coor1

Estadística

4

de árboles que se encuentra en la Región de la Meseta Tarasca, la totalidad de vehículos que circulan en la Ciudad de Morelia, Mich., la totalidad de torres de distribución de energía eléctrica instaladas en el Municipio de Morelia, la totalidad de población que habita en la Ciudad de Uruapan; la totalidad de empresas del Estado de Michoacán, por ejemplo, para el primer caso citado, la característica específica del estudio podría ser la determinación de las características tecnológicas de las especies forestales maderables existentes en la región, para su uso como elementos estructurales en la construcción; para el caso una muestra estaría dada como un pequeño número de árboles seleccionados al azar, a los que se les hacen diferentes pruebas, para conocer sus características tecnológicas. La selección de la muestra es una etapa muy importante dentro del estudio estadístico, debido a que la información que presenta la muestra es la base para hacer suposiciones o inferencias sobre lo que ocurre en la población. Si en el caso de la población de los árboles, citado anteriormente, se hubieran seleccionado 5 árboles con edades pequeñas con respecto al estándar de la población, posiblemente los resultados obtenidos en o referente a resistencia mecánica a la flexión sean bajos y la recomendación sería no utilizar éstas especies como elementos estructurales, cuando en realidad lo que sucede es que la muestra tomada no es representativa de la población en estudio, y tal vez lo más seguro es que la recomendación final sería aplicar las especies de la región Meseta Tarasca como elementos estructurales. Lo anterior implica que el muestreo que se siguió no fue el adecuado y, en consecuencia, la muestra no sería representativa de la población, así como una recomendación final no adecuada. Para que una muestra sea representativa de la población, se debe establecer un proceso de muestreo en el que todos los elementos de la población tengan la misma posibilidad de ser seleccionados y, cuando sea posible, que la selección de cada elemento sea independiente de las demás. Lo anterior significa que al elegir los elementos de una muestra no debe de haber preferencia por alguno de ellos, ni deben seleccionarse en función de lo

Page 5: Libro estadistica coor1

Estadística

5

que se observe en los anteriores. Para obtener una muestra representativa, existen diferentes técnicas, entre las cuales se encuentran las siguientes: 1.2. TIPOS DE MUESTREO Muestreo Aleatorio: este tipo de muestreo consiste en formar una lista de todos los elementos de la población, enumerarlos y hacer la selección mediante la generación de números aleatorios con una distribución uniforme. Para generar números aleatorios con distribución uniforme se puede usar una tabla de dígitos aleatorios, o mediante la aplicación de ecuaciones de recurrencia, diseñadas para tal fin. Los obtenidos de ésta última forma se denominan números pseudoaleatorios, debido a que con el mismo valor inicial, se obtiene la misma secuencia de números. El muestreo aleatorio es recomendable cuando la población es numerable. Muestreo Sistemático: en éste tipo de muestreo también se elabora una lista con los elementos de la población, pero en lugar de seleccionarlos de forma aleatoria, se recorre la lista y se va seleccionando cada k-ésimo elemento, iniciando aleatoriamente con uno de los primeros k. El muestreo sistemático es más sencillo de aplicar que el anterior. Sin embargo tiene la limitación de no poderse aplicar a poblaciones demasiado grandes, ni tampoco cuando los datos presentan periodicidad, puesto que ésta puede coincidir con el período de selección k. Muestreo Estratificado: en ésta técnica, la población se divide en clases o estratos para hacer posteriormente una selección, que puede ser aleatoria o sistemática dentro de cada estrato. La definición de cada clase debe ser suficientemente clara para evitar que uno de los elementos se pueda ubicar en dos clases diferentes.

Page 6: Libro estadistica coor1

Estadística

6

El número de elementos que se seleccionan de cada clase puede ser proporcional al tamaño del estrato cuando la diferencia entre ellos es muy grande, o pueden ser iguales cuando el tamaño de los estratos es semejante. Muestreo por conglomerados: Es semejante al muestreo estratificado, en el sentido de definir grupos de elementos, sin embargo, esta técnica se aplica cuando la población es homogénea y existen grupos ya definidos. Debido a la homogeneidad de la población, no se requiere seleccionar elementos de todos los conglomerados y, en ocasiones, es suficiente con seleccionar uno de los conglomerados con todos sus elementos. Para realizar la selección por conglomerados, se puede utilizar el muestreo aleatorio, considerando grupos en lugar de elementos individuales.

Page 7: Libro estadistica coor1

Estadística

7

CAPITULO 2

DISTRIBUCION DE FRECUENCIAS DE UNA MUESTRA 2.1. TABULACION DE DATOS. En la etapa inicial se lleva a cabo la captación de información, es común que los datos obtenidos en la muestra se encuentran desordenados por lo que es difícil obtener información que proporcione a priori el comportamiento de la población directamente, a través de ellos. Una forma natural de ordenarlos es de manera ascendente o descendente, sobre todo cuando la misma es pequeña . Sin embargo, cuando se trata de una muestra grande, el procedimiento anterior se hace muy laborioso sin embargo una vez ordenada la muestra resulta más fácil su manejo. Del conjunto de datos, algunos números sólo se presentan una vez y otros se repiten varias veces. Si se enumeran los resultados en el orden en que ocurren, se dice que siguen la forma de datos no agrupados, lo cual permite estudiar la secuencia de los valores, esto es, los valores altos o bajos, y a partir de ahí, descubrir algunas de las causas de variación, por ejemplo registro de venta de juguetes educativos, útiles escolares, venta de árboles de Navidad, se observará que su comportamiento es cíclico. Así mismo, como vehículo de explicación de la tabulación de datos, se consideran los resultados obtenidos de la medición de 80 piezas de madera que fueron seleccionadas de una bodega, para realizar análisis de comportamiento de las características de inventario de la misma, referente a las medidas que más se manejan en la empresa. El registro de la información es mostrado tal como se fueron realizando las mediciones, iniciando por el primer valor de la primera columna con la secuencia ( 50.1, 50.6, 50.7, 51.1,..., 51.3).

Page 8: Libro estadistica coor1

Estadística

8

TABLA 1.0: Medición de 80 tablas de Pinus Spp. longitud (cm)

50.1 50.6 51.1 50.8 52.2 51.9 51.2 52.0 50.6 49.1 51.8 51.0 50.8 51.8 51.1 49.7 50.7 51.4 51.9 50.4 51.7 51.0 49.5 52.0 51.1 51.8 50.3 51.5 51.7 50.3 49.9 49.7 52.0 51.3 51.1 50.8 49.4 50.3 51.1 51.2 50.8 51.5 51.1 51.2 50.3 51.3 51.7 51.8 51.4 51.0 51.7 50.1 52.1 51.0 52.8 51.1 49.9 51.9 50.2 51.5 51.0 50.2 49.6 51.3 51.8 51.3 50.5 51.7 51.7 50.4 49.6 51.2 51.3 51.2 51.6 51.5 51.9 51.6 53.1 51.8

2.2. AGRUPAMIENTO DE FRECUENCIAS. Para el caso cuando el número de datos manejados en el experimento es muy grande y se presenta la ocurrencia de un mismo dato numérico más de una vez, a los mismos se les presenta en una tabla a la que se le llama tabla de frecuencias (Distribución de frecuencias) de datos agrupados. Al número de veces con que se repite un resultado en un lote de datos se le denomina frecuencia (f). Como ejemplo ilustrativo se presentan los resultados de un experimento realizado en torno a la obtención del diámetro en (cm.) de 28 árboles del Vivero Lázaro Cárdenas de Morelia, Mich., (zona reforestada). Después de hacer el ordenamiento de datos, se observa que ciertas medidas de diámetros se repiten más de una vez como se muestra en la siguiente tabla.

TABLA 1.1: Medición de diámetro de 28 árboles (cm.)

MEDICION ( X ) 15.5 15.7 16.0 16.1 16.3 17.0 17.5 19.0 19.5FRECUENCIA ( f ) 2 2 3 3 1 5 4 6 2

Page 9: Libro estadistica coor1

Estadística

9

La medición expresada en forma gráfica es dada como:

La secuencia básica para hacer la clasificación anterior es la siguiente: • Elaboración de la tabla de datos de observaciones de un experimento. • Ordenamiento de los datos en función de la frecuencia de ocurrencia de

cada resultado, en el que se observa la repetición con que ocurre un resultado del experimento (dato) y se presenta la forma tabular, como se muestra en la tabla 1.1.

Cuando son manejadas más de 40 observaciones, es útil emplear una representación más compacta, ordenándolos en clases o categorías y determinando el número de individuos que pertenecen a cada clase, los intervalos de clase comúnmente son de la misma amplitud y el número de elementos incluidos en cada clase recibe el nombre de frecuencia de clase.

1

2

3

4

5

6

7

f

x15.5 15.7 16.0 16.1 16.3 17.0 17.5 19.0 19.5

FIG.1: DISTRIBUCION DE FRECUENCIAS

Page 10: Libro estadistica coor1

Estadística

10

Con el procedimiento de ordenamiento en clases, generalmente se pierde parte del detalle original de los datos, pero tiene la particularidad de presentarlos todos en un cuadro sencillo que facilita el hallazgo de las relaciones que puede haber entre ellas; suele ser conveniente usar de 5 a 25 intervalos de clase. Si se utilizan demasiados intervalos de clase, las frecuencias de clase son bajas y el ahorro de cálculos es pequeño. Por el contrario con muy pocos intervalos de clase se puede ocultar el verdadero carácter de la distribución y perder la información. En este tipo de análisis se seleccionan intervalos tomando en consideración que ningún resultado caiga en el límite (o frontera) de clase. Los conceptos básicos de clasificación de intervalos de clase son los siguientes: 2.2.1.- RANGO DE LA MUESTRA (R): Se define como la diferencia existente entre el mayor y el menor valor del conjunto de elementos (muestra) en estudio. 2.2.2.- FRECUENCIA (f): Se expresa como el número de veces que aparece un valor determinado dentro de un conjunto de datos. 2.2.3.- INTERVALOS DE CLASE (Ic): Cuando se dispone de un gran número de datos ordenados, será útil distribuirlos en grupos a los que se les llama clases. Para ordenar el conjunto de datos de la muestra, se clasifican en varios intervalos, denominados intervalos de clase.

Page 11: Libro estadistica coor1

Estadística

11

La fijación de los intervalos de clase depende del criterio del analista, aunque se recomienda tomar en cuenta lo siguiente: " El número de intervalos que se puede establecer depende de la cantidad de datos que contiene la muestra (tamaño de la muestra) y de la dispersión o variación de los mismos ." Para análisis estadístico es recomendable establecer entre 5 y 25 intervalos de clase, tratando que no queden intervalos vacíos dentro del rango de valores. Se debe tener cuidado en la fijación de los límites de cada intervalo para evitar, por un lado, la posibilidad de que un mismo elemento pertenezca a dos intervalos diferentes y, por otro, que la magnitud de los intervalos sea difícil de manejar. Por ejemplo si una distribución de datos tiene un rango de 30 y se seleccionan para hacer el análisis 6 clases; es decir, se va a dividir el grupo de datos en 6 subgrupos. "El intervalo de clase está dado como el rango o recorrido de una clase"; al distribuir una población en clases, se busca que todos los intervalos de clase sean iguales: en función del caso citado anteriormente el intervalo de clase será 5. La determinación del número de clases (k): puede ser establecido, de acuerdo con la experiencia del analista o bien dependiendo del objetivo que se pretende en el estudio, sin embargo un criterio conservador empleado para su definición es hacer uso de la regla de Sturges, la cuál es representada como se muestra a continuación:

K = 1 + 3.3 Log.(n) Donde K representa el número de intervalos de clase y (n) es el número de valores del experimento, conjunto de datos, el tamaño de la muestra o población. La respuesta que se obtenga aplicando la regla de Sturges no debe

Page 12: Libro estadistica coor1

Estadística

12

considerarse como final, sino solo como una guía. El número de intervalos de clase especificado por la regla debe aumentarse o disminuirse según convenga y en beneficio de una presentación clara de la información en análisis. Otro aspecto importante de decidir el intervalo de clase, este se refiere a la amplitud o variación de la clase. Aunque a veces es imposible definirlo adecuadamente, por lo general, los intervalos de clase deben de ser de amplitudes iguales. Esta amplitud puede determinarse, dividiendo el recorrido de la clase (rango) (R) entre (K), la determinación del número de intervalos de clase se expresa como:

KRIc =

Donde: Ic = Intervalo de clase (variación de clase) R = Rango K = Número de clases Para mostrar el caso, se usará como vehículo de explicación el ejemplo citado anteriormente de la medición de 80 tablas de madera, para ello la tabla de distribución de frecuencias, estará dada como se muestra:

TABLA 1.2: Ordenamiento y clasificación de datos por clases

INTERVALOS

DE CLASE

LIMITES DEL INTERVALO

MARCAS DE CLASE ( MC i )

FRECUENCIA

fi

FRECUENCIA RELATIVA

f´i

FRECUENCIA RELATIVA

ACUM. F´i

1 49.0-49.9 49.45 9 0.11 0.11 2 50.0-50.9 50.45 20 0.25 0.36 3 51.0-51.9 51.45 44 0.55 0.91 4 53.0-53.9 52.45 6 0.08 0.99 5 52.0-52.9 53.45 1 0.01 1.00

Page 13: Libro estadistica coor1

Estadística

13

Refiriéndonos a la tabla 1.2, un intervalo de clase está dado por ejemplo (49.0 - 49.9), los números extremos son 49.0 y 49.9 y se les conoce como límites de clase (49.0: límite inferior de clase y 49.9: límite superior de clase). Otro tipo de intervalo de clase manejado en muchos casos se le conoce como intervalo de clase abierto; está definido como aquel intervalo que no tiene límite superior o inferior, por ejemplo: • Las personas mayores de 65 años en el mundo. • Las tablas mayores de 2 mts. de largo de la producción del aserradero

de Villa Madero, Mich. • Los vehículos de México que circulan a más de 40 km/hr. • Empresas con niveles de utilidad neta mayores de 9 millones anuales. • Los estudiantes con calificación mayor de 6 en el mundo. 2.2.4.- LIMITES REALES DE CLASE Para una explicación de este concepto, se tomará como base los resultados arrojados de la medición de velocidad en el Km. 28 de la carretera Morelia – Patzcuaro de los vehículos que pasan en la primera semana del mes de Septiembre de 2005.

TABLA 1.3: Velocidad Registrada km./Hr. Clases (K) Interválos de Clase Frecuencia

(fi) 1 60-62 5 2 63-65 18 3 66-68 42 4 69-71 27 5 72-74 8

Page 14: Libro estadistica coor1

Estadística

14

Total 100 Si la velocidad se registra con una aproximación de 1 km/hr. (tabla 1.3); el intervalo de clase (60 - 62) teóricamente incluye todas las mediciones, desde 59.5 hasta 62.5; estos números son conocidos como límites reales de clase o límites verdaderos de clase, (59.5 límite real inferior; 62.5 límite real superior). Para la obtención de los límites reales de clase es recomendable tomar en cuenta las siguientes reglas practicas: • Cuando se trate de números enteros, réstese 0.5 al límite inferior de clase y

súmese 0.5 al límite superior de clase. • Cuando se trata de números fraccionarios tómese en cuenta; si la cantidad de

dígitos decimales significativos es n, tómese 0.05, lo cuál garantiza que no caiga un posible (valor resultado del experimento) en el mismo límite de clase.

2.3.- TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE El tamaño o anchura de un intervalo de clase es la diferencia entre los límites reales de clase que lo forman y se conoce como anchura de clase, tamaño de clase o longitud de clase, Matemáticamente está dado como:

IC = LSC - LIC

Donde: IC = Intervalo de clase LSC = Límite superior de clase LIC = Límite inferior de clase

Page 15: Libro estadistica coor1

Estadística

15

2.4.- MARCA DE CLASE Es el punto medio del intervalo de clase y se obtiene sumando el límite inferior con el superior de la clase y dividiéndolo entre 2. Se conoce también como punto medio de la clase. Matemáticamente está dada como:

MCLSC LIC

=+2

Donde: MC = Marca de clase LSC = Límite superior de clase LIC = Límite inferior de clase Para análisis matemáticos posteriores se debe tener presente, que si los datos comprendidos en un intervalo se distribuyen de una forma uniforme, se considera que el punto medio del intervalo, puede representar a todos los valores de la muestra que se encuentran en él. A dicho punto se le denomina marca de clase, en la tabla 1.2 se cita como (MCi). Al número de elementos de la muestra que pertenece a un intervalo de clase (i) se le llama frecuencia del intervalo, y se representa como (fi) La suma de las frecuencias deberá ser igual al número total de elementos de la muestra de tamaño n; matemáticamente está dada como:

∑=

=m

ii nf

1

Donde: fi = frecuencia de ocurrencia de un elemento

para la clase i; i=1, 2, 3, ... ,m. n = Tamaño de la muestra.

Page 16: Libro estadistica coor1

Estadística

16

m = Número de intervalos de clase. 2.5.- FRECUENCIA RELATIVA Al cociente de la frecuencia entre el número total de datos muestrales se le llama frecuencia relativa y se representa como (f'i) es expresada como :

nN

nff ai

i ==′

Donde: f'

i = frecuencia relativa en i. fi = frecuencia de ocurrencia del evento i. n = tamaño de la muestra Na = Número de veces que se repite el evento (a). i = Representa la clase i = 1,2,..., m. La frecuencia relativa de un intervalo de clase se puede interpretar como la proporción de datos que se encuentran en el intervalo correspondiente. 2.6.- FRECUENCIA RELATIVA ACUMULADA Se define como la suma de las frecuencias relativas hasta el i-ésimo intervalo, con lo cual se cumple que:

∑=

′=′i

jji fF

1

Donde: j = 1, 2, 3, ... , i i = 1, 2, 3, ... , n

Page 17: Libro estadistica coor1

Estadística

17

A la frecuencia relativa acumulada, cuando es presentada de una forma gráfica comúnmente se le llama ojiva; dicha frecuencia está dada como la frecuencia total de todos los valores menores que el límite real superior de clase en un intervalo de clase dado y a su vez, se le conoce como frecuencia acumulada hasta ese intervalo de clase inclusive. Gráficamente el ejemplo citado en la tabla 1.2., es expresado como:

2.7. DISTRIBUCIONES EMPIRICAS Para la determinación de la función de distribución de probabilidad de una variable aleatoria que representa el comportamiento de un fenómeno (experimento) o el modelo probabilístico teórico más aproximado a ella, es útil construir la gráfica de las frecuencias, frecuencias relativas o frecuencias relativas acumuladas.

9

29

73

79

80

Frecuenciaacumulada

Intervalosde clase49

FIG.2: FRECUENCIA ACUMULADA

50 51 52 53 54

Page 18: Libro estadistica coor1

Estadística

18

Para representar la frecuencia o las frecuencias relativas se usa generalmente el histograma y el polígono de frecuencias. En el histograma; la frecuencia se considera constante en todos los puntos de cada intervalo de clase, por lo que se representa como una sucesión de rectángulos del mismo ancho y cuyas alturas corresponden a las frecuencias o a las frecuencias relativas acumuladas de los intervalos correspondientes. Polígono de Frecuencias: es un gráfico de línea trazado sobre las marcas de clase, puede obtenerse a través de los puntos medios de los techos de los rectángulos en el histograma, esta presentación es otro tipo de gráfico que muestra la distribución de frecuencias. Para su construcción se marca sobre el mismo sistema de ejes del histograma una sucesión de puntos, cuyas abscisas son las marcas de clase y las ordenadas son las frecuencias o las frecuencias relativas correspondientes. Posteriormente se unen mediante rectas todos los puntos consecutivos. Para cerrar el polígono de frecuencias en los extremos, se consideran otros intervalos con frecuencia cero, es decir en la primera clase se considera el límite inferior de esta como punto de inicio y en el cierre final él limite superior de la última clase. Por la ley de los grandes números, la frecuencia relativa de cada intervalo de clase se puede considerar como una aproximación de la probabilidad de que la variable aleatoria tome un valor dentro del intervalo de clase y, por consiguiente, el polígono de frecuencias se puede considerar como una aproximación de la función de densidad de probabilidad. A nivel de resumen del capítulo, una forma de ejemplificar las diferentes gráficas citadas y el proceso de solución de un problema hasta esta etapa está dado por el ejemplo siguiente:

Page 19: Libro estadistica coor1

Estadística

19

Ejemplo: En un bosque del Estado de Michoacán de Pinus leiophylla para su análisis silvícola y de aprovechamiento se ha tomado una muestra de 80 árboles a los cuales mediante las técnicas de Pressler se determinó la edad de los sujetos y que a continuación se enlistan. Se desea establecer una política de aprovechamiento industrial con la finalidad de que la empresa maderera “W” determine las posibilidades reales de utilidad de acuerdo con los volúmenes susceptibles de explotar en cada rango diamétrico, las medidas de los árboles están en centímetros. Tabla de Datos

80 79 48 74 81 98 87 80 84 80 90 70 91 93 82 78 71 70 92 65 56 81 74 73 72 68 85 51 65 93 83 86 93 90 83 73 74 43 86 68 91 92 76 71 90 76 67 75 74 80 61 72 97 91 88 81 60 70 99 92 80 59 71 77 63 63 83 82 60 67 89 63 35 76 88 70 66 88 79 75

2.7.1. METODOLOGIA DEL ANALISIS • Se determina el número de clases factibles de obtener con la muestra que se

ha tomado de 80 árboles, esto puede hacerse a través de experiencia, o bien para saber cuántos números de clases se tienen se tomará como base la regla de Sturges , dada como:

k = 1 + 3.3 log(n)

Page 20: Libro estadistica coor1

Estadística

20

Donde: k = Número de clases n = Tamaño de muestra usada.

k = 1 + 3.3 log(80) = 7.28 Para el caso será tomada una k = 7.0, debido a que no es posible tomar fracciones de clase. • Se determina la amplitud del rango; magnitud del intervalo, para hacer

posibles las 7 categorías; este concepto es conocido también como amplitud de clase, puede ser obtenido como:

R = Vs - Vi Donde: R = Rango de clase (amplitud de clase) Vs = Valor mayor de la muestra. Vi = Valor menor de la muestra. R = 99 - 35 = 64 El intervalo de clase, está dada como:

kRIc =

Donde: Ic = Intervalo de clase R = Rango

Page 21: Libro estadistica coor1

Estadística

21

k = Número de clases

1014.9764

===cI

De lo anterior se tiene que se pueden establecer 7 clases con una amplitud de ellas de 10 unidades de edad. • Determinación de frecuencias. Estas están dadas como: TABLA 1.4: Distribución de frecuencias

K INTERVALOS

DE CLASE FRECUENCIA VAL.MED.

DE CLASE FRECUENCIA

RELATIVA % DE

MUESTRA

1 30.5 – 40.5 2 35.5 0.01250 1.25 2 40.5 – 50.5 2 45.5 0.02500 2.50 3 50.5 – 60.5 5 55.5 0.06250 6.25 4 60.5 – 70.5 7 65.5 0.01875 18.75 5 70.5 – 80.5 22 75.5 0.31250 31.25 6 80.5 – 90.5 17 85.5 0.25000 25.00 7 90.5 – 100.5 15 95.5 0.15000 15.00 TOTALES 70 1.00000 100.00

En el análisis se usan los límites reales de clase. La frecuencia más alta se obtuvo en la clase 5 de la tabla, por lo cual es el rango más recomendable de explotación en la primera etapa, debido a que es el tipo de recurso más abundante. • Representación gráfica de la información a través de un histograma; éste

es dado como se muestra:

Page 22: Libro estadistica coor1

Estadística

22

Fig. 3: Histograma • Representación gráfica a través de un polígono de frecuencias del

problema citado. Este se construye haciendo uso de las marcas de clase.

1

2

5

12

15

20

25

Frecuencia (fi)

Marca de clase

30.5 35.5 45.5 55.5 65.5 75.5 85.5 95.5 100.5

FIG.4: POLÍGONO DE FRECUENCIAS

Page 23: Libro estadistica coor1

Estadística

23

De la gráfica anterior se observa que los volúmenes más abundantes de recurso a explotar están concentrados en los rangos diamétricos de 70-90 cm , lo que en la practica abre cualquier posibilidad para hacer análisis financieros y evaluar su viabilidad técnico – económica y decidir si se realiza dicha explotación forestal y poder procesar industrialmente ese recurso, debido a que este rango diamétrico es la base para obtener cualquier medida comercial de madera aserrada, así como elementos estructurales entre otros por citar algunos.

Page 24: Libro estadistica coor1

Estadística

24

Page 25: Libro estadistica coor1

Estadística

25

CAPITULO 3

MEDIDAS DE TENDENCIA CENTRAL La parte fundamental para que sean tratadas las medidas de tendencia central es el conocimiento de la notación matemática empleada en su representación, ésta es expresada generalmente como: 3.1. NOTACION SUMATORIA.

El símbolo ∑=

n

1jjX se utiliza para expresar la suma de las Xj donde, (j) toma

valores dados como, j = 1,2,...,n, de forma generalizada se expresa como.

n321

n

1jj X...XXXX ++++=∑

=

∑ )( , denota la operación de sumar matemáticamente.

Por ejemplo:

nn332211i

n

1ii YX...YXYXYXYX ++++=∑

=

Donde: i = 1, 2, 3, ..., n

Page 26: Libro estadistica coor1

Estadística

26

Ejemplo:

n321

n

1ii AY...AYAYAYAY ++++=∑

=

∑=

=

++++=n

1ii

n321

YA

)Y...YYA(Y

Donde: A es una constante.

Regla para el caso de una constante:

NCCN

1i=∑

=

Donde: C = constante N = número de veces que se repite C. Expresado literalmente; esto quiere decir que la sumatoria de una constante, será igual a la constante multiplicada por el número de términos expresado en la sumatoria. La tendencia central es una medida basada en cálculo de promedios, que sirven para describir el punto sobre el cual se agrupan o caen los diversos valores observados .

Page 27: Libro estadistica coor1

Estadística

27

3.2. PROMEDIOS. Los promedios se suelen emplear en la vida diaria para proporcionar una representación típica de un grupo en su totalidad, posiblemente como base para la comparación con otros, los valores promedios obtenidos serán tomados como valores estándar para hacer cualquier estudio de Benchmarking en el análisis empresarial de que se trate. Los promedios son conocidos también como medidas de tendencia central, las más representativas están dadas como: • Media Aritmética • Media Geométrica • Media Armónica • Mediana • Moda Con estas medidas se busca un valor que pueda representar a toda la muestra, por encontrarse en el centro de ella, por lo que será un valor estándar para hacer cualquier análisis de comparación. 3.2.1. MEDIA ARITMETICA La media es el tipo de promedio más común, está dado como un valor tal que la suma de las desviaciones o diferencias entre cada una de las observaciones y dicho valor es cero; por lo que la Media Aritmética de un conjunto de (n) observaciones (X1, X2, X3, ..., Xn) para el caso de análisis puntual, es igual a la suma de las observaciones dividida entre (n).

Page 28: Libro estadistica coor1

Estadística

28

Matemáticamente es expresada como:

nnX...XXX

X

nXX

n1X

1n321

n

1i

in

1ii

∑∑

=

==

=++++

=

==

n

iiX

Para el caso Xi es el i-ésimo elemento de la muestra. Donde: Xi = Observación o valor del resultado del experimento. ( i = 1, 2, 3, …, n) n = Número total de observaciones

__

X = Media de la muestra La ecuación anterior puede ser expresada de la siguiente forma:

∑=

=−n

1ii 0)X(X

La notación más comúnmente empleada para expresar la media en función de si se trata de una población o una muestra está dada como se observa a continuación.

• Una medida descriptiva calculada a partir de los datos de una muestra

Page 29: Libro estadistica coor1

Estadística

29

recibe el nombre de estadístico para el caso de la media está expresada

como __

X . • Una medida descriptiva calculada a partir de los datos de una

población recibe el nombre de parámetro, para el caso de la media está expresada como (μ).

• Para el cálculo de la media aritmética se emplearan los resultados

obtenidos en la realización de pruebas físico-mecánicas a probetas de madera de pino, misma que pretende medir su potencial, para aplicación de la misma como elemento estructural en la construcción, como se muestra en el ejemplo siguiente:

Ejemplo: En 10 probetas de Pinus Douglasiana, se midió la resistencia perpendicular a la fibra, dando los siguientes resultados: 30, 350, 40, 500, 600, 90.5, 50.5, 30.3, 70.4, 300 (kg./cm ), se desea calcular su valor medio de resistencia perpendicular a la fibra. Solución: Para el caso se tiene un tamaño de muestra dado por n=10.. Donde:

X1= 30 X6= 90.5 X2= 350 X7= 50.5 X3= 40 X8= 30.3 X4= 500 X9= 70.4 X5= 600 X10=300.0

Page 30: Libro estadistica coor1

Estadística

30

17.20610

7.2061X

7.2061X10

1i

==

=∑=i

Por lo que su valor medio es dado como:

2cmKg17.206X =

3.2.2. MEDIA ARITMETICA PONDERADA Expresa otra forma de calcular la media aritmética, éste es el caso cuando se le asocia a cada uno de los valores de la muestra o población cierto peso, ponderación o importancia, expresada ésta como un número, esto depende del grado de importancia que el analista (especialista) le otorgue a cada elemento. Matemáticamente está expresada como:

n321

nn332211n

1ii

n

1iii

W...WWWXW...XWXWXW

W

XWX

++++++++

==∑

=

=

Donde: Xi = Valor de cada observación. Wi = Nivel de ponderación asignado a las observaciones.

__

X = Media ponderada.

Page 31: Libro estadistica coor1

Estadística

31

Como elemento de explicación del concepto se empleará el ejemplo citado a continuación. Ejemplo: Si el profesor que imparte la cátedra de Contabilidad I, valora el examen final del curso en función de complejidad como 3 veces el valor de los exámenes parciales y un estudiante tiene una calificación de examen final de 85 y calificaciones de exámenes parciales de 70 y 80, su calificación final estará dada como: Solución: X1 = 70 W1 = 1.0 X2 = 80 W2 = 1.0 X3 = 85 W3 = 3.0 La asignación de ponderaciones se hace considerando el nivel de complejidad de los exámenes W3 es la más alta ya que su grado de dificultad es mayor puesto que implica el conocimiento anterior para resolver el tercer examen. Para el caso, aplicando:

81311

385180170

1

1 =++

++==

=

= )()()(

W

XWX n

ii

n

iii

La calificación final asignada por el profesor será de 81.0, en escala 10 será 8.1.

Page 32: Libro estadistica coor1

Estadística

32

Page 33: Libro estadistica coor1

Estadística

33

3.2.3. MEDIA ARITMETICA CALCULADA A PARTIR DE DATOS AGRUPADOS. El cálculo de este indicador está dado para el caso que los números X´1, X´2, X´3, ..., X´n; se presentan con f1, f2, f3, ..., fn veces respectivamente (Es decir, se presentan con frecuencias f1, f2, f3, ..., fn). La media aritmética estará dada como sigue:

==

=

+++

+++== n

in

nn

n

ii

n

iii

fff

XfXfXf

f

XfX

121

2211

1

1

´__

...

´...´´

Donde:

__

X = Media Aritmética para datos agrupados fi = Frecuencia de la clase i., i = 1, 2, 3, ..., n X´i = Marca de clase i, i = 1, 2, 3,..., n Para su aplicación se tomara como referencia el ejemplo citado en la tabla 1.4. del capítulo 2, donde los datos son expresados a través de la tabla siguiente:

Page 34: Libro estadistica coor1

Estadística

34

Para el caso de Pinus leyophilla

Intervalos de Clase

fi Marca de Clase(X´i)

fi X´i

30.5 - 40.5 1 35.5 35.5 40.5 - 50.5 2 45.5 91.0 50.5 - 60.5 5 55.5 277.5 60.5 - 70.5 15 65.5 975.5 70.5 - 80.5 25 75.5 1887.5 80.5 - 90.5 20 85.5 1710.0

90.5 - 100.5 12 95.5 1146.0 TOTALES 80 6122.5

La solución del problema está dada en los siguientes términos:

53.7680

5.6122

1

1 ===∑

=

=n

ii

n

iii

f

X´fX

Lo que representa que el valor promedio del diámetro de los árboles del bosque en estudio es 76. 53 cm. 3.2.4. MEDIA GEOMETRICA La media geométrica dada por (G) de un conjunto de datos

n321 X,...,X,X,X ; está dada como se muestra a continuación:

Page 35: Libro estadistica coor1

Estadística

35

nn,...,X,X,XXG 321=

La aplicación de ésta ecuación es para el caso: Cuando se trabaja con observaciones en las que cada una guarda una razón aproximada respecto a la anterior, crecen o decrecen proporcionalmente en intervalos inclusive. Para el caso de datos agrupados, la forma de cálculo es como sigue

∑∏= =

=

n

ii

if

fi

n

iXG 1 )´(

1

Donde: G = Media Geométrica π = Producto Para el caso de análisis puntual se usa cada uno de los resultados del experimento (xi), y cuando se trata con datos agrupados se sustituye por la marca de clase (x'i). Ejemplo: Dadas las observaciones Xi de un experimento, las cuales se repiten con la frecuencia fi mostrada en la tabla siguiente:

Xi 5 6 7 8 fi 1 2 1 1

La media geométrica estaría dada como:

Page 36: Libro estadistica coor1

Estadística

36

5 1121 )8(*)7(*)6(*)5(G = G = 6.319 3.2.5. MEDIA ARMONICA La media armónica es representada comúnmente por H. Para una serie de datos, producto de un experimento se calcula de la forma:

∑∑==

==n

i i

n

i i X

n

Xn

H

11

1111

Donde: H = Media armónica. Xi = Resultados del experimento, i = 1, 2, 3, ..., n n = Tamaño de la muestra Para explicación de este criterio se toma el ejemplo: un agente viajero recorre en su vehículo 3 km. consecutivos, en el primer km., lleva una velocidad de X1 = 35 km. por hora, en el segundo km., lleva una velocidad de X2 = 48 km. por hora y en el tercer km., su velocidad fue de X3 = 40 km. por hora. Se desea encontrar la velocidad promedio del vehículo en km. por hora. Solución: Para el caso se aplicara la media geométrica como: Tomando; T = D/V , entonces:

Page 37: Libro estadistica coor1

Estadística

37

T1 = 1 km./35 km. por hr. = 1/35 hr. T2 = 1 km/48 km. por hr. = 1/48 hr. T3 = 1 km/40 km. por hr. = 1/40 hr. De donde se tiene que el tiempo total es dado: Tt = 1/35 + 1/48 + 1/40 = 0.0744. El promedio de velocidad es calculado a través de la siguiente ecuación: Vpromedio = 3 km./0.0744 hrs. = 40.32 km./hr. (vel. promedio del vehículo) 3.2.6. RAIZ CUADRATICA MEDIA (RMS) La raíz cuadrática media de una serie de datos (X1, X2, X3, ..., Xn); se define como:

n

XRMS

n

ii∑

== 1

Dónde: Xi = Resultados del experimento n = Tamaño de la muestra 3.3. MEDIANA La mediana de un conjunto de resultados de un experimento está dada como la observación central cuando son ordenadas según su magnitud (ordenación de datos de decreciente a creciente), o bien, este concepto comúnmente también es

Page 38: Libro estadistica coor1

Estadística

38

expresado como el valor que corresponde a la mitad de los datos ordenados de una muestra. De otra forma ésta puede ser presentada como la observación central de un conjunto de observaciones cuando aquellas se ordenan o jerarquizan según su magnitud. El término observación central se refiere a la distancia desde los extremos y no a los valores numéricos. • La obtención de la mediana para caso de datos pares formados respecto al

número; por ejemplo para un conjunto de datos como los mostrados (21, 22, 31, 34, 31, 22, 17, 26); la primera fase de la obtención de la mediana de éste conjunto de datos es la de ordenarlos de manera ascendente como se muestra: (17, 21, 22, 22, 26, 31, 31, 34), de donde se tiene que los valores centrales son (22, 26), de esto se observa que la mediana está dada como el valor medio de éstos valores, como (22 + 26)/2, por lo que ésta es dada por 24.

• Para el caso de datos impares, si es manejado el conjunto de datos (17, 21,

22, 22, 26, 31, 31); se tiene que la mediana es definida como 22. Las reglas presentadas anteriormente para obtener la mediana son usadas para el caso cuando se manejan muestras pequeñas. • Cuando la muestra analizada es grande y sus elementos se encuentran

agrupados, la mediana puede obtenerse determinando primero el intervalo que contiene a la mediana, el cual se distingue porque es el que tiene la frecuencia relativa acumulada mayor y /o igual a 0.5 y posteriormente, mediante una interpolación lineal se encuentra el valor de (Me) que corresponde a la frecuencia relativa acumulada de 0.5.

Con el polígono de frecuencias relativas acumuladas se puede aproximar el valor de la mediana, trazando una línea horizontal que parta de F' = 0.5, hasta cruzar el polígono y, posteriormente, con otra recta vertical que parte del

Page 39: Libro estadistica coor1

Estadística

39

F'

punto de la intersección, se encuentra en el eje de las abscisas, el valor de la mediana. La figura siguiente muestra la localización de la mediana (Me) sobre un polígono de frecuencias relativas acumuladas.

h

0.5

T1

T2 T 3

Li

Mex

f

f´k

f´k-1

Fig.5: Localización de la mediana. Para la realización de la interpolación lineal, es usada la ecuación de la línea recta dada como:

Y = Yo + m (X - Xo) En función de la figura 5, se tiene que:

Y = 0.5

Page 40: Libro estadistica coor1

Estadística

40

1k0 F´Y −′=

hfm k′=

X = Me

y Xo = Li

Donde: k = subíndice que corresponde al intervalo de clase que contiene a la mediana. F´k-1 = Frecuencia relativa acumulada hasta el intervalo k-1. f 'k = Frecuencia relativa del intervalo (k). h = Ic = Tamaño del intervalo de clase. Li = Límite inferior del intervalo (k). Sustituyendo los valores:

)L(Mh

fF5.0 iek

1k −′

+′= −

De donde:

)F(0.5fhLM 1k

kie −′−

′+=

Aplicando la información de la tabla 1.2, la mediana se obtiene como sigue: Me = 51 + 1/0.55 (0.5 - 0.36)

Page 41: Libro estadistica coor1

Estadística

41

Me = 51.25 En la tabla citada se puede observar que la mediana se encuentra en el intervalo comprendido de 51 a 51.9, debido a que la frecuencia relativa acumulada es mayor de 0.5. 3.4. MODA La moda es el valor de las observaciones que se presenta con más frecuencia si la variable es discreta, o bien, es el intervalo de clase (a menudo indicado por el punto medio de clase) que posee la mayor frecuencia. Al igual que la mediana, la moda se ve menos afectada por los valores extremos que la media. En función de lo anterior de una forma sencilla se tiene que la moda, es representada como el elemento de la muestra que tiene la máxima frecuencia, es decir, aquel que más se repite. • Una muestra puede tener dos o más modas, en cuyo caso se dice que es

bimodal o multimodal. Cuando todos los elementos de la muestra son diferentes, entonces no tiene sentido hablar de ella, porque puede considerarse que todos los elementos son la moda o que no existe, por éstas características, su uso está muy limitado.

Cuando la muestra es pequeña, la moda se determina directamente por inspección, mientras que en muestras grandes, con datos agrupados, se puede aproximar con la marca de clase del intervalo modal, que es el que tiene máxima frecuencia.

Page 42: Libro estadistica coor1

Estadística

42

En algunos casos se puede mejorar la aproximación, considerando que la moda es el valor más grande especificado en la ordenada y representado por el máximo de una curva hipotética que pasa por las marcas de clase, como se muestra a continuación.

Fig. 6: Presentación de la Moda. En función de lo anterior, puede considerarse que la moda debe pertenecer al intervalo de clase con máxima frecuencia, pero proporcionalmente más cercano al intervalo adyacente que le siga en frecuencia, de ésta forma puede plantearse la ecuación siguiente:

Page 43: Libro estadistica coor1

Estadística

43

11

1

+−

+

+=

ii

iio

fff

hLM

Donde: i = subíndice que corresponde al intervalo de clase modal fi+1 = frecuencia de la clase modal siguiente al intervalo modal. fi-1 = Frecuencia de clase anterior a la modal. Li = Límite inferior del intervalo i. De lo anterior se tiene que la moda está dada como:

M L hf

f fii

i i0

1

1 1= +

+⎡

⎣⎢

⎦⎥

+

− +

Para el caso del ejemplo de los 80 árboles de Pinus Leyophilla del capítulo 2, se tiene que la moda está dada como 25. 3.5. SESGO Y ASIMETRIA Considerando las tres medidas de tendencia central fundamentales como son la media, mediana y moda; su ubicación gráfica en la curva de distribución de frecuencia es dada como se muestra en la figura 7.

Page 44: Libro estadistica coor1

Estadística

44

Fig. 7. Representación grafica de las medidas de tendencia central Moda: Este indicador corresponde al punto más alto de la curva. Mediana: Divide el área bajo la curva en dos partes iguales con probabilidad de 0.5 cada una de tal forma que el área total bajo la curva es 1.0. Media: Este indicador pasa por el centroide del área; y cumple con la siguiente condición:

0)X(X 2n

1ii =−∑

=

La curva es sesgada (asimétrica) hacia la derecha; cuando la mediana se encuentra a la derecha de la moda, es decir, cuando la cola derecha de la curva es más larga que la izquierda, así mismo se expresa que dicha curva está sesgada positivamente.

Page 45: Libro estadistica coor1

Estadística

45

Para el caso de funciones de distribución que tienen cúspides muy agudas la mediana constituye a menudo una útil medida de tendencia central, debido a su representatividad como valor central estándar y por que es el valor que divide exactamente a la mitad la función.

Page 46: Libro estadistica coor1

Estadística

46

Page 47: Libro estadistica coor1

Estadística

47

CAPITULO 4

MEDIDAS DE DISPERSION Las medidas de dispersión son aquellas que expresan el grado en que los datos numéricos tienden a extenderse o alejarse respecto a un valor medio . Como su nombre lo indica, las medidas de dispersión reflejan la separación o alejamiento de los elementos de una muestra. Las medidas más comunes clasificadas en este apartado y conocidas de uso generalizado están dadas como: varianza, desviación estándar, coeficiente de variación. Su definición está dada como se muestra a continuación: 4.1. VARIANZA Si el conjunto de valores (Población finita) está formado por (n)

observaciones (Xi), cuya media es (__

X ), se puede expresar la desviación con

respecto a la media como (Xi - __

X ) de cada observación ; dicha desviación es conocida en la mayoría de la literatura como residuo. La desviación cuadrada media recibe el nombre de variancia o varianza, en base al segundo momento esta se define como:

∑=

−=n

ii )X(X

nm

1

22

1

Page 48: Libro estadistica coor1

Estadística

48

Donde: m2 = segundo momento con respecto a la media. Xi = Resultados del experimento.

__

X = Media de la muestra. n = Tamaño de la muestra. como:

∑=

−==n

ii )X(X

nmS

1

22

2 1

Para el caso en que son usados datos agrupados para el análisis, cada marca de clase representa a los valores que se encuentran dentro del intervalo correspondiente, por lo cual la varianza está dada como:

=

=

−′= n

ii

n

iii

x

f

)X(XfS

1

1

2

2

Donde: fi = Frecuencia de clase correspondiente X´i = Mc = Marca de clase correspondiente

__

X = Media de la muestra.

Page 49: Libro estadistica coor1

Estadística

49

Para el caso en que se quiere obtener la varianza de una muestra la ecuación anterior sufre la transformación de (n) por (n-1) en función de la Corrección de Bessel. Además es necesario especificar el concepto de grados de libertad; para el caso, un grado de libertad se define como una comparación entre los datos, independientemente de otras que se realicen en el análisis. Cada una de las observaciones en una muestra al azar de tamaño (n) que se puede comparar con otras (n-1) observaciones; de ahí que haya entonces (n-1) grados de libertad. Este concepto puede ser interpretado considerando un punto que puede moverse libremente en un espacio tridimensional. Dicho punto podría localizarse en el espacio mediante tres coordenadas variables (x,y,z). Si se limita el movimiento de éste punto a un plano como el ax + by + cz =d, entonces sólo tendrá dos grados de libertad , que corresponden al número de variables independientes (x,y,z, es decir 3), menos el número de restricciones (ecuación ax + by + cz =d, o sea 1). Por lo que, en general, el número de grados de libertad es igual al número de variables independientes menos el número de restricciones. Para el caso cuando se trata, digamos con n variables independientes relacionadas por m ecuaciones (restricciones), entonces el número de grados de libertad sería (n - m). En el caso en el que se hace una estimación de (S2 ) de la varianza de la población, se desconoce la media real de la misma. De este modo, cuando las observaciones son comparadas con la media de la

muestra (__

X ), se presenta una limitación o restricción sobre los valores de

(Xi - __

X ) impuesta porque vale cero la suma de las desviaciones respecto de la

media muestral (__

X ), es decir:

01

=−∑=

n

ii )X(X

Por lo tanto se pierde un grado de libertad, dejando (n-1) comparaciones o grados de libertad, por lo que para obtener la estimación de la varianza, o sea, la media de los cuadrados de las desviaciones, se dividirá la suma de los cuadrados de las mismas entre el número de grados de libertad o

Page 50: Libro estadistica coor1

Estadística

50

comparaciones (n-1); de lo anterior se tiene que la varianza para el caso de una muestra está dada como:

11

2

2

−=

∑=

n

)X(XS

n

ii

x

4.2 DESVIACION ESTANDAR Dado que la varianza es una medida fundamental de dispersión, no es del todo práctica y conveniente, ya que sus unidades son los cuadrados de las unidades de la variable, y muy a menudo muchas de las características numéricas de las distribuciones se expresan directamente en términos de la raíz cuadrada con el nombre de desviación estándar. Esta cantidad es entonces la desviación media cuadrática (o valor RMS) de la desviación y siempre es positiva. Sus unidades son las mismas de la variable, por lo que esta puede ser escrita como: • Para el caso de análisis de una población, está dada:

N

)(n

1i

2∑=

−=

μσ

iX

Donde: σ = Desviación estándar de una población. Xi = Resultados del experimento. μ = Media poblacional. N = Elementos de la población.

Page 51: Libro estadistica coor1

Estadística

51

• Para el caso de análisis de una muestra de la población, la desviación estándar está dada como:

11

2

n-

)X(XS

n

ii∑

=

−=

Donde: S = Desviación Estándar de la muestra.

__

X = Media de la Muestra. Xi = Resultados del experimento. n-1 = Número de grados de libertad (corrector de Bessel). Cuando se está analizando un caso con datos agrupados, la ecuación representativa es:

∑=

−= n

i=i

n

iii

f

)X(X´fS

1

1

2

Donde: fi = Frecuencia de la clase correspondiente. X´i = Marca de la clase correspondiente.

__

X = Media de la muestra.

Page 52: Libro estadistica coor1

Estadística

52

4.3. COEFICIENTE DE VARIACIÓN Como se mencionó anteriormente, la desviación estándar se expresa en las mismas unidades que la variable original (Xi); sin embargo, para diversos fines es conveniente expresar la dispersión de los resultados en forma porcentual, es decir, en términos relativos y no absolutos, tal coeficiente es una cantidad adimensional. El coeficiente estaría dado como:

) (XSC.V. 100=

Donde: C.V. = Coeficiente de variación.

__

X = Media muestral. S = Desviación estándar de la muestra. 4.4 MEDIDAS DE FORMA 4.4.1 ASIMETRIA Los estadísticos más importantes que hemos visto son la media y la desviación típica; ambos pertenecen a un grupo de estadísticos que se denominan momentos. Uno de los objetivos más importantes de la estadística descriptiva es proporcionar información sobre la muestra, que pueda ser de utilidad para

Page 53: Libro estadistica coor1

Estadística

53

determinar las características de toda población. Para el caso cuando se desea ajustar un modelo probabilístico, a un fenómeno particular es conveniente comparar la forma del histograma o del polígono de frecuencias de una muestra del fenómeno, con la función de probabilidad del modelo teórico. • Para describir la forma de distribución de frecuencias de una muestra, se usa

entre otros indicadores, la asimetría o sesgo. Una distribución de frecuencias es simétrica si el tercer momento de la muestra con respecto a la media es igual a cero (m3 = 0); en tal caso la media divide en dos partes iguales a la distribución de frecuencias y además, cualquiera de las partes es un reflejo de la otra. La forma de cálculo del tercer momento se presenta paginas adelante.

• Si una distribución de frecuencias es simétrica, la media, la mediana y la

moda coinciden en el mismo punto, cuando la figura no es simétrica los indicadores estadísticos citados son diferentes y se puede presentar una asimetría positiva, siendo (m3 > 0); o bien, una asimetría negativa, donde (m3 < 0).

Gráficamente, lo citado anteriormente está dado como:

Page 54: Libro estadistica coor1

Estadística

54

Fig. 8: Función simétrica.

Fig. 9. Funcion asimétrica positiva.

Page 55: Libro estadistica coor1

Estadística

55

Fig. 10. función asimétrica negativa Para medir en forma adimensional la asimetría de una distribución de frecuencias, se utiliza el coeficiente de asimetría por momentos. Los primeros momentos de una distribución son los siguientes: Primer momento:

Xn

)X(Xm i =

−= ∑

1

Segundo momento:

22

2 Sn

)X(Xm i =

−= ∑

Tercer momento:

nX

n)X(X

m ii ∑∑ =−

=33

3

Cuarto momento:

nX

n)X(X

m ii ∑∑ =−

=44

4

• En función de lo anterior, la medición de la asimetría (g1) de una

distribución, se define como el cociente del tercer momento con respecto a la media entre la raíz cuadrada del segundo momento, con

Page 56: Libro estadistica coor1

Estadística

56

respecto a la media elevada al cubo; está dado matemáticamente como:

( )32

31

m

mg =

Si una distribución de medias es normal, la suma de los cubos de las desviaciones positivas es igual a la suma de los cubos de las desviaciones negativas; con lo que la suma algebraica de los cubos de las desviaciones es cero, es decir, (g1 = 0). • Si la distribución es asimétrica positiva, la suma de los cubos de las

desviaciones positivas es mayor que la suma de las desviaciones negativas, con lo que (g1) es positivo.

En caso contrario, es negativo; cuando mayor sea el valor (g1) mayor será la asimetría. Cabe hacer notar que si los datos están agrupados, se puede aproximar los momentos con respecto a la media, como sigue:

∑=

−=−=m

i

kii

kiik XXfXtfm

1

____)´(´)(´

Donde: f 'i = Frecuencia relativa del intervalo (i) Xi = Representa los valores de (ti)

__

X = Media de la muestra.

Page 57: Libro estadistica coor1

Estadística

57

k = Exponente correspondiente al momento (k) Otra forma de medir la asimetría de una distribución es mediante el coeficiente de Pearson (C.P.) que se define como:

x

o

SMX

C.P.−

=

__

Donde:

__

X = Media Muestral Mo = Moda Sx = Desviación Estándar Este indicador tiene la desventaja de que solo se aplica cuando la distribución es unimodal y se puede demostrar que esta en el intervalo (-1 ≤ C.P. ≤ 1) y el criterio de decisión en torno al comportamiento de la función asociada a la asimetría es el mismo que en análisis anteriores. 4.4.2. CURTOSIS Es otra característica que permite describir la forma de la distribución de frecuencias, también conocida en la literatura especializada como apuntamiento o aplanamiento. Este último nombre es tal vez el menos indicado, pues el significado de curtosis es contrario al de aplanamiento y por lo tanto, una curtosis grande implica poco aplanamiento y viceversa. El coeficiente de curtosis está definido como:

Page 58: Libro estadistica coor1

Estadística

58

( )32

2

42 −⎥

⎤⎢⎣

⎡=

mm

g

Cuando la distribución es mesocúrtica se cumple que g2 = [(m4/m2

2) -3] = 0, por lo cual en la expresión anterior se resta este valor para que la referencia se encuentre en cero. De esta forma si g2 < 0, la distribución es platocúrtica y si g2 > 0, se trata de una distribución leptocúrtica. Gráficamente está dado como:

Fig . 11. Distribución mesocúrtica

Page 59: Libro estadistica coor1

Estadística

59

Fig. 12. Distribución leptocúrtica

Fig. 13. Distribución platicúrtica La regla general para la determinación del tipo de función de distribución en función de (g2) está dada como: g2= 0 La curva es normal mesocúrtica g2 = (-) La curva es Platicúrtica g2 = (+) La curva es Leptocúrtica Para el caso de que se trate de datos agrupados, la ecuación representativa para la determinación de momentos esta dada como:

Page 60: Libro estadistica coor1

Estadística

60

=

=

−= n

ii

n

i

rii

r

f

)X(Xfm

1

Donde: fi = Frecuencia de clase i. i = 1, 2, 3, …, n. X´i = Marca de clase. r = 1, 2, 3, ..., n, momentos. Para la explicación conceptual de los elementos anteriormente expuestos se tomara como elemento el caso, en el que se desea definir cuál es la medida relativa de asimétria para los datos listados a continuación, estos datos representan las medidas de tamaño de 6 chocolates marca patito seleccionados al azar.

CHOCOLATE MEDIDA (cm)

1 3 2 2 3 3.7 4 5 5 2.7 6 3

Solución: La medida relativa a la asimétria es dada por la ecuación de g1, así como el tercer momento por la ecuación de m3, además se deben tomar en cuenta los

Page 61: Libro estadistica coor1

Estadística

61

criterios siguientes para definir el estados de comportamiento como: g1 = 0 La distribución es simétrica. g1 > 0 La distribución es sesgada positivamente. g1 < 0 La distribución es sesgada negativamente. Para los cálculos de la medida de simetría se empleara la información mostrada en la siguiente tabla:

Xi X (X X)i − (X X)i2− (X X)i

3− 3 3.23 -0.23 0.053 -0.012 2 3.23 -1.23 1.51 -1.86

3.7 3.23 0.47 0.22 0.103 5 3.23 1.77 3.13 5.54

2.7 3.23 -0.53 0.28 -0.148 3 3.23 -0.23 0.053 -0.012

∑ 5.246 3.611

S2 = 5.246 / 6 = 0.8743 m3 = 3.611 / 6 = 0.6018 g1 = 0.6018 / 0.8176 = 0.73659 De donde se tiene que la distribución es sesgada positivamente, independientemente si se usa como indicador para la decisión a m3 o g1. Ahora bien para el caso de datos agrupados, se desea encontrar el grado de asimetría de la distribución representada por el lote de datos siguiente:

Page 62: Libro estadistica coor1

Estadística

62

LIMITE DE CLASE FRECUENCIA MARCA DE

CLASE 49-54 6 51.5 55-60 15 57.5 61-66 24 63.5 67-72 33 69.5 73-78 22 75.5

La medida de sesgo es dada en términos de m3 , como se trata de datos agrupados, inicialmente se calcula la media empleando la ecuación empleada en la sección 3.2.3., para el caso la media es dada como:

100)5.75(22)5.69(33)5.63(24)5.57(15)5.51(6 ++++

=−

X

X = 66.5 El análisis es presentado de forma tabular como:

CLASES fi MARCA

DE CLASE

X )X(Xi f (X X)i i2−

f (X X)i i

3−

49-54 6 51.5 66.5 -15 1350 -20250 55-60 15 57.5 66.5 -9 1215 -10935 61-66 24 63.5 66.5 -3 216 -648 67-72 33 69.5 66.5 3 297 891 73-78 22 75.5 66.5 9 1782 16038 ∑ 100 4860 -14904

Entonces: S2 = ( 4860/100) = 48.6

Page 63: Libro estadistica coor1

Estadística

63

m3 = -14904/100 = -149.04 g1 = -149.04/338.8 = - 0.44 De donde se tiene que la distribución es sesgada negativamente. Con los análisis realizados hasta esta etapa del trabajo, el lector podrá tener una idea clara de que función de distribución teórica le es más eficiente usar para hacer análisis estadísticos más finos y orientados hacia la estadística inferencial el muestreo, diseño de experimentos entre otros análisis susceptibles haciendo uso de la información del experimento enfocados a la toma de decisiones.

CAPITULO 5

P R O B A B I L I D A D 5.1. ESPACIOS MUESTRALES Y EVENTOS En la Estadística, al conjunto de todos los posibles resultados de un experimento se le denomina espacio muestral, el cual en lo general se denota por la letra S. Para análisis posteriores es necesario enunciar conceptos básicos como los que a continuación se citan:

Page 64: Libro estadistica coor1

Estadística

64

Datos Iniciales: Están dados como la información registrada en la forma en que se recoge, ya sean eventos, mediciones o una observación de un experimento. Experimento : Se define como cualquier proceso que sea capaz de genererar datos iniciales, o bién; "Es el proceso por medio del cual una observación o medición es registrada". Es importante hacer notar que la observación no necesariamente produce un valor numérico representativo para hacer análisis estadístico, por lo que en estudios del mundo real habrá que traducir estas apreciaciones de variables no numéricas a variables numéricas. Por ejemplo: • Registro del ingreso anual de un trabajador. • Entrevistar a un consumidor para determinar la marca preferida de un

producto determinado. • Registrar el valor de una acción de bolsa en un momento dado. • Inspeccionar una línea de ensamble para determinar si el número de artículos

defectuosos excede a los especificados. • Registro del monto de una póliza vendida por un agente de seguros. Espacio Muestral:(S) Está dado como el conjunto de todos los posibles resultados de un experimento estadístico. A continuación se muestran algunos ejemplos que permiten esquematizar un espacio muestral:

• El proceso de lanzar una moneda legal al aire, éste puede escribirse como:

S = { a, s }

Page 65: Libro estadistica coor1

Estadística

65

Donde: a = Águila s = Sello

• Sea el experimento de tirar un dado legal. Es de interés el número que aparezca en la cara superior. Para la definición de su espacio muestral, los posibles resultados del experimento están dados por: {1, 2, 3, 4, 5, 6,}, por lo que (S) es expresado como:

S = {1, 2, 3, 4, 5, 6}

Para el mismo experimento si el número es impar, el espacio muestral estará dado por:

S = {1, 3, 5} En un proceso de fabricación se seleccionan al azar 3 piezas, cada pieza se inspecciona y se clasifica en defectuosa y no defectuosa, el espacio muestral respectivo está dado como:

S = {DDD, DND, NDD, NNN, NDN, DDN, NND, DNN}

• un segundo espacio muestral que proporciona la misma información que el anterior está dado como:

S = {0, 1, 2, 3}

Donde: 0 = Ninguna pieza defectuosa 1 = Una pieza defectuosa 2 = Dos piezas defectuosas 3 = Tres piezas defectuosas

Page 66: Libro estadistica coor1

Estadística

66

En un experimento dado en muchos de los casos puede interesar la ocurrencia de ciertos eventos más que el resultado de un elemento específico del espacio muestral. Para la realización plena de un experimento se inicia haciendo notar que cada experimento produce uno o varios resultados posibles que se llaman "eventos". De tal forma que un evento es definido como un subconjunto del espacio muestral, o bien como una colección específica de puntos muestrales, éstos pueden clasificarse como evento simple y evento compuesto. Evento Simple: Es un conjunto que contiene solamente un elemento del espacio muestral, por lo cual también se le llama punto muestral. Evento Compuesto: Es aquel que puede expresarse como la unión de eventos simples. Un evento puede ser el conjunto de resultados posibles que se tienen al tirar un dado y que éstos sean divisibles entre 3, esto sucede cuando el resultado sea un elemento del subconjunto, A = 3,6. Un resultado muestral de S se llama punto muestral o muestra. Así mismo un evento (A): es un conjunto de resultados o, en otras palabras es un subconjunto del espacio muestral S.

• El evento ⎨a⎬ que consta de una muestra simple implica que a ∈S se llama evento elemental o simple.

• El Conjunto vacío φ y S de por sí son eventos. • φ en algunas veces es evento imposible. • S es el evento cierto o seguro. Se pueden combinar eventos para formar nuevos eventos, utilizando las diferentes operaciones con conjuntos:

Page 67: Libro estadistica coor1

Estadística

67

• A∪B es el evento que sucede si y solo si A ó B o ambos suceden. • AIB es el evento que sucede si y solo si A y B suceden simultáneamente. • Ac (Complemento de A), es el evento que sucede si y solo si A no sucede. • Dos eventos mutuamente excluyentes si se da AIB = φ, no pueden suceder

de forma simultanea los eventos. 5.1.1.- OPERACIONES CON EVENTOS INTERSECCION DE DOS EVENTOS Esta operación es representada como BA I , es el evento que contiene a todos los elementos que son comunes a A y a B; otra forma de expresarlo está dada como todos los elementos que pertenecen tanto a A como a B.

Page 68: Libro estadistica coor1

Estadística

68

Gráficamente puede expresarse como:

De la figura anterior se tiene que matemáticamente puede representarse como:

{ }Bxy,A,xxBA ∈∈=I Si los elementos que integran los eventos (A, B) están dados como: A = {1, 2, 3, 4, 5} y B = {2, 4, 6, 8} Entonces:

=BA I {2, 4}

Page 69: Libro estadistica coor1

Estadística

69

Gráficamente:

Sean los eventos P y Q dados como:

P = {a, e, i, o, u}

Q = {r, s, t} La intersección de dichos eventos estará dado como:

.QP φ=I (No tienen elementos en común) =.φ Conjunto vacío.

EVENTOS MUTUAMENTE EXCLUYENTES. Dados los eventos A y B estos son mutuamente excluyentes cuando se cumple que =BA I φ. , lo anterior implica físicamente que estos no pueden ocurrir simultáneamente.

Page 70: Libro estadistica coor1

Estadística

70

Usando el diagrama de Venn puede ser expresado como:

• Para ejemplificar el caso, se tomará como referencia el experimento de

lanzamiento de un dado legal donde los posibles resultados pueden expresarse como:

A = { Número par } = {2, 4, 6} B = { Número impar } = {1, 3, 5} Entonces: φ=BA I ; de donde se observa que los eventos A y B no tienen ningún elemento común por lo que su intersección es el conjunto vacío. UNION DE EVENTOS. La unión de dos o más eventos es expresada por la interrelación de eventos a través del símbolo (∪ ), sean los eventos A y B; su unión es expresada como B)(AU y este es el evento que contiene a todos los elementos

Page 71: Libro estadistica coor1

Estadística

71

que pertenecen a A, a B o a ambos. Por ejemplo sean los posibles resultados de un experimento dados por: A={2, 4, 6}; B={4, 5, 6} A BU = {2, 4, 5, 6}

Esto implica que:

{ }A B X X A o X BU = ∈ ′ ∈, Ejemplo: Sí, M = {X ⎜ 3 < X < 9 } N = { Y ⎜ 5 < Y < 12 } M NU = { Z ⎜ 3 < Z < 12 } COMPLEMENTO EL complemento de un evento A con respecto a (S), es el conjunto de todos los elementos de (S) que no están en A. Gráficamente:

Page 72: Libro estadistica coor1

Estadística

72

Por lo que: complemento de A = CA

CA = S - A = B 5.2. TECNICAS DE ENUMERACION Y CONTEO. Si una operación se puede efectuar en n1 formas y si para cada una de ellas se puede efectuar una segunda operación n2 formas, entonces las dos pueden efectuarse conjuntamente en (n , n )1 2 formas. Para el caso de la determinación de cuantos puntos hay en (S) cuando se tiran dos dados legales a la vez. n1= 6, n2 = 6 Entonces:

n , n1 2 = S = 36 puntos. Cada dado puede adoptar 6 posibles resultados al ser lanzado por lo que el espacio muestral (S) está dado por:

Page 73: Libro estadistica coor1

Estadística

73

S =

⎢⎢⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥⎥⎥

11 12 13 14 15 1621 22 23 24 25 2631 32 33 34 35 3641 42 43 44 45 4651 52 53 54 55 5661 62 63 64 65 66

Extensión: Si una operación se puede efectuar en (n )1 formas, si para cada una de ellas se puede efectuar una segunda operación (n )2 formas y si para cada una de las dos primeras se puede efectuar una tercera operación (n )3 formas y así sucesivamente, entonces la secuencia de (k) operaciones puede realizarse en )n,...,n,n,(n k321 formas. Entre las técnicas poco sofisticadas de conteo se tienen las citadas anteriormente (Principio multiplicativo del conteo), dentro de las herramientas usuales para análisis del tema se tienen la aplicación de los diagramas de árbol. Como vehículo de explicación de la técnica se aplicará la misma a los ejemplos citados. Ejemplo: En el restaurante "La Amiba Dorada" de Ciudad Universitaria se ofrece un menú de tres componentes. a). Una sopa (S) o una bebida (D) como aperitivo. b).- Una selección de filete (R), Pavo (T) o Pescado (F) de plato principal. c).- Una selección de dulce (P) o helado (I), como postre. Una selección de cada componente constituye una comida completa, construir un diagrama de árbol e indicar el número posible de comidas completas, lo que implicara el espacio muestral.

Page 74: Libro estadistica coor1

Estadística

74

Solución:

Page 75: Libro estadistica coor1

Estadística

75

De acuerdo al diagrama de árbol, mostrado para el caso se tienen 12 comidas completas posibles, que puede ofrecer La Amiba Dorada. Por lo tanto, el espacio muestral es dado como:

[ ]DFIDFPDTIDTPDRIDRPSFISFPSTPSRISRP=S

Ejemplo: En una caja registradora se encuentran solamente tres monedas: una de un Peso (P), una de cinco pesos (C), una de diez pesos (D); se sacan dos de las monedas, primero una y después otra, para encontrar el número total de formas de realizar el experimento se analizará como sigue: Existen tres formas de seleccionar la primera moneda y, una vez hecho hay dos formas de seleccionar la segunda, por lo tanto.

21 n,n = 3(2) = 6 formas Para determinar (S) se hace uso de un diagrama de árbol, como se muestra:

Page 76: Libro estadistica coor1

Estadística

76

PC

PD

CP

CD

DP

DCC

P

D

P

D

C

P

C

D

DIAGRAMA DE ARBOL DEL PROBLEMA DE LA CAJA REGISTRADORA. De donde se tiene que (S) queda como:

S = [ PC, PD, CP, CD, DP, DC ] 5.3. PERMUTACIONES En general, si (r) objetos se eligen de un conjunto de (n) objetos distintos, cualquier arreglo u ordenación de ellos que guarda cierto orden (importa el orden de registro) se denomina permutación; en lo general una permutación es un arreglo de todo un conjunto de objetos o parte del mismo.

Page 77: Libro estadistica coor1

Estadística

77

Por ejemplo es de interés determinar el número de permutaciones posibles del conjunto de letras (a, b, c). En lo general se tiene que (n) objetos distintos pueden arreglarse de (n!) formas; por lo que: n! = 3(2)(1) = 6 Formas. Entonces las permutaciones posibles están dadas:

(abc, cba, bac, acb, bca, cab) Por definición: 1! = 1 ; 0! = 1 Para una ecuación que proporcione el número total de permutaciones de (r) objetos escogidos entre un conjunto de (n) objetos distintos, se observa que la primera elección se realiza en el conjunto completo de (n) objetos, la segunda se efectúa de los (n-1) objetos que quedan después de la primera elección , la r-ésima elección de los (n - (r-1)) = n - r + 1 objetos, los cuales quedan después de las primeras (r-1) elecciones que se han realizado. Por lo tanto, por la regla de multiplicación de opciones, el número total de permutaciones de (r) objetos elegidos de un conjunto de n objetos distintos es:

nPr = n (n - 1)(n - 2)......(n - r + 1) Para expresar la ecuación para (nPr) en términos de factoriales se multiplica y divide por (n - r)! la ecuación anterior quedando:

r)!(nn!

r)!(nr)!)(nr)...(n)(nn(n

n−

=−

−+−−−=

121Pr

De tal forma que: "El número de permutaciones de r objetos escogidos de n

Page 78: Libro estadistica coor1

Estadística

78

objetos distintos es:

r)!(nn!

n−

=rP

Ejemplo: De un conjunto de 20 billetes de lotería se sacan dos para el primero y segundo premio, encontrar el número de elementos que integra S. Solución: Para n = 20 y r = 2

380!18!20

)!220(!20P220 ==

−=

Ejemplo: Un mueble consta de 5 componentes diferentes que pueden ser ensamblados en cualquier orden. De cuántas formas puede ser ensamblado el mueble?. Solución: n = 5, r = 5

120!51!5

)!55(!5P55 ===

−=

Ejemplo: Es de interés determinar el número y forma de acomodo de las permutaciones de clase 2 que pueden formar con las 5 primeras letras del alfabeto.

Page 79: Libro estadistica coor1

Estadística

79

Solución.

206

1206!5

)!25(!5P25 ===

−=

Dadas como:

eddccdbeaeecdecebdadebdbcbbcaceadacaba ab

⎥⎥⎥⎥

⎢⎢⎢⎢

Considérese ahora el número de permutaciones distintas de n objetos en los cuales n1 son de una clase, n2 de una segunda clase y nk de una k-ésima clase, de tal forma que n1+ n2+...+ nk = n. De lo anterior se tiene que el número de permutaciones está dado como:

!!...n!n!nnn!P

k321

=

Ejemplo: De cuantas formas diferentes pueden arreglarse tres focos verdes, cuatro morados y dos azules en una serie navideña que contiene nueve portafocos? El número total de arreglos diferentes usando la ecuación anterior es:

Page 80: Libro estadistica coor1

Estadística

80

1260!2!4!3

!9==P

Para arreglos de elementos en forma circular se tiene: Teorema: el número de permutaciones de n objetos distintos arreglados en forma circular es (n-1)!.

Es frecuente que se requiera encontrar el número de formas de partir un conjunto de n objetos en r subconjuntos llamados celdas. La partición puede obtenerse si la partición de cada par posible de los r subconjuntos es el conjunto vacío φ y si la unión de todos los subconjuntos es igual al conjunto original. El orden de elementos dentro de una celda carece de importancia, considerando el conjunto {a, e, i, o, u}. Las particiones posibles en dos celdas, en las que la primera contenga cuatro elementos y la segunda contenga un elemento, son {(a, e, i, o), (u)}, {(a, i, o, u), (e)}, {(e, i, o, u), (a)}, {(a, e, o, u), (i)}, {(a, e, i, u), (o)}, se observa que hay cinco formas de hacer la partición de un subconjunto de cinco elementos en dos subconjuntos o celdas que contengan cuatro elementos en la primera celda y uno en la segunda. Esto puede trabajarse a través del uso del siguiente: Teorema: El número de formas de hacer la partición de un conjunto de n objetos en r celdas con n1 elementos en la primera celda, n2 elementos en la segunda y así sucesivamente es.

!!!!

,...,, 2121 rr ...nnnn

nnnn

=⎟⎟⎠

⎞⎜⎜⎝

Page 81: Libro estadistica coor1

Estadística

81

Donde:

n1+n2+ ...+nr = n Ejemplo: ¿ De cuantas formas se pueden alojar siete científicos de fuzzy logic en un cuarto triple y en dos cuartos dobles del hotel “ El Impreciso “ de Morelia para su congreso de Noviembre de 2006 ?. Solución: El número total de particiones posibles es:

Dónde: 7 = Número de científicos. 3 = Habitación triple. 2 = Habitación doble. 5.4.- COMBINACIONES. En muchos casos de la vida real es de interés determinar el número de formas de seleccionar r de n objetos sin importar su orden. A estas selecciones se les llama combinaciones. Una combinación es en realidad una partición con dos celdas, conteniendo una de ellas los r objetos seleccionados y la otra los (n-r)

objetos restantes, el número de tales combinaciones, indicado por ⎟⎟⎠

⎞⎜⎜⎝

⎛− rnr

n,

, se

escribe generalmente como ⎟⎟⎠

⎞⎜⎜⎝

⎛rn

, ya que el número de elementos en la segunda

celda debe ser (n-r).

formas210!2!2!3

!72,2,3

7==⎟⎟

⎞⎜⎜⎝

Page 82: Libro estadistica coor1

Estadística

82

Se llaman combinaciones de clase (r) de (n) objetos diferentes, a los distintos grupos que se pueden formar tomando r objetos de entre los n. Las combinaciones se diferencian entre sí por la naturaleza de algún elemento ya que, en este caso, no interesa el orden de los objetos que integran cada combinación. La omisión de orden distingue las combinaciones de las permutaciones. De lo anterior se tiene que: "El número de combinaciones de n objetos distintos tomados de r a la vez, es: "

( )r)!r!(n

n!C nrrn −

==

Por ejemplo, las combinaciones de clase 2 que se pueden formar con las 5 primeras letras del alfabeto son:

10C

1012120

)]1)(2(3)[1(2)1)(2)(3)(4(5

!3!2!5C

25

25

=

====

Dados como:

⎟⎟⎠

⎞⎜⎜⎝

⎛dececddbbdbcaeadacab

Page 83: Libro estadistica coor1

Estadística

83

Ejemplo: : Una tabla de (12" x 3/4" x 8') de Pino, puede ser comprada de cualquiera de 5 proveedores. De cuántas formas se pueden escoger tres de los cinco proveedores ?. Solución:

formas.10C

1012

120!2!3

)1)(2)(3)(4(5)!35(!3

!5C

35

35

=

===−

=

Ejemplo: Una comisión formada por tres Contadores Públicos y cuatro profesores (De la FCCA-UMSNH) será nombrada en la SHCP, ¿Cuántos comités diferentes pueden formarse si hay cinco Contadores Públicos y siete profesores como candidatos?. Solución: De los cinco C.P., pueden elegirse tres en cualquiera de las ( 5C3 ) maneras y de los siete profesores pueden elegirse cuatro entre cualquiera de las ( 7C4 ) maneras. Entonces el número de comités está dado en función de un producto de combinaciones dadas como:

350!3!4

!7x!2!3

!5C*C 4735 == Comites diferentes

Ejemplo: Determinar el número de maneras que puede seleccionarse un equipo de 9 personas a partir de un grupo de 12. Este es un problema de selección y no de ordenación, dado que no se toma en cuenta la asignación de posiciones. Por lo que n = 12, r = 9, de tal forma que el número de combinaciones es 12C9 = 220.

Page 84: Libro estadistica coor1

Estadística

84

Ejemplo: En un grupo de 5 hombres y 4 mujeres, ¿ de cuántas formas es posible seleccionar 3 hombres y a 2 mujeres’. a). Se pueden seleccionar 3 hombres de 5 en 5C3 forma. b). Es posible seleccionar 2 mujeres de 4 en 4C2 maneras. Usando el principio fundamental de las selecciones, es posible llevar a cabo (a) y (b) en 5C3 y 4C2 formas. Por lo que:

3C5 * 4C2 = 602

3*4*2

4*5=

Page 85: Libro estadistica coor1

Estadística

85

CAPITULO 6

INTERPRETACIONES DEL CONCEPTO DE PROBABILIDAD Históricamente, la primera aplicación, de la teoría de la probabilidad se hizo en juegos de azar. Los experimentos aleatorios asociados con juegos de azar dieron lugar a espacios muéstrales con un número finito de puntos. La probabilidad es considerada como una de las áreas de la matemática de la incertidumbre, aunque esta materia constituye por derecho propio, una rama principal de la matemática, en análisis normales como una alternativa económica, se sugiere muestrear la población y, analizando una o más muestras, inferir que la población posee ciertas propiedades. Por supuesto, siempre que se llega a conclusiones sobre una población de la que sólo se ha examinado una parte de ella, existirá un elemento de incertidumbre. Tales son los casos en que el estadístico necesita la probabilidad, por medio de la cual mide la incertidumbre. Considerando las expresiones: “si juega este juego probablemente perderá”, “el titular del cargo probablemente ganará la reelección”. Cada una de estas expresiones representa una conclusión frente a la incertidumbre. Por ejemplo, la persona que hace esta primera afirmación evidentemente dice que aunque no está segura del resultado del juego, las evidencias le inducen a pensar que si se decide usted a jugar, es más probable que pierda a que gane. Lo que falta en estas afirmaciones es una indicación de grado de incertidumbre que esta presente. Entre las interpretaciones de la probabilidad se tienen:

Page 86: Libro estadistica coor1

Estadística

86

6.1. CLASICA O DE LAPLACE (FINES DEL SIGLO XVII). Establece que si se desea asignar la probabilidad de ocurrencia de un evento A, esta es igual al cociente del número de puntos muéstrales del evento Na sobre el número de puntos muéstrales de N, es decir el número de veces que ocurre dicho resultado del experimento en términos del espacio muestral población o tamaño de la muestra, la ecuación representativa es descrita como:

NNaAP =)(

Donde: P(A) = Probabilidad de ocurrencia del evento A. Na = Número de veces que ocurre el resultado de A. N = Tamaño de la Población o muestra analizada. Las limitaciones que presenta esta interpretación clásica son las siguientes. a). Es necesario que cada resultado del experimento tenga la misma probabilidad de ocurrir (que sea aleatorio). b). En algunos experimentos el número total de resultados es demasiado grande o muy difícil de determinar, como por ejemplo, cuando se desea calcular la probabilidad de que mañana cierta subestación reciba una descarga eléctrica durante una tormenta. O bien conocer la probabilidad de que mañana suban la tasa de impuesto al contribuyente medio en la ciudad de Morelia. Ejemplo: Un fabricante de computadoras personales sabe que está por recibir pedidos de los clientes C1 y C2, dichos pedidos pueden ser de 1 a 5 unidades. El espacio muestral correspondiente estará dado por el conjunto de eventos de S, mostrado como:

Page 87: Libro estadistica coor1

Estadística

87

⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢

=

55 54 53 52 5145 44 43 42 4135 34 33 32 3125 24 23 22 21

15 14 13 12 11

S

En donde (i,j) denotan el evento simple: { C1 demanda (i) computadoras y C2 demanda (j) computadoras}, se tienen 25 eventos simples, de los cuales se pueden determinar eventos compuestos tales como: α = {Que ambos clientes demanden el mismo número de unidades; i=j}. β = { Que la suma de las demandas este entre 6 y 10 unidades; 6≤ i+j≤ 10} γ = { Que la suma de las demandas sea a lo más de 3 unidades ; i+j ≤ 3} Considerando que los eventos elementales tienen la misma probabilidad de ocurrencia, calcular la probabilidad de los eventos (α, β, γ).

255)( ==

NNP αα

2515)( =βP

253)( =γP

Ejemplo: de 6700 deportistas que se inscribieron en un curso de formación de instructores en el país en 1999, 1500 no terminaron, 2000 obtuvieron un puntaje inferior al requerido para acreditar el curso y el resto lo acredito.

Page 88: Libro estadistica coor1

Estadística

88

Si la CONADE selecciona al azar un deportista participante en el curso y con base en la información anterior, se desea conocer cuál es la probabilidad de que dicho deportista: a). No termine el curso. b). Acredite el curso. Solución: a). Sea el evento: A = { no termine el curso} Por lo que: X = 1500; n = 6700, entonces: P(A) = Na/n = 1500/6700 = 0.224 b). Sea el evento: B = { acredite el curso} Por lo que: X = 6700-1500-2000 = 3200 P(B) = 3200/6700 = 0.478 Ejemplo: Dos monedas legales se lanzan 4 veces al aire, cual determinar cual es la probabilidad de obtener al menos una cara. Solución: Sean los eventos A = cara, X = sol S = {XX, AX, XA, AA} Entonces: P(A) = 3/4 = 0.75 Ejemplo: Se saca un naipe de una baraja, encuentre la probabilidad de que este sea corazón.

Page 89: Libro estadistica coor1

Estadística

89

Solución: S = 52 piezas A = Corazones = 13 P(A) = 13/52 P(A) = 0.25

6.2. FRECUENCISTA O DE VON MISES (1957) Examínese una sucesión de n experimentos iguales. Supóngase que, como resultado de cada experimento, se registra la llegada de una señal evento A o llegada evento A’ de intervalos iguales de tiempo. En ésta sucesión, una característica del evento A es la frecuencia de su realización, es decir, la relación entre el número de veces que este evento se produce y el número total de experimentos realizados. Si el evento A ocurre X veces en n experimentos, entonces la probabilidad P(A) se define como el límite de frecuencia relativa.

nXf =

Cuando el número de experimentos tiende a infinito, es decir:

)(bien o )( APnX

nXLimAP

n⎯→⎯=

∞⎯→⎯

Las limitaciones que presenta la interpretación frecuencista están dadas en función de: “ No se puede aplicar cuando el experimento aleatorio no es repetible o bien cuando es repetible pero cambian las condiciones del experimento”.

Page 90: Libro estadistica coor1

Estadística

90

6.3. SUBJETIVISTA (1969) la escuela subjetivista considera que la probabilidad es una medida del grado de incertidumbre que tiene una persona o un grupo de personas respecto a la verdad de una afirmación o a la ocurrencia de un hecho. Por ejemplo, cuando un analista requiere determinar la probabilidad de que baje el precio del petróleo más de dos dólares por barril en el presente año, puede utilizar la interpretación subjetivista para estimar la probabilidad de un evento, tomando en cuenta su experiencia y tal vez la de otras personas que conozcan sobre el tema. De otra forma no podría obtener esta probabilidad debido a que el evento no es repetible. Las limitaciones que presenta este enfoque, están en función de que la misma tiene el inconveniente de que la probabilidad asignada cambie de una persona a otra y en ocasiones puede presentar inconsistencia en una misma persona cuando esta aumente su conocimiento sobre el fenómeno en estudio. 6.3.1. LOS AXIOMAS DE LA PROBABILIDAD La validez matemática de cualquier resultado derivado a través de la aplicación correcta de la teoría axiomática de las probabilidades es cierta, sin importar cómo interpreta el analista el significado de la medida de probabilidad ni cuál fue su origen, mientras la asignación de los pesos sea compatible con tres axiomas sencillos. Usaremos la notación P(A), para denotar la probabilidad de un suceso A, que frecuentemente se llama suceso aleatorio . Se deben cumplir las siguientes condiciones para las probabilidades asignadas a los sucesos del espacio muestral mostradas a continuación. Así mismo se considera que P(A) su resultado sea el valor de una función aditiva de conjunto que satisface: Axioma 1: 0 ≤ P(A) ≤ 1 Axioma 2: P(S) = 1

Page 91: Libro estadistica coor1

Estadística

91

Axioma 3: Si A y B son eventos mutuamente excluyentes en S, entonces

P(A ∪ B) = P(A) + P(B) El primer axioma establece que las probabilidades son números reales que varían entre 0 y 1. El segundo axioma afirma que el espacio muestral completo se le asigna una probabilidad de 1 y esto expresa la idea de que la probabilidad de un cierto evento que puede suceder presenta probabilidades de ocurrencia entre 0y 1 de acuerdo al axioma 1. El tercer axioma establece que las funciones de probabilidad deben de ser aditivas. Es importante subrayar que los axiomas de probabilidad no proporcionan una forma de asignar probabilidades a los diversos resultados de un experimento, tan solo limitan la forma en que estos pueden hacerse. En la practica las probabilidades se asignan con base a la experiencia, con el apoyo de un análisis cuidadoso de las condiciones que rodean el experimento y hasta por medio de suposiciones y evaluaciones subjetivas, como la suposición común de que todos los resultados tienen la misma probabilidad de ocurrencia. 6.3.2. TEOREMAS FUNDAMENTALES DE LA PROBABILIDAD Apoyándose en la inducción matemática se tiene que cualquier número de eventos mutuamente excluyentes pueden ser escritos como: Teorema 1. Si A1, A2,...,An son eventos mutuamente excluyentes en un espacio muestral S, entonces.

)(...)()(),...,( 2121 nn APAPAPAAAP +++=∪∪∪ Como vehículo de explicación del concepto se tomará el ejemplo siguiente. En el Laboratorio de computación de la FCCA-UMSNH se encuentran 15 computadoras, de las cuales 5 están descompuestas. Si una persona toma al azar 3 de ellas, ¿ cuál es la probabilidad de que por lo menos una de las tres

Page 92: Libro estadistica coor1

Estadística

92

computadoras de este laboratorio este descompuesta?. Solución: La condición de que por lo menos una de las 3 computadoras este descompuesta (evento A), se cumplira si ocurre cualquiera de los siguientes 3 eventos mutuamente excluyentes. 1D = { una descompuesta y dos no} 2D = { dos descompuestas y una no} 3D = { tres descompuestas} El evento A se puede representar como la unión de los eventos anteriores, por lo que:

A = {1D ∪ 2D ∪ 3D}, por el teorema 1. P(A) = P(1D)+P(2D)+P(3D) P(1D): se calcula tomando en cuenta que de 5 computadoras descompuestas, se selecciona 1. Y de 10 no descompuestas se seleccionan 2., entonces: 10C2 = 10 ! / 2!(8!) = 45 forma de hacer la selección. Las formas de elegir una defectuosa (1D) es: 5 defectuosas; 225 formas de seleccionar las no defectuosas. D(10C2) = 5(45) = 225 formas. El número de casos totales es: 15C3 = 15 ! / 3!(12!) = 455 De tal forma que:

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛==

210

15

con trabajar;495.0455225)1( DP

Page 93: Libro estadistica coor1

Estadística

93

22.0110

45525

)2( =⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

=DP

022.045535

)3( =⎟⎟⎠

⎞⎜⎜⎝

=DP

Por lo que: P(A) = 0.495 + 0.22 + 0.022 = 0.737. probabilidad de que por lo menos alguna este descompuesta. Ejemplo: En el área de pruebas físico mecánicas del laboratorio de la FITECMA se han realizado diversa pruebas destructivas a la especie de pinus martinezi larsen, a través de las cuales se pretende darle una aplicación industrial más adecuada. La probabilidad de que la citada especie califique como muy mala, pobre, razonable, buena, muy buena o excelente para la construcción (como elemento estructural) es de {0.05, 0.15, 0.04, 0.06, 0.41, 0.29} respectivamente. ¿ Cuales son las probabilidades de que la especie califique como? a). muy mala ó pobre ó razonable ó buena. b). Buena ó muy buena ó excelente. Solución: para el caso particular se tiene que todas las probabilidades se excluyen mutuamente, por lo que es aplicada la forma propuesta por el teorema 1. a). P(A1 ∪ A2 ∪ A3 ∪ A4 ) = P(A1) + P(A2) + P(A3) + P(A4) = 0.05 + 0.15 + 0.04 +0.06 = 0.3

Page 94: Libro estadistica coor1

Estadística

94

b)- P(A4 ∪ A5 ∪ A6 ) = 0.06 + 0.41 + 0.29 = 0.76 Teorema 2. Si A es un evento en el espacio muestral finito S, entonces P(A) es igual a la suma de las probabilidades de todos los resultados individuales incluidos en A. Para el caso sean {E1 ∪ E2 ∪ E3 ∪ ,....., ∪ En}. Donde Ei; i = 1, 2, 3, ..., n; son resultados mutuamente excluyentes por lo que de acuerdo al teorema 1, se tiene que. P(A) = (E1 ∪ E2 ∪ E3 ∪ ,....., ∪ En) = P(E1) + P(E2) + ...+ P(En) = P(S) = 1 El caso anterior es llamado comúnmente como teorema de probabilidades totales. Ejemplo: Considérese el experimento de extraer al azar una carta de una baraja ordinaria de 52 cartas. Encontrar la probabilidad de que sea rey o reyna. Solución: Sean los eventos: E1 = la carta es un rey. E2 = la carta es una reyna. De donde se tiene que: n(E1) = número de formas diferentes que puede ocurrir E1. n(E2) = número de formas diferentes que puede ocurrir E2. En una baraja hay cuatro reyes y cuatro reynas por lo que. n(E1) = 4 ; n(E2) = 4 ; n(S) = 52

Page 95: Libro estadistica coor1

Estadística

95

P(E1 ∪ E2) = P(E1)+P(E2) = {n(E1)/n(S)} + {n(E2)/n(S)} = 4/52 + 4/52 = 2/13 Teorema 3 (Regla Aditiva) Se utiliza para encontrar la probabilidad del evento A o B (A ∪ B). Esta regla llamada unión, se refiere a la ocurrencia, ya sea del evento A, del evento B o de A y B, Si A y B son dos eventos cualesquiera, los cuales no son mutuamente excluyentes entre si entonces se tiene que la ecuación representativa es:

P(A ∪ B) = P(A ó B) = P(A) + P(B) – P(A ∩ B) P(A ∪ B) = P(A) + P(B) – P(A y B)

La Regla Aditiva se utiliza para encontrar la probabilidad del evento A o B (A ∪ B), esta regla llamada unión, se refiere a la ocurrencia, ya, sea, del evento A, del evento B o de A y B. Considérese el diagrama de Venn; la P(A ∪ B) es la suma de pesos de los puntos muestra en (A ∪ B) por lo que P(A) + P(B) es la suma de todos los pesos en A más todos los pesos en B. Por lo anterior se tiene que se ha sumado dos veces el peso de (A ∩ B), y que la suma de P(A ∩ B) da como resultado.

Page 96: Libro estadistica coor1

Estadística

96

Se debe sustraer una vez (A ∩ B) para obtener el resultado real de:

P(A ∪ B) = P(A) + P(B) - P(A ∩ B). La aplicación de esta ecuación se hace cuando los eventos tratados no son mutuamente excluyentes entre si. Ejemplo: En una planta industrial trabajan 150 empleados, los cuales están clasificados de la siguiente forma: • 90 Tienen experiencia en la elaboración del producto A. • 50 Tienen experiencia en la elaboración del producto B. • 30 Tienen experiencia en la elaboración de ambos productos. ¿ Cuál es el (%) de empleados que pueden elaborar uno, otro ó ambos productos? Solución:

El (%) de empleados que se piden para el caso, se calcula a través del uso de la ecuación representativa del teorema 3, dada como: P(A ∪ B) = P(A) + P(B) - P(A ∩ B).= {90/150 + 50/150} – {30/150} = 0.733

Page 97: Libro estadistica coor1

Estadística

97

Lo que implica que el 73.3 % de los empleados, pueden elaborar uno, otro ó ambos productos. Cuando los eventos son mutuamente excluyentes, su forma de cálculo está dada como se muestra.

P(A ∪ B) = P(A) + P(B) Este caso es derivado de la regla aditiva debido a que: P(A ∩ B) = φ = P(φ) = 0 Como se muestra en la figura siguiente.

Ejemplo: La probabilidad de que un estudiante de la FCCA apruebe Contabilidad I es de 2/3, la probabilidad de que apruebe Procesamiento de Datos es de 4/9. Si la probabilidad de que apruebe las dos es de 4/5. cual es la probabilidad de aprobar ambas?.

Page 98: Libro estadistica coor1

Estadística

98

Solución. Sean los eventos: A = Contabilidad (2/3). B = Aprobar Procesamiento de Datos (4/9). C = Aprobar las dos (4/5). C = (A ∩ B). P(A ∪ B) = P(A) + P(B) - P(A ∩ B) = (2/3) + (4/9) - (4/5). = 0.31 Gráficamente esta dado como se muestra.

Page 99: Libro estadistica coor1

Estadística

99

TEOREMA 4. Si A y A' son eventos complementarios, entonces: P(A') = 1 - P(A) Para el caso: A ∪ A' = S P(S) = 1.0 P(S) = P(A ∪. A') P(A ∪ A') = 1.0 P(A) + P(A') = 1.0 P(A') = 1.0 - P(A). Ejemplo: Una moneda se tira al aire 6 veces consecutivas. Determinar cual es la probabilidad de que salga al menos una águila. Solución. S = 26 = 64 ; puntos muéstrales. Evento. E = Que ocurra al menos una águila. E'= Que no ocurra ninguna cara (cuando todos los tiros son ceros). P(E) = 1.0 - P(E')

Page 100: Libro estadistica coor1

Estadística

100

P(E) = 1.0 - (1/64) = 63/64 = 0.984. Ejemplo: Sí se lanzan dos monedas legales al aire. Encontrar la probabilidad de obtener al menos una águila A. Solución: El espacio muestral esta dado como : S = { AA, AS, SA, SS } Eventos. S = Sol. A = Águila. E = Obtener al menos una águila. E'= No obtener águilas. P(E) = 1 - P(E') P(E) = 1 - (1/4) = 3/4 = 0.75. Ejemplo: una compañía distribuidora de equipos electromecánicos ha registrado el número de aparatos de tipo W que solicitan sus clientes semanalmente. Un resumen de dichos datos se muestra en la siguiente tabla:

No de Aparatos Frecuencia (veces) 0 2 1 5 2 9 3 4 4 1 5 1

Page 101: Libro estadistica coor1

Estadística

101

Total 22 Se desea encontrar cuál es la probabilidad de que en la próxima semana se soliciten: a). Más de un aparato. b). A lo, más 3 aparatos. c). Entre 2 y 4, ó más de dos aparatos. Solución: a). Sean los eventos: A = { solicitan más de un aparato} Ci = { solicitan i aparatos } Entonces: A = { C2 ∪ C3 ∪ C4 ∪C5 } Pero: P(A) = 1- P(A´) Por lo que: A´ = { C0 ∪ C1} , P(A´) = { C0 ∪ C1} = P(C0) + P(C1) = {2/22 + 5/22 } = 7/22 Por lo tanto: P(A) = 1 – 7/22 = 15/22 b). Sea el evento: B = {solicitan a lo más tres aparatos}

Page 102: Libro estadistica coor1

Estadística

102

B = { C0 ∪ C1 ∪ C2 ∪ C3 } P(B) = P(C0 ) + P(C1) + P(C2) + P(C3) P(B) ={ 2/22 + 5/22 + 9/22 + 4/22 } = 20/22 c). Sean los eventos: C = {solicitan entre 2 y 4 aparatos} D = {solicitan más de 2 aparatos} C = { C2 ∪ C3 ∪ C4 } D = { C3 ∪ C4 ∪ C5 } De acuerdo a los datos: P( C) = 14/22; P(D) = 6/22, P(C ∩ D) = 5/22 Por lo tanto: P(C ∪ D) = P(C) + P(D) – P(C ∩ D) = {14/22 + 6/22 – 5/22} = 15/22 ESPERANZA MATEMATICA Para poder resumir una distribución de probabilidad, se calcularán sus características principales; la media y la desviación estándar, aunque se trabajará solamente en el caso de fenómenos discretos, se debe mencionar que existen formas análogas para poder obtener la media y la desviación estándar para fenómenos continuos.

Page 103: Libro estadistica coor1

Estadística

103

VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA: El valor esperado de algún fenómeno aleatorio discreto se puede considerar como su promedio ponderado sobre todos los valores posibles. Para obtener esta medida de resumen se calcula la media aritmética de todos los valores posibles en la distribución de probabilidad ponderados por las respectivas probabilidades. Por lo tanto E(X) o μ, es el valor esperado de la variable aleatoria X, se puede expresar como:

∑=

==n

iii XPXXE

1)()(μ

Donde: E(X) = valor esperado de X X = Variable aleatoria discreta de interés Xi = i–ésimo valor de X. P(Xi) = probabilidad de ocurrencia del i-ésimo valor de X, i = 1, 2, ..., n También ésta medida es más un promedio ponderado sobre los valores de la función de densidad. Ejemplo: Supóngase el experimento del lanzamiento de un dado legal y se desea conocer el valor esperado de cada tiro, puede ser calculado en función de la distribución de probabilidad teórica como:

RESULTADO PROB. DE OCURRENCIA 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6

Page 104: Libro estadistica coor1

Estadística

104

Se Tiene que:

Donde: E(X) =μ = 1(1/6) + 2(1/6) + 3(1/6) + 4(1/6) + 5(1/6) + 6(1/6) = 3.5 El resultado obtenido literalmente no es significativo, ya que no es posible obtener una cara de 3.5 en el dado. No obstante, cabe esperar observar las 6 caras diferentes con igual probabilidad de que, a la larga, con muchas tiradas, el valor promedio sería 3.5. Para que este resultado sea representativo, se introduce el siguiente juego en una lotería: ¿ cuánto dinero se estaría dispuesto a apostar a fin de tener la oportunidad de tirar un dado legal si se fuera a cobrar, en, pesos, el importe de la cara del dado?. Como el valor esperado de un tiro del dado legal es de 3.5, la recompensa, a largo plazo, es de $ 3.5 por tirada, es decir, en cualquier tirada particular la recompensa será $ 1, $ 2,...., $ 6; pero en muchas, muchas tiradas se puede esperar que la recompensa promedio es de $ 3.50 por tirada. Si se quiere que el juego sea legal, ni el jugador ni el oponente (la casa) debe tener ventaja. Entonces hay que estar dispuestos a pagar $ 3.50 por tiro para jugar. Si la casa quiere cobrar $ 4.00 por tiro, hay que esperar pérdida con ese juego en promedio de $ 0.50 por tiro, por lo que es recomendable abstenerse de jugar.

∑=

==n

iii XPXXE

1)()(μ

Page 105: Libro estadistica coor1

Estadística

105

6.3.3. PROBABILIDAD CONDICIONAL. En muchas ocasiones es necesario conocer numéricamente la probabilidad de un evento B si se sabe que ha ocurrido un evento A. Esta probabilidad es llamada Probabilidad Condicional de B dado A, para el caso A y B son eventos en S y P(B) es diferente de cero, la probabilidad citada se representa como P(B/A). En este caso A sirve como un espacio muestral nuevo (reducido), y la probabilidad es la fracción de P(A) que corresponde a A ∩ B, matemáticamente está representada como:

]A) [P(P(A)

B)P(AA)P(B 0/ ≠=I

De igual forma la probabilidad condicional de A dado B esta dada.

]B) [P(P(B)

B)P(AP(A/B) 0≠=I

En este caso se esta esencialmente calculando la probabilidad P(A) con respecto al espacio muestral reducido de A en vez del espacio muestral original S. P(A|B) implica que tan probable es que estemos en A sabiendo que debemos estar en B. La probabilidad condicional de A dado B gráficamente puede representarse como:

Page 106: Libro estadistica coor1

Estadística

106

Se puede emplear la definición de probabilidad condicional para expresar lo correspondiente a la independencia probabilística; de esta manera, se dice que dos eventos A y B son independientes si y solo si:

P(A/B) = P(A) o bien P(B/A) = P(B). De forma intuitiva, si dos eventos no están relacionados entre sí, entonces la probabilidad de que ocurra un evento no se altera si se ha presentado ya otro evento. Los diversos tipos de eventos pueden ser esquematizados como:

Page 107: Libro estadistica coor1

Estadística

107

Si en un experimento pueden ocurrir ambos eventos A y B entonces.

/A)B)=P(A)P(BP(AI En consecuencia la probabilidad de que ocurran ambos eventos A y B es igual a la probabilidad de que A ocurra, multiplicada por la probabilidad de que B ocurra a condición de A. 6.3.4. ECUACION GENERALIZADA DE LA PROBABILIDAD CONDICIONAL. Sí en un experimento pueden ocurrir los eventos n321 AAAA ,...,,, ; la ecuación representativa puede escribirse como:

( )P A P A A A A A

P A P A P A P A P A A

P A P A A P A A A

i

n

i n n

i

n

i ni

n

i

I I I I I

I I

I

=−

= =

⎛⎝⎜

⎞⎠⎟ =

⎛⎝⎜

⎞⎠⎟ =

=

11 2 3 1

11 2 3

1

1

1 2 1 3 1 2

...

( ) ( ) ( )... ( / )

( ) ( / ) ( / )...

Ejemplo: En el laboratorio de la FCCA, un estudiante (X) en la realización de sus prácticas de computo considera antes de realizarlas que la probabilidad de que ponga su mayor esfuerzo es de 0.9. El instructor ha estimado que si pone su mayor esfuerzo tiene una probabilidad de 0.8 de que realice adecuadamente la práctica y no salga mal, si no pone su mayor esfuerzo será de 0.3.Cuál es la probabilidad de que el estudiante (X): a).- Ponga su mayor esfuerzo y obtenga buenos resultados. b).- No ponga su mayor esfuerzo y obtenga buenos resultados.

Page 108: Libro estadistica coor1

Estadística

108

Solución: Eventos. W = Que ponga su mayor esfuerzo. Z = Que obtenga buenos resultados. W' = Que no ponga su mayor esfuerzo. Z' = Que no obtenga buenos resultados. Expresado el problema a través de un diagrama de árbol, queda representado como:

La probabilidad condicional define: a).- P(W Z) = P(Z / W)P(W)I = 0.8(0.9) = 0.72. b).- P(W' Z) = P(Z / W')P(W')I = 0.3(0.1) = 0.03

Page 109: Libro estadistica coor1

Estadística

109

De donde se observa que bajo el esquema planteado es recomendable poner el mayor esfuerzo y aprovechar al máximo la realización de prácticas de laboratorio. 6.3.5. TEOREMA DE BAYES Sean (A A A A1 2 3 n, , ,..., ) un conjunto de sucesos del evento A que forman una partición del espacio muestral S.

Se tiene que los sucesos A A A A1 2 3 n, , ,..., ; representa una partición del espacio muestral S si se dan las condiciones siguientes:

a).- ji ; AA ji ≠∀= φI

b).- A Sii 1

n

==U

c).- i ; 0)P(Ai ∀> En otras palabras: cuando se efectúa el experimento ε, ocurre uno y solo uno de los sucesos Ai .Entonces lo anterior es expresado gráficamente como se muestra en la figura siguiente. Donde P(Ai) ≠0 ; para i=1,2,...,n y B cualquier evento de S tal que P(B) ≠0. Lo anterior de forma gráfica es dado como:

Page 110: Libro estadistica coor1

Estadística

110

De donde se tiene:

SA...AAA n =UUUU 321 Donde: Ai ∈ S ∀ i ; i = 1,2,..,n B∈S Por lo que se puede escribir:

)A(B...)A(B)A(BB)A...AA(ABSB

n

n

IUUIUI

UUUII

21

321

==

Para el caso algunos de los conjuntos iABI pueden ser vacíos, pero esto no invalida la descomposición anterior de B. Lo importante es que todos los sucesos (B A1I ,...,B AnI ) son mutuamente excluyentes. En términos de probabilidad la ecuación anterior puede ser escrita como:

)AP(B...)AP(B)AP(BP(B) nIII +++= 21 De la ecuación general de probabilidad condicional lo anterior puede ser planteado como:

P(A)B)P(A P(B/A) ;

P(B)B)P(AP(A/B) II

==

Entonces:

))P(AA)+...+P(B/)P(AP(B/A /B)P(B)P(A.../B)P(B)P(A/B)P(B)P(AP(B)

nn

n

11

21

=+++=

Page 111: Libro estadistica coor1

Estadística

111

Por lo que el teorema de la probabilidad total es expresado como:

∑n

j=jj ))P(AP(B/AP(B)=

1

A partir de lo anterior y usando la notación presentada previamente, se necesita P(Ai /B). Se puede calcular ésta probabilidad como una consecuencia de la siguiente. Sean (A A A A1 2 3 n, , ,..., ) una partición del espacio muestral S. Sea B un suceso asociado con S. Aplicando la definición de probabilidad condicional, se puede escribir como:

P A BP A B

P BPero

A B P A B P B P B A P A

y adema s P B es

( / )( )

( ):

( ) ( ) ( ) ( ) ( )

( ) :

=

= =

I

I

∑n

j=jj ))P(AP(B/AP(B)=

1

Por lo que se puede escribir:

,...,n,;i))P(AP(B/A

))P(AP(B/A/B)=P(A n

jjj

iii 21

1

=∑

=

Este resultado se conoce como TEOREMA DE BAYES. También se le llama ecuación para la probabilidad de las causas. Puesto que las Ai son una partición del espacio muestral, uno y solo uno de los sucesos Ai ocurre. Por lo que la ecuación anterior proporciona la probabilidad de un Ai particular (esto es, una causa), dado que el suceso B ha ocurrido. Para la aplicación del teorema, se

Page 112: Libro estadistica coor1

Estadística

112

deben conocer los valores de las P(Ai ), en la ecuación anterior el numerador es un término especifico del denominador. La explicación práctica del Teorema de Bayes es mostrada empleando el caso siguiente: Ejemplo: Suponga que al centro de la Ciudad de Morelia se puede llegar por cuatro caminos distintos; el primero lleva el 25 % del tráfico, el 2o el 40%, el 3o. el 20% y el 4o. el 15% restante; la probabilidad de transitar en forma fluida por alguno de esos caminos es:

CAMINO PROBABILIDAD

1 0.50 2 0.20 3 0.40 4 0.30

Si cierta persona llega con problemas de tránsito al centro. ¿Cuál es la probabilidad de que haya tomado cada uno de los cuatro caminos distintos ?.

CAMINO % TRAFICO EN FORMA FLUIDA

CON PROBLEMAS

1 25 0.5 0.5 2 40 0.2 0.8 3 20 0.4 0.6 4 15 0.3 0.7

Eventos. A1 = Llega por el camino 1. A2 = Llega por el camino 2. A3 = Llega por el camino 3. A4 = Llega por el camino 4. B = Llega con problemas de tráfico.

Page 113: Libro estadistica coor1

Estadística

113

)(),,,(),,,/()/,,,( 43214321

4321 BPAAAAPAAAABPBAAAAP =

P(B)))P(AP(B/A/B)=P(A 11

1

P(B) = 0.25(0.5) + 0.4(0.8) + 0.2(0.6) + 0.15(0.7) =0.67 P(A1/B) = 0.25(0.5)/ 0.67 = 0.1865 P(A2/B) = 0.4(0.8)/0.67 = 0.477 P(A3/B) = 0.20(0.6)/0.67 = 0.179 P(A4/B) = 0.15(0.7)/0.67 = 0.156 Lo cual implica que transitar en forma fluida para llegar al centro es dada como se muestra anteriormente, en términos de su dificultad se tiene: camino 2, camino 1, camino 3, camino 4. Ejemplo: En la fábrica de plásticos PASTIX, se producen bolsas de polietileno (plástico) con 3 maquinas estruder diferentes, etiquetadas como (A, B, C); de la producción de un turno de la planta, se extrae al azar una bolsa que no es defectuosa y es de interés para el empresario conocer los niveles de probabilidad de que haya sido producida por (A, B, o C), dada la información anexa:

MAQUINA % DE PRODUCCION % DE ELEMENTOS DEFECTUOSOS

A 52 2 B 33 1.5 C 15 1.8

Page 114: Libro estadistica coor1

Estadística

114

Los eventos son definidos como: A = Bolsa producida por la maquina A. B = Bolsa producida por la maquina B. C = Bolsa producida por la maquina C. D = Probabilidad de que no este defectuosa la bolsa. Empleando el teorema de Bayes se tiene:

P(D)P(A,B,C)P(D/A,B,C)P(A,B,C/D) =

Para el caso los datos que se emplearan en el análisis son dados tabularmente como:

MAQUINA % PRODUCCION % ELEMENTOS DEFECTUOSOS

% ELEMENTOS NO DEFECTUOSOS

A 52 2 98 B 33 1.5 98.5 C 15 1.8 98.2

Aplicando Teorema de Bayes se tiene:

P(A / D) =+ +

=052 0 98

052 0 98 0 33 0 985 015 0 982051896

. ( . ). ( . ) . ( . ) . ( . )

.

P(B/D) = 0.3310 P(C/D) = 0.150 Lo cual representa los niveles de probabilidad de que haya sido producida por cada una de las máquinas (A,B,C) de la planta, la máquina con un nivel de

Page 115: Libro estadistica coor1

Estadística

115

probabilidad asociada mayor para producir bolsas defectuosas es A. 6.4 VARIABLES ALEATORIAS Dado un experimento se define a un espacio de probabilidad como la terna [W, A, p(.) ], donde W es el espacio muestral, A es el espacio de eventos (sigmálgebra) generada por W, y p(.) es una función de probabilidad con dominio A. Recuerde que una sigmálgebra S difiere de una álgebra en que la unión infinita de elementos de S es también un elemento de S. La variable aleatoria X (v.a.) es una función real medible en el espacio muestral, es decir: Dado un espacio de probabilidad [W,A, p(.)] se define una variable aleatoria X como la función X:W → R , con la propiedad de que para todo conjunto Ar = { w / X(w) ≤ r}, es elemento de A para todo número r real. Ejemplo: Sea el experimento del lanzamiento de dos monedas legales y definamos X como el número de águilas obtenidas en el lanzamiento. Sea [W,A, p(.)] el espacio de probabilidad del experimento, claramente se tiene que el espacio de eventos (EVx) es: EVx = { 0,1,2 }, pues X((s,s)) = 0, X((s,a)) = 1, X((a,s)) = 1, X((a,a)) = 2. Se desea ver que Ar = {w/X(w) ≤ r} ∈ A ; r ∈ R; donde w ∈ W. El espacio muestral es:

W = {(a,a), (a,s), (s,a), (s,s)} Entonces: si r << 0 ; Ar = F ∈ A ; pues no hay ningún elemento de W que tenga menos de un águila. • si r << 1 ; Ar = {(s,s)} ∈ A.

Page 116: Libro estadistica coor1

Estadística

116

• si r << 2 ; Ar = {(s,s), (a,s), (s,a)} ∈ A • si r ≥ 2 ; Ar = W ∈ A. Por lo tanto X es v.a. Así mismo se le llama variable aleatoria a la función cuyo valor es un número real determinado por cada elemento en un espacio muestral Las variables aleatorias se clasifican en discretas y continuas, una variable aleatoria discreta es aquella v.a. en el que su espacio de valores es discreto. Así mismo se tiene que este tipo de espacio muestral contiene una cantidad finita de probabilidades ó bien es aquel tipo de variable que teóricamente no puede tomar cualquier valor dentro de determinado límite. Ejemplos de este tipo de variables son; número de piezas defectuosas en un turno de producción, número de muertes anuales en la carretera México-Cuernavaca, número de águilas en el lanzamiento de monedas, resultados obtenidos en el lanzamiento de un dado. Una variable aleatoria continua es aquella v.a. tal que su espacio de valores es un intervalo continuo en los reales. Este tipo de espacio muestral contiene un número infinito de posibilidades igual al número de puntos en un segmento de recta. O bien es aquel tipo de variable que puede tomar cualquier valor que se encuentre dentro de determinados límites. Ejemplos de éste tipo de variables son; mediciones de temperatura en un proceso, medición de estaturas de la población de la ciudad de México, medición del peso de los habitantes de la ciudad de Morelia, mediciones de voltaje en una línea de transmisión (t), medición de corriente eléctrica en un sistema. 6.5.- DISTRIBUCIONES DISCRETAS DE PROBABILIDAD Una variable aleatoria discreta toma cada uno de sus valores con una cierta probabilidad. Si una variable aleatoria (X) toma valores discretos (X , X , X ,..., X )0 1 2 k ; con probabilidades (P , P , P ,..., P )0 1 2 k .

Page 117: Libro estadistica coor1

Estadística

117

donde: Pi ≥ 0 ; para toda i=1, 2, 3,...,k. Para el caso por regla general se tiene que:

010

.Pk

ii =∑

=

En función de lo anterior la notación probabilística está dada como:

(X = xi ) ; p(X = xi ) = fx (xi ) = 011

.Pk

ii =∑

=

La función, fx(X) es una función de probabilidad o una distribución de probabilidad de la variable aleatoria discreta x. Para cada resultado posible cumple con las propiedades siguientes:

01

0

) (xf)xP(X .)(xf

)(Xf

ixi

ix

ix

==

=

Lo citado anteriormente caracteriza una distribución probabilística discreta en el caso cuando toma valores puntuales de probabilidad; gráficamente es expresada como:

Page 118: Libro estadistica coor1

Estadística

118

La explicación de lo anterior es mostrada a través del experimento del lanzamiento de dos dados legales, como se muestra a continuación. Ejemplo: Obtener la distribución de probabilidad puntual para una variable aleatoria X, que se define como la suma de puntos que muestran dos dados legales en la cara de arriba al ser lanzados. Solucion: El espacio muestral (S) es dado como:

⎥⎥⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢⎢⎢

=

666564636261565554535251464544434241363534333231262524232221161514131211

S

Eventos: X = Suma de los dos dados en cada uno de los tiros. Definida como: X = { 2,3,4,5,6,7,8,9,10,11,12 } El cálculo de probabilidades puntuales se hace a través de:

Page 119: Libro estadistica coor1

Estadística

119

P(X=xi) = Pi

Como se muestra:

P(X=2) = 1/36 P(X=8) = 5/36 P(X=3) = 2/36 P(X=9) = 4/36 P(X=4) = 3/36 P(X=10) = 3/36 P(X=5) = 4/36 P(X=11) = 2/36 P(X=6) = 5/36 P(X=12) = 1/36

P(X=7) = 6/36 Gráficamente está dada como:

Page 120: Libro estadistica coor1

Estadística

120

FUNCIONES DE DISTRIBUCION ACUMULADA PARA VARIABLES ALEATORIAS DISCRETAS. Otra forma de caracterizar el comportamiento de una variable aleatoria, es mediante la función de distribución acumulada (FDA), la cual es definida como:

)xXP(P(x)F ixxxx

ixii

=== ∑∑≤≤

De la ecuación anterior se tiene que en cada valor Fx(x), se acumulan las probabilidades anteriores o iguales a P(X=xi ). Las propiedades de la (FDP): • Fx (x)≥ 0 ; para toda (X) • Fx ( )−∞ = 0 • Fx ( )∞ = 1.0 • F(X+ε) ≥ Fx (X); para toda constante ε > 0 • P(x1 ≤ X ≤ x2) = Fx(x2 ) - Fx(x1 ) Dicha función es de tipo escalón. Que es constante respecto a cada intervalo que no contiene a ninguno de los xi; gráficamente puede ser expresada como:

Page 121: Libro estadistica coor1

Estadística

121

Sugerencia: en la solución de problemas, para encontrar la distribución de probabilidad de una variable aleatoria discreta, construya una tabla enumerando cada uno de los valores que puede asumir la variable aleatoria x y luego calcule P(X) para cada valor de x. Ejemplo: La distribución acumulada del ejemplo anterior correspondiente a los dados está dada como: Solucion: P(X ≤ X1) P(X ≤ 2) = 1/36 ; 0 ≤ X ≤ 2 P(X ≤ 3) = P(X ≤ 2) + P(X ≤ 3) = 1/36 + 2/36 = 3/36 P(X ≤ 4) = P(X ≤ 3) + P(X ≤ 4) = 3/36 + 3/36 = 6/36 P(X ≤ 5) = 10/36 = 6/36 + 4/36

Page 122: Libro estadistica coor1

Estadística

122

P(X ≤ 6) = 15/36 = 10/36 + 5/36 P(X ≤ 7) = 21/36 P(X ≤ 8) = 26/36 P(X ≤ 9) = 30/36 P(X ≤ 10) = 33/36 P(X ≤ 11) = 35/36 P(X ≤ 12) = 36/36 Gráficamente está dada como:

Ejemplo: Sea la variable aleatoria x que denota el número de caras en el experimento de lanzamiento de una moneda legal. Si el lanzamiento inicia con x=1. Si el lanzamiento muestra x=0; donde:

Page 123: Libro estadistica coor1

Estadística

123

1 = Lado de la cara de la moneda; 0 = lado de la cruz de la moneda. Se desea definir la función de densidad de x. Solución: La función de densidad de la variable x es una función que asigna probabilidad a los valores que puede asumir x . Es decir sea x v.a. discreta entonces f(x) = Pr(X=x) función de densidad que cumple con:

x,x)(X, y , Px)(XPRx

rr ∀≥===∑∈

01

La variable x en este problema es discreta pues solamente toma valores de 0 y 1. Encontrar la función de densidad de la variable aleatoria x es decir se desea encontrar Pr(x = 0) y Pr (x = 1). Si la moneda es legal (balanceada) los eventos x = 0 y x = 1, son igualmente probables, entonces P0 y P1 = ½ Además: P0 + P1 = 1 Por lo tanto la función de densidad es:

⎩⎨⎧

==

=1 x si ,2/10 x si ,2/1

)(xf

Page 124: Libro estadistica coor1

Estadística

124

6.6.- DISTRIBUCIONES CONTINUAS DE PROBABILIDAD Una variable aleatoria continua tiene una probabilidad de cero de tomar cualquiera de sus valores puntuales, para este caso cuando se incrementa indefinidamente el número de observaciones y la amplitud de clase se hace tender a cero, el Histograma y el Polígono de frecuencias se acerca a la forma de una curva continua, a la forma de la curva de distribución de frecuencias. Como se observa en la figura siguiente:

Si la altura de la curva de frecuencia, A fuera estandarizada de tal forma que el área bajo la curva A fuera igual a la unidad, entonces se determina una función de distribución continua de probabilidad. La función de densidad de probabilidad denotada por fx(X), se define de tal manera que la probabilidad del evento (a < X < b), es equivalente a la integral definida de fx(X), en el intervalo definido (a,b); lo anterior matemáticamente es escrito como:

∫=<<b

ax(x)dxfb)xP(a

Page 125: Libro estadistica coor1

Estadística

125

La interpretación geométrica de la integral definida, puede relacionar la probabilidad de que X se encuentre en el intervalo (a,b); con el area bajo la curva de la función de la variable aleatoria X, como se muestra en la siguiente figura: Se debe tener claro de que la probabilidad de que X tome un valor específico X, éste sería el area bajo un punto de la función de distribución de probabilidad, la cual es prácticamente cero. Sin embargo, esto no implica que sea imposible ya que el evento (X = x) puede ocurrir; de lo anterior se deduce que:

P(a < x ≤ b) = P(a < x < b) + P(x = b) = P(a < x < b)

Lo anterior implica que en el análisis matemático no importa que sea incluido el punto final del intervalo. La función de probabilidad se construye de tal manera que el area limitada por la curva sea igual a 1.0. Las propiedades de la función de distribución de probabilidad son:

Page 126: Libro estadistica coor1

Estadística

126

∫∞

∞−

=

∀≥

1)(

,0)(

xf

xxf

x

x

A las funciones de probabilidad fx (x) para variables continuas frecuentemente son llamadas función de densidad. La mayoría de las funciones de densidad que tienen aplicaciones prácticas en el análisis de datos estadísticos son continuas y sus gráficas pueden tomar por ejemplo las formas de las figuras mostradas a continuación.

Para las funciones de densidad utilizadas con frecuencia en la conducción de experimentos, las areas se han calculado y dispuesto en forma tabular. Como las areas representan probabilidades y estas son valores positivos, la función de densidad debe encontrarse totalmente por arriba del eje X. Si el rango de (X), para el cual está definida fx(X), es un intervalo finito; siempre será posible extender el intervalo para incluir el conjunto total de números reales estableciendo que fx(X) sea cero en todos los puntos de extensión del intervalo (Cero para el caso puntual).

Page 127: Libro estadistica coor1

Estadística

127

" A nivel de definición, la función fx(X) es una función de densidad de probabilidad para la variable aleatoria continua X, definida sobre el conjunto R, de números reales." Las propiedades de la función de distribución de probabilidad estan dadas como: 1ra: fx(X) ≥ 0 ; para toda X ∈ R.

2da: Fx(X) dx = 1.0 = 0.1(X)dxf(X)dxfx

x

x

x ∫∫∞∞−

=+

3ra: P(a < X < b) = ∫b

ax (X)dxf

4ta: fx(X) = dx

dF(x)

5ta: 1)( =∫∞

∞−

dxxf x

De lo anterior se tiene que "la distribución acumulativa F(X) de una variable aleatoria continua X con función de densidad f(X) está dada por:".

F ( X ) = P ( X ≤ x ) = ∫∞

X

-

f(t)dt

Como consecuencia de la ecuación anterior se tiene que: P(a < X < b) = F(b) - F(a)

f (X) = dx

dF(x)

Page 128: Libro estadistica coor1

Estadística

128

Si existe la derivada, se da el caso de obtener la puntual en función de la acumulativa. Ejemplo: Sea la variable aleatoria (X) que tiene una función de densidad de probabilidad, dada como:

fx (x) = x3

2

; (-1 < X < 2)

Verificar la segunda condición de las propiedades citadas anteriormente. Solucion:

f (X)dxx-∞

∫ =x3

dx2

-1

2

∫ =

= =⎥⎦

⎤⎢⎣

2

1

3

331 X

1/3 [8/3 + 1/3] = 9/9 = 1.0

Encontrar la probabilidad P(0 < X < 1)

91

3x

31dx

3x(X)f

1

0

31

0

2

x =⎥⎦

⎤⎢⎣

⎡== ∫

Ejemplo: En la realización de un experimento, en que se desea caracterizar la velocidad de envío de información en medios electrónicos, se obtuvo la siguiente gráfica, por medio de la cual se desea encontrar la función de densidad fx(x) y la función de distribución Fx(x).

Page 129: Libro estadistica coor1

Estadística

129

fx(X): Está representada por la recta de la figura entre los puntos (XX1,YY1). solucion: Inicialmente se requiere conocer h, la cual está dada en función del area total, ésta puede ser escrita como:

At = A1 + A2 Donde: A1 = bh A2 = bh/2 Entonces:

Page 130: Libro estadistica coor1

Estadística

130

At = bh + bh/2 = 1.0 1.0 = 4h + 4h/2 = 4h + 2h 1.0 = 6h h = 1/6 La pendiente de la recta está dada como:

mY YX X

Y YX X

h h

mh

=−−

=−−

=−

=

2 1

2 1

1

1

25 1

4

Para calcular fx(X) en función de lo anterior es necesario identificar el comportamiento de la función, para este caso particular se observa que se trata de una recta apoyada en dos puntos; la cual matemáticamente puede expresarse como.

(Y - Y1) = m (X - X1) Sustituyendo valores.

Y hh

X

Yh

X hhx h

h

− = −

= − + = − +

24

5

45 2

454

2

( )

( )

De la ecuación anterior se identifica que Y = fx (x), la cual queda dada como.

Page 131: Libro estadistica coor1

Estadística

131

330245

241 .(X)(X)f x +−=

Por lo que la función de densidad es dada como:

fx (X) = 0.0416 X+ 0.125 Rango de la función: (1 < X < 5). Para el conocimiento de la función de distribución acumulada se tiene que:

11

1

=+== ∫∫∫∞−∞−

x

xx

x

xx (X)dxf(X)dxf(X)dxf(X)F

[ ] )(x)(xxx

dx(x)dxdx(x)

xx

xxx

1811

481

81

2241

181

241

81

241

21

1

2

111

−+−=+⎥⎦

⎤⎢⎣

=+=⎥⎦⎤

⎢⎣⎡ + ∫∫∫

Entonces se tiene que la función de distribución Fx(x), es dada como:

Fx(x)=0.0208X2 + 0.125X - 0.1458 Comprobación: Fx (1) = 0 ; sobre la función fx (5) = 1.0

Page 132: Libro estadistica coor1

Estadística

132

Ejemplo: Se ha observado el tránsito en la intersección de la Av. Madero y Cuautla en las cuales se tiene mucha afluencia de vehículos, y se determinó la fx(x), del tiempo que transcurre para que un automovil logre pasar por el crucero; la función está dada por:

{f Xx xe xx

( ) . .1

= <≥−

0 00 1 00

A).- Demostrar que la función cumple con la propiedad (2). B).- Calcular la probabilidad de que un automovil tarde en pasar cuando menos

cinco minutos. solucion:

A).- ∫∫∫∞

∞−

∞−

+=0

0

(X)dxf(X)dxf(X)dxf xxx

Como la función en (- ∞, 0) vale cero.

∫∫∞∞

∞−

+0

1010 dxe.(X)dxf x.-x 0110

1010

1010

10

.)(.

..

e.x.

=−−

=⎥⎦

⎤⎢⎣

⎡−

=−

B). Se tiene que:

P(X ≥ 5 ) = [ ] 6065.001.0

1.01.0 )5(1.0

5

1.0 =−−

= −∞

−∫ edxe x

Page 133: Libro estadistica coor1

Estadística

133

Ejemplo:La duración en horas de los focos producidos por una fábrica se considera una v.a. que tiene la siguiente función de probabilidad.

⎭⎬⎫

⎩⎨⎧ ≤≤

= valorotrocualquier 0;

4 t 0 ;)(

kttfT

Calcular: a). El valor de la constante k. b). La media y la desviación estándar de la v.a. t. Solución: a). Como fT(t) es una función de probabilidad, entonces se debe cumplir que:

∫ ∫ ====4

0

4

0

1)( ;1)()( dtktdttftf TT

Entonces:

Page 134: Libro estadistica coor1

Estadística

134

1/8k ;182

162

;14

0

4

0

2

===⎥⎦⎤

⎢⎣⎡=⎥⎦

⎤⎢⎣

⎡=∫ kktktdtk

b). La media es: (z)z Pzición: μ)dt; defin(ttfE(t)z

ztt ∫ ∑∞

∞− ∀

=== )(0μ

Sustituyendo valores se tiene:

67.238

128

)81(

4

0

34

0

4

0

2

=⎥⎦

⎤⎢⎣

⎡=⎥⎦

⎤⎢⎣

⎡== ∫tttdttt

La Desviación Estándar es:

{ } )()()( 222 zPzzEz zz

zz ∑∀

−=−= μμσ

2)( tt tE μσ −=

Por lo anterior se tiene que: ft(t) = kt

{ } ∫∫ −==−=−4

0

224

0

2 )()()8/1()()( dtktttdtttE ttt μμμ

Efectuando operaciones:

{ }

94.089.0 :

89.029

833

248

181

964

38

82

81)(

t

4

0

2344

0

24

0

32

==

=+−=+−=− ∫ ∫∫

σ

μ

queloPor

ttttdtdttdtttE t

6.7. MODELOS PROBABILISTICOS

Page 135: Libro estadistica coor1

Estadística

135

En lo anteriormente escrito en el presente trabajo las distribuciones de probabilidad consideradas se conocen a veces por distribuciones teóricas, debido a que se obtienen por razonamiento lógico, en vez de por experimentos reales. El objetivo de un modelo o teoría, es explicar fenómenos y conducta. Se tiene que un Modelo es Determinista. Si permite decir, que dadas ciertas condiciones iniciales, con seguridad se obtendrán ciertos estados o resultados. A su vez este tipo de modelos proporcionan una explicación de causa y efecto. Sin embargo en muchos de los casos no es posible establecer una clara relación, debido al efecto ocasionado por la incertidumbre; para el caso solo se pueden tener modelos probabilistas, este tipo de modelos al analista le permiten decir sólo que, dadas ciertas condiciones iniciales, ocurrirán ciertos estados con tales y tales probabilidades. Es decir que dadas las condiciones iniciales, un modelo probabilista permite deducir una distribución de probabilidades de posibles estados subsiguientes, que son valores de una variable aleatoria. Tales modelados son importantes ya que apoyan en la predicción de la conducta de futuras repeticiones de un experimento. 6.7.1. DISTRIBUCIÓN DE VARIABLES ALEATORIAS DISCRETAS 6.7.1.1. EL MODELO DE BERNOULLI Se inicia el estudio de este apartado con el Modelo Bernoulli, debido a que es el más simple, además de que ofrece la base para obtener el modelo de la distribución binomial, ya que es adecuado para algunos procesos reales frecuentes. El presente modelo adopta este nombre en honor a Jacques Bernoulli, que vivió en la última mitad del siglo XVIII. Es aplicado a una variable aleatoria la cual puede adoptar solamente dos valores; sean los dos valores 0 y 1 con p y q = 1-

Page 136: Libro estadistica coor1

Estadística

136

p como sus respectivas probabilidades, para el caso la función de probabilidad Bernoulli es simplemente.

xi f(xi) 1 P 0 Q

Suma 1 Si X es el número de éxitos en un ensayo Bernoulli con probabilidad p de éxito y q dado por (1-p) de fracaso, entonces se dice que X tiene distribución binaria o Bernoulli con parámetro p. Como X solamente puede tomar el valor de cero o uno, su función masa de probabilidad está definida por:

⎪⎩

⎪⎨

⎧==−

=caso otrocualquier ; 0

1 X para ; 0 X para ; 1

)( pp

XPx

Graficamente es:

Page 137: Libro estadistica coor1

Estadística

137

Para La distribución anterior se observa que:

==

=

iii

iii

pxExfxy

pxfx

)()(

)(

22

En consecuencia, se tiene para la variable Bernoulli:

pqpppp

xEXV

pxE

=−=−=

−=

=

==

)1(

)()(

)(

2

22

2

μ

σ

μ

En el modelo de Bernoulli se tiene un solo parámetro p, este es apropiado cuando se busca un experimento que resultaría en un hecho E o su opuesto E´, tal como éxito o fracaso, proposiciones sí o no, sujetos varón o hembra, artículos defectuosos o no defectuosos, no significan necesariamente resultados que sean deseables en la practica. El lanzamiento de una moneda legal un número fijo de veces es un proceso de Bernoulli, este proceso puede ser descrito como:

• Cada ensayo (cada lanzamiento, en nuestro caso) tiene sólo dos resultados posibles: Lado A o lado B, si o no, éxito o fracaso.

Page 138: Libro estadistica coor1

Estadística

138

• La probabilidad del resultado del ensayo (lanzamiento) permanece fija con el tiempo. Tratándose de una moneda legal, la probabilidad de que salga, el lado A sigue siendo de 0.5 en cada lanzamiento, cualquiera que sea el número de veces que la moneda sea arrojada.

• Los ensayos son estadísticamente independientes, es decir, el resultado

de un lanzamiento no afecta al de cualquier otro lanzamiento. Por ejemplo supóngase que el 10 % de una producción es defectuosa y 90 % es buena, entonces, el proceso es bernoulli con una probabilidad de éxito (unidades defectuosas) de 0.10 y una probabilidad de fracaso de 0.9, si p permanece estable en 0.1 por cada unidad de producción y si la producción defectuosa y buena se mezcla al azar. Para este proceso tenemos μ= p = 0.10 Y; σ2 = p(1-p) = pq = 0.1(0.9) = 0.09 Se ha supuesto que el proceso de producción es establecido para una gran producción y que la probabilidad de producción defectuosa es suficientemente estable. Pero, si el proceso esta sujeto a rápido desgaste, se producirán más unidades defectuosas al aproximarse al fin de la producción y p no es estable. En muchos procesos de producción la ocurrencia de producción defectuosa y no defectuosa esta suficientemente aleatorizada para ser considerada como Bernoulli. En otros casos, la probabilidad de éxito puede permanecer estable en un lote de producción, pero puede cambiar de un lote a otro debido a, por ejemplo, emplazamientos de las máquinas, en tal caso, el proceso podría ser considerado aún como Bernoulli, pero debe considerarse el cambio en la probabilidad de éxito de un lote a otro. 6.7.1.2. DISTRIBUCIÓN BINOMIAL Con frecuencia un experimento consiste de intentos repetidos, cada uno con dos resultados posibles, que se pueden llamar éxito o fracaso,.esto es válido al

Page 139: Libro estadistica coor1

Estadística

139

probar las piezas que salen de una línea de ensamble, donde cada prueba o intento puede indicar una pieza defectuosa o no defectuosa, entonces se tiene que un proceso binomial puede considerarse como la suma de n variables Bernoulli independientes. Más aún, una variable binomial es generada con los postulados siguientes:

• El experimento consta de un número fijo de pruebas repetidas estadísticamente independientes.

• Cada intento tiene un resultado que puede clasifiacarse con éxito o

fracaso, lo cual implica que cada resultado es una variable Bernoulli.

• Todas las pruebas deben tener idénticas probabilidades de éxito p, tal que la probabilidad de fracaso para cada prueba permanezca en un valor constante de q que es igual a (1-p).

El número X de éxitos en n ensayos de un experimento binomial , se llama variable aleatoria binomial, es discreta y tiene n+1 valores posibles. La distribución de probabilidad de la variable aleatoria X se llama distribución binomial y se indicará por [b(X, n, p)]. Esta indica la probabilidad de obtener exactamente X éxitos en n pruebas independientes de un experimento, con p como probabilidad de éxito para cada prueba. Ya que sus valores dependen del número de ensayos y de la probabilidad de un éxito en un ensayo dado. En función de lo anterior se requiere definir una relación para encontrar. • La probabilidad de X éxitos de n ensayos de un experimento binomial. • El número de fracasos estará dado por (n-x) en determinado orden. Las condiciones anteriores se cumplen dado que los ensayos son independientes, por tal motivo se pueden multiplicar todas las probabilidades

Page 140: Libro estadistica coor1

Estadística

140

correspondientes a los diferentes resultados. • Cada éxito ocurre con probabilidad p. • Cada fracaso ocurre con probabilidad q = 1 – p. Donde q es llamada

variable aleatoria binomial con parámetros n, p, siendo n el número de repeticiones del experimento en cuestión y p la probabilidad de éxito en cada repetición.

De donde se tiene que la probabilidad para un orden dado definido como: Px qn-x Probabilidad simple. El número total de puntos muestrales en el experimento tiene X éxitos y n-x fracasos. Este número es igual al de particiones de n resultados en dos grupos

con X en un grupo y n-x en otro grupo esta dado por ⎥⎦

⎤⎢⎣

⎡xn

Debido a que estas particiones son mutuamente excluyentes. De lo anterior se tiene que la función de densidad de la variable aleatoria x, para el número de éxitos en n ensayos independientes es:

[ ] nxqpxn

pnxbxf xnx ,...,2,1,0;,,)( . =⎥⎦

⎤⎢⎣

⎡== −

nrCxnx

nxn

=−

=⎥⎦

⎤⎢⎣

⎡!)(!

!

La ecuación anterior puede ser escrita como:

Page 141: Libro estadistica coor1

Estadística

141

⎩⎨⎧

<≥

==−

0 , 00 ,p

)()(x

xparaxparaqC

XfXPxn

xn

x

La distribución binomial es asimétrica, excepto para p = q = 0.5 y discreta, su nombre es debido a que sus miembros coinciden con los sumandos del desarrollo binómico de la forma (p+q)n. Donde q = 1-p, por lo tanto dicha suma es igual a la unidad. La media de esta distribución es: μ = n p Donde: n = Número de ensayos. p = Probabilidad de éxitos. Prueba: la demostración de que la media y varianza, son expresadas como se cita anteriormente, se tiene: Represéntese el j-ésimo ensayo por medio de la variable aleatoria Ij, la cual toma los valores de 0 y 1 con probabilidades q y p respectivamente. Esa variable se llama variable Bernoulli o más adecuadamente, variable indicadora, ya que Ij = 0 indica una falla e Ij = 1 indica un éxito. De lo anterior se tiene que, en un experimento binomial el número de éxitos puede escribirse como la suma de n variables indicadoras independientes. Por lo que x puede ser representada como: X = I1 + I2 + ... + In Entonces como la media de cualquier Ij es dada como: E(Ij) = 0 (p) + 1(q) = p La media de la distribución binomial es expresada como:

Page 142: Libro estadistica coor1

Estadística

142

μ = E(x) = E(I1) + E(I2) + ... + E(In) = p + p + ... + p = n p Y la varianza esta dada como:

σ2 = n p q Donde: q = 1-p = Probabilidad de fracaso. Prueba: la varianza de cualquier Ij es dada como:

[ ] pqpIEpIE jjI j=−−= 222 )()(σ

Pero la varianza de la distribución binomial es escrita como:

2222 ,...,21 nIIIx σσσσ +++=

= pq + pq + ... + pq = n p q Ejemplo: Se tiene una máquina bolseadora que produce el 20 % de bolsa defectuosa. Si se extrae una muestra aleatoria de 10 paquetes. Para el caso de interés realizar el cálculo de la media y desviación estándar del problema. a). Para el caso de la media se tiene: Solución: Si se define el éxito y el fracaso como:

Page 143: Libro estadistica coor1

Estadística

143

• Probabilidad de éxito (unidades defectuosas) es 0.2 • Probabilidad de fracaso (unidades buenas) es 0.8 μ = n p = 10 (0.2) = 2 b). Para la desviación estándar:

265.16.1)8.0)(2.0(10 ==== npqσ Si la media es un número entero, entonces este es también el valor más probable; en el caso contrario, uno de los dos enteros más próximos o ambos tienen la máxima probabilidad. La función de distribución de probabilidad, esta dada como:

xnm

x

xnx qpCmxp −

=∑=≤

0)(

Esta función aparece prácticamente en todos los problemas que tengan carácter del llamado experimento de Bernoulli. La asimetría de esta distribución está dada como:

2/33 )()21(

npqpnpqm −

=

El comportamiento gráfico clásico para valores grandes de n, la distribución binomial tiende a una distribución normal, esto es expresado gráficamente como:

Page 144: Libro estadistica coor1

Estadística

144

En la distribución normal se tiene μ = n p; s2 = npq El resultado es:

Con:

npqnpxb 5.02 +−

=

Ejemplo:En la fábrica de VW se ha observado que el 10 % de las unidades salen defectuosas de la línea de producción. Si se selecciona un lote de cinco para ser inspeccionado. a). ¿Cuál es la probabilidad de no encontrar unidades defectuosas en un lote de

4 automóviles sedan?. b). El número esperado de unidades defectuosas en el mismo lote.

2

2/1

0 21)( ⎥

⎤⎢⎣

⎡ −≅= −−

=∑ npq

npxenpq

qpCxF xnm

x

xnx

π

npqnpx

a5.01 −−

=

Page 145: Libro estadistica coor1

Estadística

145

c). La varianza y la desviación estándar de la distribución. d). La gráfica de la distribución de masa de probabilidad. Solución: Se define el éxito y el fracaso respectivamente como: E = {encontrar unidades defectuosas} = éxito = p F = {encontrar unidades sin defecto} = fracaso = q a). Como en este caso la secuencia de observaciones se puede considerar un

proceso Bernoulli, la variable x que representa al número de unidades defectuosas que hay en un lote tiene distribución binomial con parámetros n=4, p = 0.1, por lo que:

Px(0) = 4C0(pxqn-x) = 4C0 (0.1)0 (0.9)4 = 0.656 b). Para este caso se tiene: μx = n p = 4(0.1) = 0.4 c). σ2

x = n p q = 4(0.1) (0.9) = 0.36 ; σ = 0.6

d). Como, la función de masa de la distribución binomial es:

X

P(x)

0 0.6561

⎩⎨⎧

<∀≥∀

=−

0 ; 00;

)(xxqpC

XPxnx

xnx

Page 146: Libro estadistica coor1

Estadística

146

1 0.2916 2 0.0486 3 0.0036 4 0.0001

Gráficamente es dada como:

Ejemplo: Encontrar las probabilidades de x, el número de éxitos de un experimento binomial con 4 ensayos independientes y la probabilidad de éxitos es igual a 1/3, iguales (0,1,2,3, ó ,4), elaborar un histograma para la distribución. Si: Pk(0) = xCn (px qn-x)

Page 147: Libro estadistica coor1

Estadística

147

b(0,n,1/3) = 0C4((1/3)0 (2/3)4) = 16/81 b(1,n,1/3) = 1C4((1/3)1 (2/3)3) = 32/81 b(2,n,1/3) = 2C4((1/3)2 (2/3)2) = 24/81 b(3,n,1/3) = 3C4((1/3)3 (2/3)1) = 8/81 b(4,n,1/3) = 4C4((1/3)4 (2/3)0) = 1/81 El histograma que representa la distribución de probabilidad es: 6.7.1.3. DISTRIBUCIÓN BINOMIAL NEGATIVA O PASCAL Sea N una variable aleatoria que representa el número de ensayos necesarios para encontrar X éxitos en una secuencia Bernoulli con probabilidad de éxito P, entonces N tiene distribución binomial negativa con parámetro X y P. Comparando esta definición con la correspondiente a la Binomial se debe notar que el número de éxitos X es una variable en la distribución binomial, mientras

Page 148: Libro estadistica coor1

Estadística

148

que en esta distribución es solamente un parámetro. “Tambien se debe observar que en esta distribución, el último ensayo de la secuencia tiene que ser éxito para completar los X éxitos que aparecen en la definición” Tomando en cuenta esta última observación, se puede obtener la función de masa de probabilidad tomando: PN(n) = P [(obtener X-1 éxitos en los primeros N-1 ensayos]∩[un éxito en el último ensayo] Donde el primer evento corresponde a una variable con distribución binomial y la probabilidad del segundo es P, entonces:

⎩⎨⎧

<∀≥∀

=−

−−

xnxnqPC

nPxnx

xnN ;0

; )( 11

Como no tiene sentido que haya menos de X ensayos para encontrar X éxitos, entonces. Su media y varianza son:

22 ;

PXq

PX

NN == σμ

Ejemplo: En la fábrica de VW se ha observado que el 10 % de las unidades salen defectuosas de la línea de producción. Si se selecciona un lote de cinco para ser inspeccionado. a). Cuál es la probabilidad de que la quinta unidad observada sea la segunda defectuosa.

Page 149: Libro estadistica coor1

Estadística

149

b). El número promedio de unidades que se debe observar para encontrar cinco defectuosas. Solución: a). X = 2, N = 5 y P = 0.1 Entonces.

b). Ahora tómese X= 5, entonces:

unidades ,501.0

5===

PX

6.7.1.4. DISTRIBUCIÓN GEOMETRICA Esta distribución es un caso especial de la binomial negativa, en donde la variable aleatoria representa el número de ensayos necesarios para encontrar el primer éxito en la secuencia de Bernoulli. La función de masa de probabilidad se obtiene haciendo X = 1 en la Binomial Negativa, entonces:

⎩⎨⎧

<∀≥∀

====−

1 ;01;

),1()(1

nnpq

PXnNPnPn

N

0.02916(0.9)(0.1)(3)14)9.0()1.0()5( 32252

1215 =!!

!== −

−− CPN

Page 150: Libro estadistica coor1

Estadística

150

Su media y varianza es:

22 ;1

pq

p NN == σμ

Ejemplo: El propietario de un lote de autos usados tiene 10 vehículos clásicos, los cuales está tratando de venderlos por medio de entrevistas personales con los posibles compradores. Considera que al entrevistarse con el posible comprador, existe la misma probabilidad de vender o no vender y que el resultado de una entrevista es independiente de lo que ocurre en las demás. ¿ cuál es?. a). La probabilidad de que la cuarta persona entrevistada sea la primera que

compre. b). La media de la variable N que representa el número de clientes que se tienen

que entrevistar para realizar la primera venta c). La varianza de N. d). La gráfica de la función de masa de probabilidad f(x); que corresponde a N

en el intervalo [1,6]. Solución: a). El éxito de hacer una venta es 0.5; entonces: P = 0.5 q = 1-p = 0.5 Por lo que: PN(4) = (0.5)(0.5)3 = 0,063 b). Si.

sentrevista ; 2.05.0

11===

pNμ

Page 151: Libro estadistica coor1

Estadística

151

c). La varianza es:

2)5.0(

5.02

2 ==Nσ

d). Se tiene que:

X P(X) 1 0.5 2 0.25 3 0.125 4 0.063 5 0.031 6 0.016

Gráficamente se representa como:

Page 152: Libro estadistica coor1

Estadística

152

6.7.1.5. DISTRIBUCION DE POISSON En los experimentos que proporcionan valores numéricos de una variable aleatoria x, el número de éxitos que ocurren durante un intervalo de tiempo dado o una región especificada se conocen comúnmente con el nombre de experimentos de Poisson. El intervalo de tiempo dado puede tener cualquier longitud, un minuto , un día, una semana, un mes e incluso un año. De aquí que un experimento Poisson genere observaciones para la variable aleatoria x que representan el número de llamadas telefónicas que se reciben por hora en una oficina. La región especificada puede ser un segmento de recta , un área un volumen o probablemente una pieza de material . x puede representar el número de ratones por hectárea , el número de bacterias en un cultivo dado, el número de errores de impresión en una pagina. Un experimento Poisson es aquel que posee las propiedades siguientes: 1. El número de éxitos que ocurren en un intervalo de tiempo o en una región

especificada son independientes de los que ocurren en cualquier otro intervalo de tiempo o región del espacio disjuntos.

2. La probabilidad de un solo éxito que ocurre durante un intervalo de tiempo muy corto o en una pequeña región es proporcional a la duración del intervalo de tiempo o al tamaño de la región y no depende del número de éxitos que ocurren fuera del intervalo de tiempo o de la región.

3. La probabilidad de que ocurra más de un éxito en dicho intervalo de tiempo corto o de caer en dicha región pequeña es insignificante.

Las formas clásicas para obtener la distribución de Poisson son definidas como: A).- En el caso de que en un experimento de Bernoulli, la probabilidad de éxito

Page 153: Libro estadistica coor1

Estadística

153

P sea pequeña y n muy grande, no es ventajoso aplicar la Distribución Binomial. Para transformarla adecuadamente, se hace tender n →∞ y p →∞; pero de tal forma que la media np = μ , permanezca constante. Como función límite se obtiene la distribución de Poisson en la forma:

La distribución de probabilidad de una variable aleatoria Poisson x , en el número de éxitos que ocurren en un intervalo de tiempo o una región especificada es:

[ ] nxex

xxPx

,....,2,1,0 ; )(),( =!

== −μμφμ

Tambien se puede escribir como:

⎪⎩

⎪⎨⎧

<

≥=

0 ; 0

0 ;!)(

xpara

xparaxe

XP

X

X

μμ

B).- Puede producirse dicha distribución, tomando como referencia las hipótesis

siguientes: a).- La probabilidad de que ocurra un suceso aleatorio en un intervalo de tiempo

Δt es independiente de que tales sucesos ocurren en los demás intervalos. b).- Dicha probabilidad es proporcional a la cantidad Δt. En consecuencia puede

utilizarse ampliamente, por ejemplo en el estudio de las corrientes de tráfico en una vía rápida en una ciudad determinada.

c).- Se puede generar mediante la ecuación de recurrencia siguiente:

....0,1,2,3,.. x para ;)()1(

)1( =+

=+ xx

x φμφ

Si se supone:

Page 154: Libro estadistica coor1

Estadística

154

φ(0) = e-μ Su media es: μ Su varianza : s2 = μ

Su asimetría: μ1

=u

La función de distribución para el caso puede ser expresada como:

!)(

0 ue

uex

xx

u

x μμ μμφ

=

− =!

= ∑

La distribución de Poisson se aproxima relativamente bien a la Distribución Binomial, incluso para valores bastante pequeños de n. Para valores grandes de μ, la distribución de Poisson es casi simétrica, puesto que su asimetría tiende

hacia cero cuando m μ→∞ , según la condición μ1

=u .

El comportamiento gráfico de φ(x) para diferentes valores de μ se muestra a continuación.

Page 155: Libro estadistica coor1

Estadística

155

Como elemento de explicación de éste concepto se tiene que; los defectos ocurridos a lo largo de la longitud de un cable eléctrico de 4000 mts en promedio son de 6. Asúmase que la probabilidad de K defectos en t metros de cable es dada por la función de distribución siguiente:

!==

k

tedefectoskP

kt

r

)4000

6() (

40006

Para K = 0,1,2,...., encontrar la probabilidad que a 3000 mts de cable se tengan a lo más dos defectos. Solución: La probabilidad de exactamente K defectos en 3000 mts es determinada por la distribución de probabilidad discreta dada como:

Para encontrar la probabilidad de a lo más dos defectos se tiene: Pr(a lo más dos defectos) = Pr (0,1, ó dos defectos).

..0,1,2,.... k ;)5.4(

)4000

)3000(6() 3000 (

5.4

4000)3000(6

=!

=

!==

ke

k

emetrosendefectoskP

k

k

r

Page 156: Libro estadistica coor1

Estadística

156

Los eventos: 0 - cero defectos 1 - defectos 2 - defectos Es importante hacer notar que todos los eventos son mutuamente excluyentes. Entonces: Pr(a lo más dos defectos) = Pr(0 def.) + Pr(1 def.) + Pr(2 def.).

1736.02

)5.4(1

)5.4(0

)5.4( 25.415.405.4

=!

+!

+!

=−−− eee

Ejemplo: En una empresa textil se ha observado que la probabilidad de encontrar un defecto en un metro de cierto tipo de tela es 0.02. Considerando un rollo de 100 mt. De dicha tela, cual es: a) El número promedio de defectos por rollo. b) La probabilidad de que no exista ningun defecto en los 100 mts. c) La función masa de probabilidad en forma gráfica y tabular de la v.a. que

representa el número de defectos por rollo. Solución: a). Considerando como éxito el encontrar un defecto en la tela es p = 0.02, con

lo cual la tasa promedio de éxitos es : μ = n p = 100 (0.02) = 2 defectos por rollo.

b). De la ecuación general se tiene:

Page 157: Libro estadistica coor1

Estadística

157

1353.0!0

)2()(20

==−eXPX

c). Se tiene:

X Px(X) 0 0.135 1 0.270 2 0.270 3 0.18 4 0.090 5 0.036 6 0.012 7 0.003 8 0.001

Graficamente es expresada como: Ejemplo:: Se tiene que a una empresa en promedio llegan diariamente 10 camiones a descargar mercancías; en las instalaciones de ésta solamente se pueden atender como máximo 15 camiones al día. Cuál es la probabilidad de que 15 camiones no puedan ser atendidos en un solo día?.

Page 158: Libro estadistica coor1

Estadística

158

Solución:

P(X > 15) = 1.0 - P(X ≤ 15) = ∑=

=−=−15

00487.09513.01)10,(1

xxP

En tablas con: μ = 10 X = 15 Para: P(X ≤ 15) = 0.9513 P(X >15) = 1.0 - 0.9513 = 0.0487 Ejemplo: En un experimento de laboratorio el promedio de partículas radioactivas que pasan por un contador durante un milisegundo es 4. Cuál es la probabilidad de que 6 partículas pasen por el contador en un milisegundo dado ?. Se tienen: μ = 4 X = 6

∑ ∑= =

=−=−=!

=6

0

5

0

64

1042.07851.08893.0)4,()4,(64)4,6(

x xxPxPeP

La distribución de Poisson es una aproximación conveniente de Distribución Binomial en casos en donde existe un gran número de n ensayos y una

Page 159: Libro estadistica coor1

Estadística

159

probabilidad pequeña p de éxito en un solo ensayo. Caso: n → ∞ p→ 0 μ= np P = μx/nx Otra forma de expresar la función masa de probabilidad de la distribución poisson, se obtiene al multiplicar una constante (t), no negativa, por la tasa promedio de exitos (μ), con el fin de cambiar la escala de unidades por lo que la función de Poisson clasica queda como:

⎪⎩

⎪⎨⎧

<

≥=

0 ; 0

0 ;!

t)()(

x

xpara

xparax

exP

t

X

μμ

Ejemplo: en el conmutador telefónico de una compañía se reciben en promedio dos llamadas por minuto. Suponiendo que dichas llamadas siguen un proceso de poisson, cual es la probabilidad de recibir: a). Ocho llamadas en cinco minutos. b). Ninguna llamada en tres minutos. c). Menos de tres llamadas en dos minutos. Solución

Page 160: Libro estadistica coor1

Estadística

160

a). De la ecuación anterior, se tiene: μ =2 y t = 5 por lo que:

[ ] 1126.0!8

)5(2)8()5(28

==−ePx

b). Con t = 2, μ t = 2(3) = 6, por lo que:

0024.0!0

6)0(60

==−ePx

c). Con t = 2, μ t = 2(2) = 4

2381.0!2

4!1

4!0

4)2()1()0()3(424140

=++=++=<−−− eeePPPxP xxx

Page 161: Libro estadistica coor1

Estadística

161

6.8.- DISTRIBUCION NORMAL En la Estadística la distribución de probabilidad continua más importante es la Distribución Normal. Su gráfica llamada curva normal está representada por la Campana de Gauss. que describe la distribución de muchos de los conjuntos de datos que ocurren en la naturaleza, la Industria y la Investigación. La variable aleatoria X, que toma todos los valores reales (-∞ < x < ∞ ), tiene una distribución normal ( o gausiana) si su función de distribución de probabilidad es de la forma. fx(X) = n(X;μ,σ); con media μ y varianza σ2 es:

[ ]2/)(21

21),,()(

σμ

σπσμ

−−==

x

x exnxf

para (-∞ < x < ∞ ) Donde: p = 3.1416 e = 2.71828 x = Variable aleatoria Para los parámetros μ y σ deben satisfacer las condiciones (-∞ < μ < ∞ ) , σ >0 ; frecuentemente nos referimos a la distribución normal empleando la notación siguiente: X tiene la distribución N(μ,σ2 ) si y solo si su distribución de probabilidad está dada por la ecuación anterior Una vez especificada μ y σ, la curva normal está completamente determinada. La prueba de que los parámetros μ y σ2 son la media y la varianza de la distribución normal.

Page 162: Libro estadistica coor1

Estadística

162

Para calcular la media se tiene que:

[ ] dxexxE x∫∞

∞−

−−=2/)(2/1

21)( σμ

σπ

Haciendo Z = (x - μ)/σ y dx = σ dz, se tiene:

dzezdzedzezxEzzz

∫∫∫∞

∞−

−∞

∞−

−∞

∞−

−+=+=

2

21 ) (

21)( 222

222

πσ

πμσμ

π

Se tiene que la primera integral es μ multiplicada por el área bajo la curva normal con media cero y variancia 1, y por lo tanto igual a μ. Efectuando la integración o partiendo del hecho de que el integrando es una función impar, la segunda integral es igual a cero. De donde la variancia de la distribución normal es dada como:

[ ] [ ]dxexxE

x

∫∞

∞−

−−−=−

2/)(21

22 )( 21)(

σμμ

σπμ

Haciendo z=(x-μ)/σ y dx=σ dz, obtenemos.

Integrando por partes con u = z ,

2/2zzedv −= de tal manera que:

[ ] [ ]dzezxE

z

∫∞

∞−

−=−

2

21

22

2 2

)(π

σμ

Page 163: Libro estadistica coor1

Estadística

163

du = dz y

2/2

1 zev −−= , se encuentra que:

[ ] 222-

2/2

2 )10( 2

)(2

2

σσπ

σμ =+=⎟⎟⎠

⎞⎜⎜⎝

⎛+−=− ∫

∞−

−∞∞

− dzezexEz

z

Page 164: Libro estadistica coor1

Estadística

164

CARACTERISTICAS IMPORTANTES DE LA DISTRIBUCION NORMAL Las características más importantes de ésta distribución son descritas como se muestra a continuación: 1. Por ser una función par, posee simetría axial respecto a las ordenadas en x = μ , que es donde se encuentra su punto máximo.

)( 2

1 verticeys πσ=

La gráfica representativa es dada como: 2. A ambos lados del vértice de la curva decrece monótonamente, aproximándose asintóticamente al eje x. 3. Los dos puntos de inflexión se encuentran a distancias ± σ de la abscisa del vértice. Su separación de d = 2σ ; se llama (amplitud de la campana).

Page 165: Libro estadistica coor1

Estadística

165

4. Cuando mayor sea la amplitud de la campana, tanto más bajo se encontrará el vértice, y viceversa, como se observa en la siguiente figura. 5.- Si la Distribución Normal queda determinada por sus parámetros (μ,σ); esto quiere decir que se especifica una distribución normal diferente para cada valor de μ y σ. Los valores diferentes de μ trasladan a la gráfica de la distribución, como se muestra en la siguiente figura. Distribuciones normales con σ diferentes:

Page 166: Libro estadistica coor1

Estadística

166

AREAS BAJO LA CURVA La curva de cualquier distribución de probabilidad continua está construida de tal manera que el área bajo la curva limitada por (X = X1 y X = X2) es igual a la probabilidad de que la variable aleatoria X tome valores entre (X=X1 y X=X2).

[ ]dxedxxnxxxP

x

x

xx

x∫∫

−−==<<

2

1

22

1

/)(21

21 21),,()(

σμ

σπσμ

La gráfica representativa está dada como: De lo anterior se tiene que la curva normal depende de la media y la desviación estándar de la distribución en análisis. El área bajo la curva, entre dos ordenadas

Page 167: Libro estadistica coor1

Estadística

167

cualesquiera, también debe depender de los valores de μ y σ. La problemática de resolver las integrales de las funciones de densidad normal, requieren de la tabulación de áreas de la curva normal para una rápida referencia. Pero, seria un trabajo interminable tratar de tabular cada valor posible de μ y σ. Sin embargo, se pueden transformar todas las observaciones de cualquier variable aleatoria en un nuevo conjunto de observaciones de una variable aleatoria normal con media cero y variancia 1. Esto es posible hacerlo mediante la siguiente transformación.

σμ−

=xz

Siempre que X tome un valor de x, el valor correspondiente de Z estará dado por Z = (X-μ)/σ. Por lo que, si X cae entre los valores X = x1 y X = x2 , la variable aleatoria Z caerá entre los correspondientes valores Z1 = (x1 -μ)/σ y Z2 = (x2 -μ)/σ. Entonces se puede escribir.

[ ]

∫∫

<<==

===<<−−−

2

1

2

1

22

1

2

)()1,0,(

21

21)(

21

2/)(

21

21

z

z

z

z

zx

x

x

zzzPdzzn

dzedxexxxPπσπ

σμ

De donde se ve que Z es una variable aleatoria normal con media cero y varianza uno, la distribución de ésta variable aleatoria se le llama distribución normal estándar. Las distribuciones ORIGINAL Y TRANSFORMADA se ilustran en las figuras mostradas a continuación, como todos los valores de X que se encuentran entre x1 y x2 tienen valores correspondientes de Z entre z1 y z2 el

Page 168: Libro estadistica coor1

Estadística

168

área bajo la curva X, entre las abscisas X = x1 y X = x2 de la figura siguiente, es igual al área bajo la curva Z, entre las abscisas transformadas Z = z1 y Z = z2 .

Ahora se ha reducido a una el número de tablas requeridas para las áreas de la curva normal, que es la distribución normal estándar. La tabla para cálculos se presenta en el (Apéndice: Tablas) la cual proporciona el área bajo la curva normal estándar correspondiente a P(Z < z) para valores de Z desde -3.4 hasta 3.4; para ilustrar su aplicación se tomarán como base los ejemplos siguientes: Ejemplo: Al probarse a compresión simple treinta probetas de un material desconocido que se pretende sea usado con fines estructurales; se obtuvieron resultados con un promedio aritmético de 240 Kg./cm y una desviación estándar de 30 Kg./cm . a).- Cuál es la probabilidad de que otra probeta tomada al azar resista cuando

más 240 Kg./cm ?. b).- Cuál es la probabilidad de que su resistencia esté en el intervalo de 210 a

240 Kg./cm . Entre los supuestos de solución se tiene que la función de distribución es normal.

Page 169: Libro estadistica coor1

Estadística

169

a).- Para emplear las tablas de distribución normal es necesario estandarizar la variable X; mediante.

Recurriendo a las tablas del anexo se tiene: P(X ≤ 240) = P(Z ≤ 0) = 0.5 O sea la probabilidad correspondiente al área sombreada mostrada en la siguiente figura, la cual corresponde a 0.5.

b).- Estandarizando la variable X; se tiene.

P(240 < X < 210) = P( -1 < z < 0) = P(Z < 0) - P(Z < -1) = = 0.5 - 0.1587 = 0.3413

030

)240240(=

−=

−=

σμxz

030

240240

130

240210

1

2

=−

=−

=

−=−

=−

=

σμ

σμ

xz

xz

Page 170: Libro estadistica coor1

Estadística

170

= 34.13 %. Como se muestra en la siguiente figura.

Page 171: Libro estadistica coor1

Estadística

171

6.9.- APROXIMACION DE LA DISTRIBUCION NORMAL A LA BINOMIAL Las probabilidades asociadas con experimentos binomiales, cuando n es pequeña, se obtiene fácilmente partiendo de la ecuación. (X; n; p); de la distribución binomial

nxqpxn

pnXb xnx ,...,2,1,0 ;),,( =⎟⎟⎠

⎞⎜⎜⎝

⎛= −

!−!!

=⎟⎟⎠

⎞⎜⎜⎝

⎛)( xnx

nxn

Ó bien los valores pueden obtenerse de la tabla del anexo. Si n no está tabulada en cualquiera de las tablas disponibles pueden ser calculadas por aproximaciones las probabilidades binomiales. En función de lo anterior un teorema que permite usar las áreas bajo la curva para aproximar probabilidades binomiales cuando n es suficientemente grande está dado como sigue: Teorema: Si X es una variable aleatoria binomial con media μ = np; y varianza σ2 = npq ; la forma límite de la distribución es:

npqnpxz −

=

Cuando n →∞ , es la distribución normal estandarizada con n(z; 0,1). Se tiene que la distribución normal adecuada proporciona una aproximación muy exacta a la distribución binomial cuando n es grande y p cercana a 1/2, incluso cuando n es pequeña y p no es muy cercana a cero o uno, la

Page 172: Libro estadistica coor1

Estadística

172

aproximación es muy aceptable. Ejemplo: El ancho de una ranura de una lámina de cobre para usarse en la construcción de transformadores está normalmente distribuida con μ = 0.9 y σ = 0.003; los límites dados por especificación son 0.9 y 0.005. Qué porcentaje de piezas serán aceptadas ?. Solucion: μ = 0.9 σ = 0.003 Intervalo obtenido: (0.9 ± 0.005) (0.895 ≤ X ≤ 0.905) Estandarizando.

σμ−

=xz

Para: X = 0.895 X = 0.905

P(0.895 ≤ X ≤ 0.905) = P(-1.67 ≤ Z ≤ 1.67) De tablas = P(1.67) - P(-1.67) = 0.9050 * 100 = 90.5 %

67.1003.0

9.0895.01 −=

−=

−=

σμxz

67.1003.0

9.0905.02 =

−=

−=

σμxz

Page 173: Libro estadistica coor1

Estadística

173

Para: +1.67 = 0.9525 -1.67 = 0.0475 0.9050

Page 174: Libro estadistica coor1

Estadística

174

CAPITULO 7

REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN 7.1. INTRODUCCIÓN El análisis de regresión es altamente utilizado en análisis de pronóstico. Para el caso de dos variables, se desarrolla un modelo que utiliza la variable independiente x para obtener una mejor predicción de otra variable: la variable dependiente y. Por ejemplo, el director y el investigador querrían desarrollar un modelo estadístico que utilizaría el promedio de bachillerato como medio para predecir el rendimiento en la Facultad (medido por índice de calificaciones). La variable dependiente y que se va a predecir sería el índice de calificaciones, mientras que la variable utilizada para obtener una mejor predicción (variable independiente x) es el promedio de calificaciones del Bachillerato. El análisis de Correlación, por contraste con la regresión, se utiliza para medir la fuerza de la asociación entre variables. 7.2. REGRESIÓN LINEAL Este modelo es empleado cuando existe una relación lineal entre los datos manejados (interrelación entre variables x,y). Como se muestra en las siguientes gráficas.

Page 175: Libro estadistica coor1

Estadística

175

La relación lineal más simple consiste en una recta, el modelo para la línea recta (lineal) puede expresarse como:

iii xy εββ ++= 10 Donde: β0 = Intersección con el eje y. β1 = Pendiente real de la población. εi = Error relativo en y para toda i. En este modelo, la pendiente β1 de la recta representa el cambio unitario en y, Δy, por cambio unitario en x, Δx, es decir representa la cantidad de cambio de y positivo o negativo, para un cambio particular de x. Por otra parte β0 la intersección del eje y, un factor constante que esta incluido en la ecuación. Representa el valor de y cuando x es igual acero. Además εi representa el error aleatorio en y por cada observación que ocurre. Este término es incluido solo por que el modelo estadístico es solo una aproximación a la relación exacta entre las dos variables. 7.3. DETERMINACIÓN DE LA ECUACIÓN DE REGRESIÓN LINEAL SIMPLE 7.3.1. MÉTODO DE MINIMOS CUADRADOS La ecuación de regresión de una muestra que representa al modelo de regresión lineal es dada por.

ixbby 10 +=∧

Page 176: Libro estadistica coor1

Estadística

176

Donde: b0 = Intersección con el eje y de la muestra. b1 = Pendiente de la muestra.

(i) todaparay de dopronosticaValor =∧

y Estos se pueden utilizar como estimadores de los parámetros (β0, β1) de la población. El análisis de regresión lineal simple le toca encontrar la línea recta que mejor se ajuste a los datos. El mejor ajuste significa que se desea encontrar la línea recta para la cual la diferencia entre el valor real de y, yi y el valor que se

predecirá con la línea de regresión ajustada ∧

y , es la más pequeña que sea posible. Como dichas diferencias son tanto positivas como negativas para diferentes observaciones, matemáticamente se minimiza.

( $ ) ( )y y y b b x SCEi i ii

n

i

n

− = − − ===

∑∑ 20 1

2

11

Donde: yi = Valor real de y para toda i. $yi = Valor predicho de y para toda i.

SCE = Suma de los cuadrados de los errores con respecto a la línea de regresión. Ya que $ ;y b b xi = +0 1 se minimiza ( )y b b xi − +∑ 0 1

2 La cual tiene dos incógnitas b0 y b1 una técnica matemática que determina los valores b0 y b1 que mejor ajustan a los datos observados, se conoce como el

Page 177: Libro estadistica coor1

Estadística

177

método de mínimos cuadrados. Empleando este método se obtienen las ecuaciones normales derivando parcialmente la ecuación anterior con respecto de b0 y b1. Por lo que dichas ecuaciones normales pueden escribirse como:

=

=

−−−=∂

−−−=∂

n

iiii

n

iii

xxbbyb

SCE

xbbyb

SCE

110

1

110

0

)(2)(

)(2)(

Haciendo las derivadas parciales iguales a cero y ordenando términos, se obtienen las ecuaciones siguientes llamadas normales.

∑ ∑ ∑

∑ ∑

= = =

= =

+=

+=

n

i

n

i

n

iiiii

n

i

n

iii

xbxbyx

xbnby

1 1 1

210

1 110

Dado que se tienen dos ecuaciones con dos incógnitas resolviendo en forma simultanea para b0 y b1. Se tiene.

∑ ∑

∑ ∑ ∑

= =

= = =

−= n

i

n

iii

n

i

n

i

n

iiiii

xxn

yxyxnb

1 1

22

1 1 11

)(

))((

xbyb 10 −=

Page 178: Libro estadistica coor1

Estadística

178

O tambien:

∑ ∑

∑ ∑ ∑∑

= =

= = ==

−= n

i

n

iii

n

i

n

i

n

iiiii

n

ii

xxn

yxxyxb

1 1

22

1 1 11

2

0

)(

))(())((

Donde:

i

i

y las de media xlas de media

==

yx

7.3.2. ERROR ESTANDAR DE LA ESTIMACIÓN Aunque el método de mínimos cuadrados da como resultado una línea que ajusta en los datos con la mínima cantidad de variación, la ecuación de regresión no es perfecta para las predicciones, excepto si todos los datos observados caen en la línea de regresión predicha. Así como no se puede esperar que todos los datos caigan en la media aritmética, tampoco se puede esperar que todos los puntos de los datos caigan exactamente en la línea de regresión . Por lo que la línea de regresión sirve sólo para realizar predicciones aproximadas de un valor de y , para un valor dado de x. Entonces se necesita tener un estadístico que mida la variabilidad en los valores reales de y, yi, a

partir de los valores predichos de y, ∧

y en la observación en torno a la línea de regresión se le llama Error Estándar de la estimación. Aunque la recta de regresión predicha cae cerca de muchos de los valores de y, hay valores encima de la recta de regresión así como debajo de ella, de modo

Page 179: Libro estadistica coor1

Estadística

179

que:

0)(1

=−∑=

∧n

iii yy

El error estándar de la estimación, dado por Sxy es expresado como:

Sy y

nxy

i ii

n

=−

−=∑ ( $ )2

1

2

Donde: yi = valor real de y para toda xi dada.

iy∧

= valor predicho de y para toda xi dada.

El cálculo del error estándar de la estimación con el uso de la ecuación anterior requeriría en cálculo del valor predicho de y por cada valor de x en la muestra.

Sin embargo, el cálculo se simplifica, debido a la siguiente ecuación.

∑∑∑ ∑=== =

−−=−n

iii

n

ii

n

i

n

iiii yxbybyyy

11

10

1 1

22)(

El Error Estándar de la estimación Sxy , se puede escribir como:

21 1 1

10

−−=

∑ ∑ ∑= = =

n

yxbybyS

n

i

n

i

n

iiiii

xy

Page 180: Libro estadistica coor1

Estadística

180

7.3.3. MEDIDAS DE VARIACIÓN EN LA REGRESIÓN Y LA CORRELACIÓN A fin de determinar que tan bien predice la variable independiente a la variable dependiente en el modelo estadístico, se necesita desarrollar varias medidas de variación. A la primera medida se le llama variación total, es una medida de yi, en torno a su media y . La variación total se puede dividir en variación explicada o sea la que es atribuible a la relación entre x, y,. Y la variación no explicada, es atribuible a factores que no sean la relación entre x, y, estas están dadas como se observa en la figura siguiente. La variación explicada representa diferencia entre y (valor promedio de y) y yi, (el valor de y que se predeciría con la relación de regresión). La variación no explicada representa la parte de la variación en y que no se explica con la

regresión y esta basada en la diferencia entre yi, (valor real de ∧

y ) y yi, (valor predicho de y para una x dada). Esto se puede representar como:

Page 181: Libro estadistica coor1

Estadística

181

VT = VE + VNE Donde: VT = variación total. VE = variación explicada. VNE = variación no explicada Matemáticamente pueden escribirse como:

∑=

−=n

ii yyVT

1

2)(

2

1)(∑

=

−=n

iii yyVNE

2

1)( yyVE

n

ii −= ∑

=

De lo anterior se tiene que el coeficiente de determinación esta dado como:

2

1

2

12

)(

)(

yy

yy

VTVEr n

ii

n

ii

−==

=

=

Este mide la proporción de variación que se explica con la variable independiente para el modelo de regresión 7.3.4. COEFICIENTE DE CORRELACIÓN Hasta ahora se ha tratado la predicción de la variable dependiente y con base en la variable independiente x. Además se tiene que la correlación mide el grado de asociación entre

Page 182: Libro estadistica coor1

Estadística

182

variables. Como se muestra. La fuerza de una relación entre dos variables se suele medir con el coeficiente de correlación (r) cuyos valores van desde (-1 para la correlación negativa perfecta, hasta +1 para la correlación positiva perfecta). De las gráficas anteriores la primera figura ilustra una relación lineal negativa, perfecta entre x,y. Por lo que hay una relación perfecta uno a uno entre x, y, de modo que y disminuirá de forma perfecta según aumenta x. En la segunda figura se ilustra el caso que no hay relación entre x, y : En la tercera figura se muestra el caso en que y aumenta en una forma perfectamente predecible según aumenta x.

Page 183: Libro estadistica coor1

Estadística

183

El coeficiente de correlación para problemas de regresión de una muestra puede ser obtenido tomando como punto de partida.

Por lo que el coeficiente de correlación es:

Pero para el caso en que solo se efectúa el análisis de correlación en un grupo de datos, el coeficiente r de correlación de la muestra se puede calcular directamente con el uso de:

Ejemplo: Se realizo un estudio sobre la cantidad de azúcar transformada en cierto proceso, a varias temperaturas. Los datos se codificaron y registraron como sigue:

2

1

2

12

)(

)(

yy

yy

VTVEr n

ii

n

ii

−==

=

=

2rr =

∑∑

==

=

−−

−−=

n

ii

n

ii

n

iii

yyxx

yyxxr

1

2

1

2

1

)()(

))((

Page 184: Libro estadistica coor1

Estadística

184

X(temp)

Y(azúcar transf.)

Xi Yi

X2

1 8.1 8.1 1 1.1 7.8 8.58 1.21 1.2 8.5 10.2 1.44 1.3 9.8 12.74 1.69 1.4 9.5 13.3 1.96 1.5 8.9 13.35 2.25 1.6 8.6 13.76 2.56 1.7 10.2 17.34 2.89 1.8 9.3 16.74 3.24 1.9 9.2 17.48 3.61 2 10.5 21.00 4.0

TOTAL 16.5 100.4 152.59 25.85 a). Obtener la ecuación de regresión líneal. b). Escribe la cantidad de azúcar transformada cuando la temperatura codificada

es de 1.75. Como: yx

= == =

100 4 11 913165 11 15

. / .. / .

Como:

∑ ∑∑

==

==

6.1656)4.100(5.16))((25.272)5.16()( 22

ii

i

yxx

Page 185: Libro estadistica coor1

Estadística

185

Por lo que:

Para b0 se tiene:

b0= 9.13 –1.8090 (1.5) = 6.4165 a). Por lo que la ecuación de regresión es dada como: Yi = b0 + b1 (xi) = 6.41 +1.8 (xi) b). Para 1.75 de temperatura. Yi = b0 + b1 (xi) = 6.41 +1.8 (1.75) = 9.56 azúcar transformada. Ejemplo: El número de Contadores Públicos egresados de las escuelas de educación superior de Michoacán y del País y el número de C.P. recibidos entre 1993-1999 ,fue como se muestra:

AÑO 1993 1994 1995 1996 1997 1998 1999 Egresados (miles) 8.81 9.29 9.77 10.25 10.74 11.30 11.78

Titulados 3.78 3.99 4.20 4.41 4.62 4.87 5.01

8090.125.272)85.25(116.1656)9.152(11

)(

))((

1 1

22

1 1 11 =

−−

=−

−=

∑ ∑

∑ ∑ ∑

= =

= = =n

i

n

iii

n

i

n

i

n

iiiii

xxn

yxyxnb

xbyb 10 −=

Page 186: Libro estadistica coor1

Estadística

186

(miles) Usando el método de mínimos cuadrados obtener: a). Obtener la ecuación de regresión. b). Si en un año egresan 20000 C:P, cuántos de ellos pueden esperarse que se

titulen. Solución: Para el caso y representa el número de titulados, mientras x representa el número de pasantes (egresados). Aplicando la metodología anterior se tiene: b0 = 0.1068 b1 = 0.4191 Por lo que: Yi = b0 + b1 (xi) = 0.1068 +0.4191 (xi) b). Para el caso de los 20 000 egresados, se tiene: Y20 = b0 + b1 (xi) = 0.1068 +0.4191 (20)= 8.489 Significa que si egresan 20 000 pasantes, el número esperado de titulados es de 8 489. Ahora se desea conocer el coeficiente de correlación. Se tiene que: r= 0.998 Este nivel del coeficiente de correlación confirma la buena correlación existente entre las dos variables.

Page 187: Libro estadistica coor1

Estadística

187

Page 188: Libro estadistica coor1

Estadística

188

Page 189: Libro estadistica coor1

Estadística

189

CAPITULO 8

NÚMEROS ÍNDICE Es considerado tambien como método de pronóstico. Este concepto es usado para tener información disponible más oportuna a la gerencia, lo cual permite una toma de decisiones más eficiente en el tiempo. Al paso del tiempo los números índice han adquirido importancia eficiente para la administración de negocios, los cuales son usados como indicadores de cambio de la actividad económica o de los negocios. El uso de números índice se ha convertido en el procedimiento de máxima aceptación para medir los cambios en las condiciones de los negocios. En términos generales los números índice construidos en un punto particular en el tiempo miden el tamaño o magnitud de algún artículo en ese punto particular en el tiempo, como un porcentaje de alguna base u objeto de referencia en el pasado. Entre el tipo de números índice que se tienen, se pueden construir índice de precios, índice de calidad, índice de valor, entre otros. Para el caso se centrara la atención en los índices de precios siguientes: 8.1. ÍNDICE DE PRECIOS Los índices de precios expresan el porcentaje de cambio en el precio de algún artículo o grupo de artículos de algún comercio en el período de tiempo dado en relación con el precio pagado por ese artículo o grupo de artículos en un punto particular del tiempo en el pasado. Se tiene que los índices de precios no se calculan solamente una vez, sino que se obtienen en numerosos períodos consecutivos en el tiempo, con el fin de indicar los cambios que se tienen en la actividad económica o en los negocios analizados.

Page 190: Libro estadistica coor1

Estadística

190

8.1.1. PERIODO BASE PARA UN NÚMERO ÍNDICE El período base o punto de referencia empleado para el análisis está dado como el año o período de tiempo en el pasado, contra los cuales se hacen todas las comparaciones. Al seleccionar el período base para un índice dado se deben cuidar las siguientes reglas. a).- El período seleccionado, debe corresponder al caso cuando se tiene

estabilidad económica, en vez de uno que se encuentre en el máximo o próximo a el de una economía en expansión, o bien, un máximo de una economía declinante o en recesión.

b).- El período base debe ser reciente a fin de que las comparaciones no se

afecten sin necesidad por cambios en tecnología, calidad del producto o en las actitudes, intereses, gustos y hábitos de los consumidores.

8.1.2. CÁLCULO DE ÍNDICE DE PRECIOS PARA UN ARTÍCULO La forma de cálculo de un índice de precios para un artículo en particular se realiza como se muestra a continuación.

100)0(

)()( ∗=

i

tit

i PPI

Donde: Ii

(t) = índice de precio del i-ésimo artículo en el período (t) Pi

(t) = precio pagado por el i-ésimo artículo en el período de tiempo t Pi

(0) = precio pagado por el i-ésimo artículo en el período de tiempo 0, o sea en el período base

Page 191: Libro estadistica coor1

Estadística

191

Ejemplo: Se tiene que el costo por unidad del artículo x, se ha comportado como se muestra a continuación

AÑO PRECIO INDICE DE PRECIO 1998 11.80 100.00 1999 10.90 92.37 2000 8.34 70.67 2001 9.20 77.96 2002 11.00 93.22 2003 11.91 100.93 2004 12.23 103.64 2005 11.43 96.86

Para el caso particular se tomó como año base 1998, se empleo la ecuación anterior para el cálculo. 8.1.3. CÁLCULO DE ÍNDICE DE PRECIOS PARA UN CONJUNTO DE ARTÍCULOS Es importante el cálculo de índices de precios para conjuntos de artículos, ya que son los más usados para la toma de decisiones, debido a que tomados así se pueden realizar análisis del conjunto(s), que pueden afectar la calidad de la vida que tienen un gran número de consumidores. Los tipos básicos empleados para realizar dicho cálculo están dados por índice de precios agregado simple, media aritmética simple de precios relativos, índice de precios agregado ponderado, media aritmética ponderada de precios relativos. 8.2. ÍNDICE DE PRECIOS AGREGADO SIMPLE. La forma de cálculo del índice de precios para un conjunto o grupo de artículos a través de este criterio se lleva a cabo empleando la ecuación siguiente:

Page 192: Libro estadistica coor1

Estadística

192

100*

1

)0(

1

)(

)(

=

== n

ii

n

i

ti

tSA

P

PI

En ISA, (t) representa el valor del índice de precios agregado simple en el período de tiempo t.

∑=

n

i

tiP

1

)( = Σ de precios pagados por cada artículo en (t).

∑=

n

iiP

1

)0( = Σ de precios pagados por cada artículo en el período de tiempo 0, el

período base. El cálculo de un índice de precios por este método se inicia sumando los distintos precios de cada unidad de tiempo para obtener el numerador de la ecuación anterior para cada valor de i. Luego, el total de cada período dado se divide por el total del período base. Los resultados se expresan generalmente en forma de porcentajes. Ejemplo: dados los precios de los bienes A, B, C, para los años indicados en la tabla siguiente, se desea calcular los índices de precios respectivos.

BIEN 2003 2004 2005 A $ 1.00 1.25 1.50 B 10.00 11.75 13.50 C 4.00 5.00 4.50 TOTAL $ 15.00 18.00 19.50 No. índice 1.00 1.20 1.30 % 100 120 130

Page 193: Libro estadistica coor1

Estadística

193

Este método asigna igual importancia al cambio absoluto de cada precio. En esto reside el principal defecto del método, porque permite que un bien con un precio alto domine el índice, el precio de B ejerce más influencia que el precio de C, el cual a su vez, domina al precio de A en los números índices. 8.3. MEDIA ARITMÉTICA SIMPLE DE PRECIOS RELATIVOS. Un precio relativo para cualquier producto en cualquier período de tiempo dado, se puede definir como la proporción entre el precio de ese artículo en ese punto dado en el tiempo y su precio en algún período base. Para construir la media aritmética simple de precios relativos, primero se formulan proporciones entre los precios de cada artículo en el período de tiempo t y los precios respectivos en el período base. Una vez que se obtienen las proporciones de precios de cada artículo, se suma el resultado y se divide el total entre el número de artículos que forman el índice, después el promedio se multiplica por cien para expresarlo en porcentaje, la ecuación representativa de este caso está dada como:

100*)0(

1

)(

)(

nP

P

I i

n

i

ti

tSM

∑=

=

Page 194: Libro estadistica coor1

Estadística

194

8.4. ÍNDICE DE PRECIOS AGREGADO PONDERADO Y MEDIA PONDERADA DE PRECIOS RELATIVOS Las ecuaciones representativas de los casos nombrados están dadas como se muestra: El índice de precios agregado ponderado es definido como:

IP Wi

P WiWA

ti

t

i

n

ii

n( )

( )

( )=

⎢⎢⎢⎢

⎥⎥⎥⎥

=

=

∑1

0

1

Para el caso de la media aritmética de precios relativos, la ecuación representativa está dada como:

100*

1

)0(1

)(

)(

=

=

⎟⎟⎟⎟

⎜⎜⎜⎜

= n

ii

ii

n

i

ti

tMW

W

WP

P

I

En las dos ecuaciones Wi representa la ponderación (peso o importancia) agregado al i-ésimo producto (artículo), i=1,2,3,...,n, en los grupos tomados en cuenta para el análisis.

Page 195: Libro estadistica coor1

Estadística

195

CAPITULO 9

APLICACIÓN ESTADÍSTICA PARA EL CÁLCULO DEL RIESGO FINANCIERO

RESUMEN En el presente capítulo se realiza un análisis del riesgo financiero, haciendo uso de información determinística y probabilística para hacer una evaluación en el Azar. Se incorporan los criterios de comportamiento del decisor ante el riesgo para realizar una evaluación del mismo ante la incertidumbre usando técnicas fuzzy. Así mismo se propone una metodología de análisis del riesgo que incorpore el azar y la incertidumbre y permita regular la decisión ante cualquier comportamiento del decisor en proyectos independientes y complementarios. PALABRAS CLAVE: azar, incertidumbre, riesgo, prima de riesgo, fuzzy, aversión, propensión, neutro. El Riesgo de un proyecto de inversión se define como la variación existente entre sus flujos de efectivo reales, con respecto a los esperados. En la practica se maneja que entre más variabilidad exista entre lo proyectado (esperado) y lo real el proyecto es considerado más riesgoso. El Riesgo Emmet J. Vaughan (1997). Es representado desde diversas perspectivas, entre sus diversas definiciones se tienen las siguientes.

• El Riesgo representa el cambio de pérdidas. • El Riesgo representa la posibilidad de pérdida. • El Riesgo es incertidumbre. • El Riesgo representa la dispersión entre lo actual y los resultados

esperados. • El Riesgo es representado como la probabilidad de toda consecuencia

diferente con respecto a una esperada.

Page 196: Libro estadistica coor1

Estadística

196

Debido a que un equivalente semántico en teoría clasica de riesgo es la Incertidumbre. Desde este enfoque primario. Acosta Flores J. (1975), establece que la probabilidad es una medida de la incertidumbre, debido a esto la probabilidad de un evento indica la posibilidad de que ocurra dicho evento y debe cumplir con los axiomas de Kolmogorov. Una probabilidad es subjetiva en el sentido que dos personas razonables, pueden asignar diferentes probabilidades al mismo evento. Esto no significa que la asignación será arbitraria. Las personas que hacen esta asignación basadas en la experiencia que han tenido más o menos la misma, su asignación de probabilidades al evento será muy similar, sus valores serán muy próximos entre si. En este sentido es imprtante establecer la preferencia de los decisores los posibles comportamientos se pueden formular, por ejemplo considerese la siguiente situación. Se tira una moneda legal, si sale águila se ganan $ 500 y si sale sol perderemos $ 40. la probabilidad asociada a cada evento será de 0.5. Las interrogantes asociadas serán: si aceptamos participar en el juego (loteria). Si la respuesta es no, se trata de un comportamiento con aversión al riesgo. Si es si, la siguiente pregunta es cuál es la mínima cantidad que estamos dispuestos a aceptar para dejar que otro juegue en lugar nuestro, a esta cantidad se le llama Equivalente bajo Certeza (EBC). Si la respuesta es menor que el valor esperado de la loteria (donde este es de $ 230), el comportamiento sigue siendo de aversión al riesgo. Si EBC es mayor que el valor esperado el comportamiento es de propensión al riesgo y si es igual se trata de neutralidad al riesgo. Por lo anterior es posible medir la prima de riesgo (PR), esta es la diferencia del valor esperado menos el equivalente bajo certeza, la ecuación de (PR) es:

PR = E(X) – EBC (1)

Page 197: Libro estadistica coor1

Estadística

197

Donde: PR = prima de riesgo E(X) = valor esperado de una loteria EBC = equivalente bajo certeza X = Resultados adoptados por la loteria Si la prima de riesgo es positiva se tiene aversión al riego y representa la cantidad que una persona esta dejando de ganar por esta aversión. Si es igual a cero el comportamiento es de neutralidad al riesgo y si es negativa se trata de propensión al riesgo y representa la cantidad que valúa esa propensión. Esto se mostrado en la tabla siguiente.

COMPORTAMIENTO DE (PR)

Indicador

Comportamieto

PR > 0 Aversión al Riesgo PR = 0 Neutro al Riesgo PR < 0 Propensión al Riesgo

Aversión al Riesgo, el caso más común es cuando aumenta el capital esa aversión puede aumentar, permanecer constante o disminuir. Esto se puede medir observando la variación de la prima de riesgo.

• Si la prima de riesgo aumenta al crecer el capital se tiene un comportamiento de aversión creciente al riesgo.

• Si la prima de riesgo no varía al aumentar el capital se trata de aversión constante.

• Si la prima de riesgo disminuye al aumentar el capital la aversión al riesgo es decreciente. Este es el comportamiento más común, mientras más capital tenemos mayor riesgo estamos dispuestos a afrontar.

Page 198: Libro estadistica coor1

Estadística

198

9.1. CURVAS DE PREFERENCIA Supongase que la curva de preferencia del decisor es cóncava respecto al eje horizontal. Considerando la loteria 0.5 (r), 0.5 (r´), por lo que E(x) = 0.5(r) + 0.5 (r´) = (r + r´ )/2. En la curva de preferencia se puede establecer que r es p y la de r´es p´. La preferencia de la lotería es su preferencia esperada, y es igual a 0.5 p + 0.5 p´=(p+p´)/2. Luego el valor que tiene esa preferencia corresponde al equivalente bajo certeza de la lotería. Como EBC es menor que el valor esperado se concluye que una curva cóncava representa un comportamiento de aversión al riesgo como se observa en la siguiente figura.

Curva de preferencia cóncava

Page 199: Libro estadistica coor1

Estadística

199

Haciendo un análisis semajante con una curva convexa respecto al eje horizontal se concluye que representa un comportamiento de propensión al riesgo como se observa:

Curva de preferencia convexa La línea recta representa la neutralidad al riesgo como se muestra a continuación:

Curva lineal de preferencia

Page 200: Libro estadistica coor1

Estadística

200

Se tiene que el decisor puede tener una combinación de esos comportamientos dependiendo de las cantidades de recurso financiero que esten en juego y este dispuesto a invertir. Por ejemplo podría ser con neutralidad al riesgo en cantidades pequeñas donde no le importa mucho (A), después con aversión al riesgo (B) y tal vez posteriormente exista algún nivel de aspiración, donde por llegar ahí se está dispuesto a correr grandes riesgos (C), esto se representa en la figura siguiente:

Comportamiento mixto del inversionista De las gráficas anteriores se tiene que el comportamiento del decisor puede clasificarse como:

COMPORTAMIENTO DE LA FUNCIÓN DE RIESGO

Estado del Riesgo Comportamiento

Propensión Creciente Neutralidad Constante

Aversión Decreciente

Page 201: Libro estadistica coor1

Estadística

201

Sin embargo se tiene que las decisiones son la respuesta a una interrogante cuyos hechos a su alrededor tienen tanta incertidumbre que la respuesta no es obvia. Ramírez Sarrión D (1998) y González Santoyo F. et al (2000), establecen dos tipos de Incertidumbre la óntica y la epistémica. La óntica se vincula a los hechos y los entes, la epistémica al conocimiento, por lo anterior la Incertidumbre se define como la ausencia de certeza o conocimiento seguro. Desde hace un cierto tiempo los estudios de economía y gestión de empresas Gil Aluja J. (1999), estan intentando canalizar sus inquietudes para resolver los graves problemas que los sistemas sociales, económicos y empresariales están planteando como consecuencia de la situación de incertidumbre característica de nuestra época. Así en el medio científico un buen número de ellos hacen propuestas que, en diferentes sentidos convergen en dar un nuevo tratamiento tanto a viejos problemas como a los que van surgiendo del complejo mundo de las relaciones económico – financieras. Hoy día es necesario explicar los fenómenos que aparecen en cada momento apreciando los cambios inductores de incertidumbre, de esto es posible obtener ciertos comportamientos expresables la mayor parte de ellos mediante posibilidades, algunos a através de probabilidades y muy pocos por certeza. Por lo anterior es evidente el establecer procesos de el como utilizar el análisis númerico, principalmente en la certeza y el azar, pero tambien en la incertidumbre, en los que se apoyan los tratados en este trabajo. En Kaufman A., Gil Aluja J. (1990), se establece que la Incertidumbre y la Aleatoriedad son palabras que se usan con frecuencia de forma indistinta incluso en el ámbito científico. Sin embargo es importante hacer notar que a ningún ser humano de ciencia le pasará por alto la existencia de una diferenciación entre lo que no es mensurable y lo que es mensurable. La principal herramienta matemática para el tratamiento de la incertidumbre es la teoría de lo difuso y de la valuación con sus infinitas variantes. Mientras que la relativa al azar es la teoría de probabilidades.

Page 202: Libro estadistica coor1

Estadística

202

Para cada proyecto bajo estudio se pueden hacer estimados de diversos flujos de efectivo futuros. Antes de estimar solamente el resultado del flujo más probable para cada año en el futuro. De esta forma se esta en posibilidad de considerar la escala de posibles flujos de efectivo para un período futuro en particular, en lugar de un sólo el flujo de efectivo más probable, en este sentido una herramienta eficiente para conocer la variabilidad existente en los flujos de efectivo para todo tiempo es la: 9.2. MEDICION DE LA DISPERSIÓN En la Teoría clásica del tratamiento del azar la dispersión es una forma de conocer el riesgo, el mismo esta asociado a la obtención del nivel de alejamiento o acercamiento de la información de los flujos de fondos con respecto al valor medio de los mismos, para el caso se pueden usar eficientemente los indicadores de dispersión de la Estadística Descriptiva estos son:

• Varianza (σ2) • Desviación Estándar (σ) • Coeficiente de Variación (C.V.)

Las distribuciones de probabilidades de los flujos de efectivo de cualquier proyecto de inversión, se pueden resumir en términos de dos parámetros de la distribución los cuales son:

• El Valor Esperado • La Desviación Estándar

El Valor Esperado de los Flujos de Efectivo para el período (t), se define como (VEF).

∑=

=n

xxtxt PFVEF

1

))(( (2)

Page 203: Libro estadistica coor1

Estadística

203

Donde: VEF = Valor esperado de flujo de efectivo para (t) Fxt = Flujo de efectivo para la énesima posibilidad al período (t) Pxt = Probabilidad de que ocurra ese flujo de efectivo n = Número total de posibilidades de que ocurra el flujo de efectivo en (t). Se tiene que la medida convensional de la dispersión es la desviación estándar, mientras más estrecha es la distribución más pequeña deberá ser esta medida, mientras más amplia es la distribución máyor será este indicador. • DESVIACIÓN ESTANDAR DE FLUJOS DE EFECTIVO para el período (t). Se representa como:

∑=

−=n

xxtxtt PVEFF

1

2 )()(σ (4)

• COEFICIENTE DE VARIACIÓN (CV) Una medida de dispersión relativa es el coeficiente de variación , se expresa como el cociente entre la desviación estándar y el valor esperado. Por lo que es una forma de medir el riesgo en terminos relativos o porcentuales, la ecuación representativa es:

C.V. = (σ/VEF) * 100 (5) Como vía de explicación de estos indicadores del riesgo se usara el siguiente caso:

Page 204: Libro estadistica coor1

Estadística

204

Ejemplo: Supóngase que la Compañia “W” en su planeación estrategica, a considerado dos propuestas de inversión (A y B) que considera incrementara eficientemente el posicionamiento corporativo en el mercado global. Los expertos financieros de la Compañia después de evaluar el futuro conforme con cada una de las situaciones citadas en la tabla siguiente determinaron que los flujos de efectivo para cada año son:

FLUJOS DE EFECTIVO

FLUJOS EFECTIVO (AÑO 1) ESTADO DE LA

ECONOMIA PROPUESTA (A) PROPUESTA (B)

Recesión Grave (RG) $ 3000 $ 2000 Recesión Leve (RL) 3500 3000 Normal (N) 4000 4000 Auge Menor (AM) 4500 5000 Auge Mayor (AM1) 5000 6000

Para el caso se observa que los flujos de la propuesta B son mayores y representan una mayor dispersión que los de la A; por lo que se considera que es más riesgosa. Sin embargo para medir el nivel de riesgo se requiere tener más información adicional, asociada con el conocimiento de la probabilidad de que ocurran los diversos estados de la economía, estos de acuerdo a los análisis de los expertos financieros de la empresa se han determinado como se muestra.

NIVEL DE PROBABILIDAD EN INVERSIONES ESTADO DE LA

ECONOMIA PROPUESTA (A) PROPUESTA (B)

Probabilidad Flujo de Efectivo Probabilidad Flujo de

Efectivo RG .10 $ 3000 .10 $ 2000 RL .20 3500 .20 3000 N .40 4000 .40 4000

AM .20 4500 .20 5000 AM1 .10 5000 .10 6000

1.0 1.0

Page 205: Libro estadistica coor1

Estadística

205

De la tabla se observa que la dispersión de los flujos de efectivo es mayor para la propuesta B que para la propuesta A, a pesar de que el resultado màs probable es el mismo para ambas propuestas de inversión: $ 4000. De acuerdo a los criterios tradicionales de evaluación de inversiones, la empresa clasificaría de igual forma las propuestas, sin embargo si el decisor toma en cuenta la dispersión del comportamiento de los flujos, el riesgo esta relacionado con la distribuciòn de probabilidades de los posibles flujos de efectivo en el ejemplo. Se consideraría que entre mayor sea la dispersión mayor será el riesgo, por lo que la propuesta B será la inversión más riesgosa de acuerdo al comportamiento de la dispersión observada en la variación de dichos flujos. “Si la Gerencia, los accionistas y los acreedores sienten aversión al riesgo, preferirían la propuesta A a la propuesta B” 9.3. OBTENCIÓN DE INDICADORES DE RIESGO EN EL AZAR Para el caso de análisis:

EVALUACIÓN DE LA PROPUESTA DE INVERSIÓN (A)

Flujo de Efectivo Posible Fxt

Probabilidad de Ocurrencia Pxt

(Fxt)(Pxt) (Fxt – VEF)2(Pxt)

$ 3000 .10 $ 300 (3000-4000)2(.1) 3500 .20 700 (3500-4000)2(.2) 4000 .40 1600 (4000-4000)2(.4) 4500 .20 900 (4500-4000)2(.2) 5000 .10 500 (5000-4000)2(.1)

1.0 $ 4000 = VEF $ 300 000 = σ2 Total (300 000)0.5=$548 = σ

Page 206: Libro estadistica coor1

Estadística

206

El valor esperado de la propuesta A es $ 4000, de forma analoga para la propuesta B, Sin embargo, la desviación estándar para la propuesta A es de $ 548, mientras que la desviación estándar para la propuesta B es de $ 1 095. Por lo anterior se observa que la propuesta B tiene una dispersión mayor, por tanto representa un mayor riesgo. Para el Coeficiente de Variación los resultados son:

C.V.(A) = 548/4000 = 0.14 = 14 %

C.V.(B) = 1095/4000 = 0.27 = 27 % Por lo anterior, se observa bajo este criterio que la propuesta B tiene más riesgo con respecto de la A, esto es presentado como:

TABLA # 6 INDICADORES DE RIESGO EN EL AZAR

Propuesta de Inversión VEF σ C.V. A 4000 548 14 % B 4000 1095 27 %

9.4. ANÁLISIS EN LA INCERTIDUMBRE Para el caso se hace un análisis difuso del de riesgo, este puede ser ejecutado haciendo uso del ejemplo tratado en el apartado anterior, tomando las consideraciones que la Compañía “W” en un estudio de comportamiento ante la incertidumbre, los expertos financieros de la empresa consideran que la información presentada para las propuestas de inversión se mueven en los rangos mostrados para cada estado como un número difuso triangular presentado en las tablas siguientes.

Page 207: Libro estadistica coor1

Estadística

207

FLUJOS DE EFECTIVO (CICLO 1)

Estado de la Economía Propuesta A Propuesta B RG (2800, 3000, 3500) (1500, 2000, 2500) RL (3200, 3500, 3800) (2500, 3000, 3500) N (3800, 4000, 4500) (3500, 4000, 4500)

AM (4300, 4500, 5000) (4500, 5000, 5500) AM1 (4900, 5000, 5500) (5500, 6000, 6500)

Para el cálculo y análisis de los indicadores financieros en difusos, se hace necesario establecer los intervalos de confianza para los flujos en función de los distintos estados de la ecomonía y del nivel de posibilidad que los expertos financieros han establecido para el análisis, considerandose de acuerdo a su experiencia y expertez como los más eficientes, estos se muestran en las tablas siguientes.

INTERVALOS DE CONFIANZA (A)

Estado de la Economía Intervalo de Confianza Int. Confianza(posibilidad)RG (2800+200α, 3500-500α) (0.09+0.01α, 0.11-0.01α) RL (3200+300α, 3800-300α) (0.19+0.01α, 0.21-0.01α) N (3800+200α, 4500-500α) (0.35+0.05α, 0.41-0.01α)

AM (4300+200α, 5000-500α) (0.19+0.01α, 0.21-0.01α) AM1 (4900+100α, 5500-500α) (0.09+0.01α, 0.11-0.01α)

INTERVALOS DE CONFIANZA (B) Estado de la Economía Intervalo de Confianza Int. Confianza(posibilidad)

RG (1500+500α, 2500-500α) (0.09+0.01α, 0.11-0.01α) RL (2500+500α, 3500-500α) (0.19+0.01α, 0.21-0.01α) N (3500+500α, 4500-500α) (0.35+0.05α, 0.41-0.01α)

AM (4500+500α, 5500-500α) (0.19+0.01α, 0.21-0.01α) AM1 (5500+500α, 6500-500α) (0.09+0.01α, 0.11-0.01α)

Page 208: Libro estadistica coor1

Estadística

208

ANALISIS DE LA PROPUESTA DE INVERSIÓN (A)

α VEF σ2 σ C.V. 0.0 (3,448.0000, 4683.0000) (1,041,976.9900, 1449071.2000) (1,020.7727, 1203.7737) (0.2571, 0.2960)0.1 (3,501.5800, 4612.6300) (904,994.6092, 1235510.4979) (951.3120, 1111.5352) (0.2410, 0.2717)0.2 (3,555.5200, 4542.7200) (781,401.8097, 1044068.5404) (883.9693, 1021.7967) (0.2249, 0.2486)0.3 (3,609.8200, 4473.2700) (671,422.9670, 874678.1247) (819.4040, 935.2423) (0.2091, 0.2270)0.4 (3,664.4800, 4404.2800) (575,274.7244, 727268.5317) (758.4687, 852.8004) (0.1936, 0.2070)0.5 (3,719.5000, 4335.7500) (493,166.0497, 601765.5063) (702.2578, 775.7355) (0.1789, 0.1888)0.6 (3,774.8800, 4267.6800) (425,298.2926, 498091.2379) (652.1490, 705.7558) (0.1654, 0.1728)0.7 (3,830.6200, 4200.0700) (371,865.2420, 416164.3414) (609.8075, 645.1080) (0.1536, 0.1592)0.8 (3,886.7200, 4132.9200) (333,053.1825, 355899.8372) (577.1076, 596.5734) (0.1443, 0.1485)0.9 (3,943.1800, 4066.2300) (309,040.9524, 317209.1322) (555.9145, 563.2132) (0.1385, 0.1410)1.0 (4,000.0000, 4000.0000) (300,000.0000, 300000.0000) (547.7226, 547.7226) (0.1369, 0.1369)

ANALISIS DE LA PROPUESTA DE INVERSIÓN (B)

α VEF σ2 σ C.V. 0.0 (3185.0000, 4725.0000) (2465568.7500, 3115686.2500) (1570.2130, 1765.1307) (0.3736, 0.4930)0.1 (3262.4500, 4650.2500) (2222495.5074, 2763737.3776) (1490.8036, 1662.4492) (0.3575, 0.4570)0.2 (3340.8000, 4576.0000) (2003990.5280, 2446780.8256) (1415.6237, 1564.2189) (0.3418, 0.4237)0.3 (3420.0500, 4502.2500) (1810571.2686, 2165075.2476) (1355.5747, 1471.4195) (0.3268, 0.3934)0.4 (3500.2000, 4429.0000) (1642743.1860, 1918870.4412) (1281.6954, 1385.2330) (0.3128, 0.3662)0.5 (3581.2500, 4356.2500) (1500999.8047, 1708407.2266) (1225.1530, 1307.0605) (0.3000, 0.3421)0.6 (3663.2000, 4284.0000) (1385822.7840, 1533917.3248) (1177.2097, 1238.5142) (0.2891, 0.3214)0.7 (3746.0500, 4212.2500) (1297681.9858, 1395623.2365) (1139.1585, 1181.3650) (0.2805, 0.3041)0.8 (3829.8000, 4141.0000) (1237035.5420, 1293738.1204) (1112.2210, 1137.4261) (0.2747, 0.2904)0.9 (3914.4500, 4070.2500) (1204329.9219, 1228465.6715) (1097.4197, 1108.3617) (0.2723, 0.2804)1.0 (4,000.0000, 4000.0000) (1200000.0000, 1200000.0000) (1095.4451, 1095.4451) (0.2739, 0.2739)

De lo anterior los resultados de ambas propuestas de inversión ante la Incertidumbre son:

Page 209: Libro estadistica coor1

Estadística

209

INDICADORES DEL RIESGO EN LA INCERTIDUBRE

Propuesta de

Inversión σ2 σ C.V

A

(1041976.9900, 300000.0000, 1449071.2000) (1020.7727, 547.7226, 1203.7737) (0.2571, 0.1369, 0.2960)

B

(2465568.7500, 1200000.0000, 3115686.2500) (1570.2130, 1095.4451, 1765.1307) (0.3763, 0.2739, 0.4930)

9.5. PROPUESTA DE EVALUACIÓN DEL RIESGO FINANCIERO En situaciones en que las empresas en su planeación estrategica establecen propuestas de inversión independientes o complementarias, se recomienda hacer uso de la metodología propuesta a continuación, esta presenta la fortaleza de incluir los análisis del azar y poder definir los (n) posibles intervalos en los que un decisor puede definir su posición y preferencia.

Propuesta Metodológica

• A: Inicio • Definición del problema. • Obtención y ordenamiento de información. • Evaluación del riesgo con información deterministica. • Evaluación de indicadores del riesgo en el azar. • Evaluación de indicadores del riesgo en la incertidumbre. • Establecimiento y ubicación de indicadores de riesgo (finales) ante el

comportamiento del decisor , tomando como base inf. deterministica, el azar y la incertidumbre.

• Toma de decisiones (selección de inversión (es) más eficientes). • Si la decisión no es satisfactoria, ir a A.

Page 210: Libro estadistica coor1

Estadística

210

9.6. RESULTADOS Y CONCLUSIONES Los resultados obtenidos en el azar y la incertidumbre son:

TABLA DE RESULTADOS

Propuesta de Inversión σA C.V.A σI C.V.I

A 548 14 % (1020.7727, 547.7226, 1203.7737) (0.2571, 0.1369, 0.2960) B 1095 27 % (1570.2130, 1095.4451, 1765.1307) (0.3763, 0.2739, 0.4930)

Del análisis bajo el azar a pesar de que el valor esperado es el mismo $ 4000, si este es tomado como indicador de decisión, ambas propuestas son igualmente atractivas para invertir, sin embargo si se toma (σA) o (C.V.A) se observa que la propuesta (B) presenta una mayor dispersión de los flujos de fondos , por tanto un mayor nivel de riesgo financiero con respecto de (A), de los anterior se tiene que si los inversionistas de la compañía “W” sienten aversión al riesgo preferirán la propuesta (A) con respecto de (B) y si tienen propensión al riesgo de acuerdo a la tabla # 1 preferirán la propuesta de inversión (B). El criterio de decisión anterior es consistente cuando dichas propuestas de inversión son evaluadas en la incertidumbre en este sentido se observa para (σA) respecto de (A) que si bien el valor más cierto esperado el 547. 7226 aproximado a 548 que ofrece el análisis bajo el azar, el mismo se espera se mueva en el rango del número difuso (1020.7727, 547.7226, 1203.7737), así mismo para (C.V.A) se espera se mueva en el rango del número difuso (0.2571, 0.1369, 0.2960), de la misma forma para la propuesta (B). Esta información le permitirá al inversionista, poder regular eficientemente su comportamiento de aversión, propenso y neutral ante el riesgo dependiendo de la circunstancias financieras y económicas que se presenten en el sistema de análisis, por lo que la toma de decisiones de alto nivel podra ser potenciada apoyándose en la propuesta metodologica que se presenta en el presente trabajo.

Page 211: Libro estadistica coor1

Estadística

211

A P E N D I C E S

Page 212: Libro estadistica coor1

Estadística

212

00000 00001 11111 11112 22222 22223 33333 33334Hilera 12345 67890 12345 67890 12345 67890 12345 67890

01 66194 28926 99547 16625 45515 67953 12108 5784602 78240 43195 24837 32511 70880 22070 52602 6188103 00833 88000 67299 68215 11274 55624 32991 1743604 12111 86683 61270 58036 64192 90611 15145 0174805 47189 99951 05755 03834 43782 90599 40282 5141706 76396 72486 62423 27618 84184 78922 73561 5281807 46409 17469 32483 09083 76175 19985 26309 9153608 74626 22111 87286 46772 42243 68046 44250 4243909 34450 81974 93723 49023 58432 67083 36876 9339110 36327 72135 33005 28701 34710 49359 50693 8931111 74185 77536 84825 09934 99103 09325 67389 4586912 12296 41623 62873 37943 25584 09609 63360 4727013 90822 60280 88925 99610 42772 60561 76873 0411714 72121 79152 96591 90305 10189 79778 68016 1374715 95268 41377 25684 08151 61816 58555 54305 8618916 92603 09091 75884 93424 72586 88903 30061 1445717 18813 90291 05272 01223 79607 95426 34900 0977818 38840 26903 28624 67157 51986 42865 14508 4931519 05959 33836 53758 16562 41081 38012 41230 2052820 85141 21155 99212 32685 51403 31926 69813 5878121 75047 59643 31074 38172 03718 32119 69506 6714322 30752 95260 68032 62871 58781 34143 62490 6976623 22986 82575 42187 62295 84295 30634 66502 3144224 99439 86692 90348 66036 48399 73451 26698 3943725 20389 93029 11881 71685 65452 89047 63669 0265626 39249 05173 68256 36359 20250 68686 05947 0933527 96777 33605 29481 20063 09398 01843 35139 6134428 04860 32918 10798 50492 52655 33359 94713 2839329 41613 42375 00403 03656 77580 87772 86877 5708530 17930 00794 53836 53692 67135 98102 61912 1124631 24649 31845 25736 75231 83808 98917 93829 9943032 79899 34061 54308 59358 56462 58166 97302 8682833 76801 49594 81002 30397 52728 15101 72070 3370634 36239 63636 38140 65731 39788 06872 38971 5336335 07392 64449 17886 63632 53995 17574 22247 6260736 67133 04181 33874 98835 67453 59734 76381 6345537 77759 31504 32832 70861 15152 29733 75371 3917438 85992 72268 42920 20810 29361 51423 90306 7357439 79553 75952 54116 65553 47139 60579 09165 8549040 41101 17336 48951 53674 17880 45260 08575 4932141 36191 17095 32123 91576 84221 78902 82010 3084742 62329 63898 23268 74283 26091 68409 69704 8226743 14751 13151 93115 01437 56945 89661 67680 7979044 48462 59278 44185 29616 76537 19589 83139 2845445 29435 88105 59651 44391 74588 55114 80834 8568646 28340 29285 12965 14821 80425 16602 44653 7046747 02167 58940 27149 80242 10587 79736 34959 7533948 17864 00991 39557 54981 23588 81914 37609 1312849 79675 80605 60059 35862 00254 36546 21545 7817950 72335 82037 92003 34100 29879 46613 89720 13274

C O L U M N A

TABLA DE NUMEROS ALEATORIOS

Page 213: Libro estadistica coor1

Estadística

213

N a = 0.2 a = 0.3 a = 0.4 a = 0.5 a = 0.60 1.0000000 1.0000000 1.0000000 1.0000000 1.00000001 0.1812692 0.2591818 0.3296800 0.393469 0.4511882 0.0175231 0.0369363 0.0615519 0.090204 0.1219013 0.0011485 0.0035995 0.0079263 0.014388 0.0231154 0.0000568 0.0002658 0.0007763 0.001752 0.0033585 0.0000023 0.0000158 0.0000612 0.000172 0.0003946 0.0000001 0.0000008 0.0000040 0.000014 0.0000397 0.0000002 0.000001 0.000003N a = 0.7 a = 0.8 a = 0.9 a = 1.0 a = 1.20 1.0000000 1.0000000 1.0000000 1.0000000 1.00000001 0.503415 0.550671 0.59343 0.632121 0.6988062 0.155805 0.191208 0.227518 0.264241 0.3373733 0.034142 0.047423 0.062857 0.080301 0.1205134 0.005753 0.009080 0.013459 0.018988 0.0337695 0.000786 0.001411 0.002344 0.003660 0.0077466 0.00009 0.000184 0.000343 0.000594 0.0015007 0.000009 0.000021 0.000043 0.000083 0.0002518 0.000001 0.000002 0.000005 0.000010 0.000379 0.000001 0.00000510 0.000001N a = 1.4 a = 1.6 a = 1.8 a = 1.9 a = 2.00 1.0000000 1.0000000 1.0000000 1.0000000 1.00000001 0.753403 0.798103 0.834701 0.850431 0.8646652 0.408167 0.475069 0.537163 0.566251 0.5939943 0.166502 0.216642 0.269379 0.296280 0.3233244 0.053725 0.078813 0.108708 0.125298 0.1428775 0.014253 0.023682 0.036407 0.044081 0.0526536 0.003201 0.006040 0.10378 0.013219 0.0165647 0.000622 0.001336 0.002569 0.003446 0.0045348 0.000107 0.000260 0.000562 0.000793 0.0010979 0.000016 0.000045 0.000110 0.000163 0.00023710 0.000002 0.000007 0.000019 0.000030 0.00004611 0.000001 0.000003 0.000005 0.000008N a = 2.5 a = 3.0 a = 3.5 a = 4.0 a = 4.5 a = 5.00 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000 1.00000001 0.917915 0.950213 0.969803 0.981684 0.988891 0.9932622 0.712703 0.800852 0.864112 0.908422 0.938901 0.9595723 0.456187 0.576810 0.679153 0.761897 0.826422 0.8753484 0.242424 0.352768 0.463367 0.566530 0.657704 0.7349745 0.108822 0.184737 0.274555 0.371163 0.467896 0.5595076 0.042021 0.083918 0.142386 0.214870 0.297070 0.3840397 0.014187 0.033509 0.065288 0.110674 0.168949 0.2378178 0.004247 0.011905 0.026739 0.051134 0.086586 0.1333729 0.001140 0.003803 0.009874 0.021363 0.040257 0.06809410 0.000277 0.001102 0.003315 0.008132 0.017093 0.03182811 0.000062 0.000292 0.001019 0.00284 0.006669 0.01369512 0.000013 0.000071 0.000289 0.000915 0.002404 0...545313 0.000002 0.000016 0.000076 0.000274 0.000805 0.0201914 0.000003 0.000019 0.000076 0.000252 0.00069815 0.000001 0.000004 0.000020 0.000074 0.00022616 0.000001 0.000005 0.000020 0.00006917 0.000001 0.000005 0.00002018 0.000001 0.00000519 0.00001

Función de distribución de Poisson

Page 214: Libro estadistica coor1

Estadística

214

n = 10 n = 10 n = 10 n = 10x = 10 x = 9 x = 8 x = 7 p

0.0000000 0.0000000 0.0000000 0.0000000 0.010.0000000 0.0000000 0.0000000 0.0000000 0.020.0000000 0.0000000 0.0000000 0.0000000 0.030.0000000 0.0000000 0.0000000 0.0000000 0.040.0000000 0.0000000 0.0000000 0.0000001 0.050.0000000 0.0000000 0.0000000 0.0000003 0.060.0000000 0.0000000 0.0000000 0.0000008 0.070.0000000 0.0000000 0.0000001 0.0000020 0.080.0000000 0.0000000 0.0000002 0.0000045 0.090.0000000 0.0000000 0.0000004 0.0000091 0.100.0000000 0.0000000 0.0000008 0.0000173 0.110.0000000 0.0000000 0.0000015 0.0000308 0.120.0000000 0.0000001 0.0000029 0.0000525 0.130.0000000 0.0000002 0.0000051 0.0000856 0.140.0000000 0.0000003 0.0000087 0.0001346 0.150.0000000 0.0000006 0.0000142 0.0002051 0.160.0000000 0.0000010 0.0000226 0.0003042 0.170.0000000 0.0000017 0.0000350 0.0004401 0.180.0000001 0.0000027 0.0000528 0.0006229 0.190.0000001 0.0000042 0.0000779 0.0008644 0.200.0000002 0.0000064 0.0001127 0.0011783 0.210.0000003 0.0000097 0.0001599 0.0015804 0.220.0000004 0.0000143 0.0002232 0.0020885 0.230.0000006 0.0000207 0.0003068 0.0027228 0.240.0000010 0.0000296 0.0004158 0.0035057 0.250.0000014 0.0000416 0.0005362 0.0044618 0.260.0000021 0.0000577 0.0007350 0.0056181 0.270.0000030 0.0000791 0.0009605 0.0070039 0.280.0000042 0.0001072 0.0012420 0.0086507 0.290.0000059 0.0001437 0.0015904 0.0105921 0.300.0000082 0.0001906 0.0020179 0.0128637 0.310.0000113 0.0002505 0.0025384 0.0155029 0.320.0000153 0.0003263 0.0034673 0.0185489 0.330.0000206 0.0004214 0.0039219 0.0220422 0.340.0000276 0.0005399 0.0048213 0.0260243 0.350.0000366 0.0006865 0.0058864 0.0305376 0.360.0000481 0.0008668 0.0071403 0.0356252 0.370.0000628 0.0010871 0.0086079 0.0413301 0.380.0000814 0.0013546 0.0103163 0.0476949 0.390.0001049 0.0016777 0.0122946 0.0547619 0.400.0001342 0.0020658 0.0145738 0.0625719 0.410.0001708 0.0025295 0.0171871 0.0711643 0.420.0002161 0.0030809 0.0201696 0.0805763 0.430.0002720 0.0037335 0.0235583 0.0908427 0.440.0003405 0.0045022 0.0273918 0.1019949 0.450.0004242 0.0054040 0.0317105 0.1140612 0.460.0005260 0.0064574 0.0365560 0.1270655 0.470.0006493 0.0076828 0.0419713 0.1410272 0.480.0007979 0.0091028 0.0480003 0.1559607 0.490.0009766 0.0107422 0.0546875 0.1718750 0.50

Función de la distribución binomial

( )1 1− − = −

=

=

∑F x p qrn r n r

r x

r n

( )

Page 215: Libro estadistica coor1

Estadística

215

n = 10 n = 10 n = 10 n = 10 n = 10 n = 10x = 6 x = 5 x = 4 x = 3 x = 2 x = 1 p

0.0000000 0.0000000 0.0000020 0.0001138 0.0042662 0.0956179 0.010.0000000 0.0000007 0.0000305 0.0008639 0.0161776 0.1829272 0.020.0000001 0.0000054 0.0011471 0.0027650 0.0345066 0.2625759 0.030.0000007 0.0000218 0.0004426 0.0062137 0.0581538 0.3351674 0.040.0000028 0.0000637 0.0010285 0.0115036 0.0861384 0.4012631 0.050.0000079 0.0001517 0.0020293 0.0188378 0.1175880 0.4613849 0.060.0000193 0.0003139 0.0035761 0.0283421 0.1517299 0.5160177 0.070.0000415 0.0005857 0.0058013 0.0400754 0.1878825 0.5656115 0.080.0000810 0.0010096 0.0088338 0.0540400 0.2254471 0.6105839 0.090.0001469 0.0016349 0.0127952 0.0701908 0.2639011 0.6513216 0.100.0002507 0.0025170 0.0177972 0.0884435 0.3027908 0.6881828 0.110.0004069 0.0037161 0.0239388 0.1086818 0.3417250 0.7214990 0.120.0006332 0.0052967 0.0313048 0.1307642 0.3803692 0.7515766 0.130.0009505 0.0073263 0.0399642 0.1545298 0.4184400 0.7786984 0.140.0013832 0.0098741 0.0499698 0.1798035 0.4557002 0.8031256 0.150.0019593 0.0130101 0.0613577 0.2064005 0.4919536 0.8250988 0.160.0027098 0.0168038 0.0741472 0.2341305 0.5270412 0.8448396 0.170.0036694 0.0213229 0.0883411 0.2628010 0.5608368 0.8625520 0.180.0048757 0.0266325 0.1039261 0.2922204 0.5932435 0.8784233 0.190.0063694 0.0327935 0.1208739 0.3222005 0.6241904 0.8926258 0.200.0081935 0.0398624 0.1391418 0.3525586 0.6536289 0.9053172 0.210.0103936 0.0478897 0.1586739 0.3831197 0.6815306 0.9166422 0.220.0130167 0.0569196 0.1794024 0.4137173 0.7078843 0.9267332 0.230.0161116 0.0669890 0.2012487 0.4441949 0.7326936 0.9357111 0.240.0197277 0.0781269 0.2241249 0.4744072 0.7559748 0.9436865 0.250.0239148 0.0903542 0.2479349 0.5042200 0.7777550 0.9507601 0.260.0287224 0.1036831 0.2725761 0.5335112 0.7980705 0.9570237 0.270.0341994 0.1181171 0.2979405 0.5621710 0.8169646 0.9625609 0.280.0403932 0.1336503 0.3239164 0.5901015 0.8344869 0.9674476 0.290.0473490 0.1502683 0.3503893 0.6172172 0.8506917 0.9717525 0.300.0551097 0.1679475 0.3772423 0.6434445 0.8656366 0.9755381 0.310.0637149 0.1866554 0.4043626 0.6687212 0.8793821 0.9788608 0.320.0732005 0.2063514 0.4316320 0.6929966 0.8919901 0.9817716 0.330.0835979 0.2269866 0.4589388 0.7162304 0.9035235 0.9843166 0.340.0949341 0.2485045 0.4861730 0.7383926 0.9140456 0.9865373 0.350.1072304 0.2708415 0.5132284 0.7594627 0.9236190 0.9884708 0.360.1205026 0.2939277 0.5400038 0.7794292 0.9323056 0.9901507 0.370.1347603 0.3176870 0.5664030 0.7982887 0.9401661 0.9916070 0.380.1500068 0.3420385 0.5923361 0.8160453 0.9472594 0.9928666 0.390.1662386 0.3668967 0.6177194 0.8327102 0.9536426 0.9939534 0.400.1834452 0.3921278 0.6424762 0.8483007 0.9593705 0.9948888 0.410.2016092 0.4177749 0.6665372 0.8628393 0.9644958 0.9956920 0.420.2207058 0.4436094 0.6898401 0.8763538 0.9690684 0.9963797 0.430.2407033 0.4695813 0.7123307 0.8888757 0.9731358 0.9969669 0.440.2615627 0.4955954 0.7339621 0.9004403 0.9767429 0.9974670 0.450.2832382 0.5215571 0.7546952 0.9110859 0.9799319 0.9978917 0.460.3056772 0.5473730 0.7744985 0.9208530 0.9827422 0.9982511 0.470.3288205 0.5729517 0.7933448 0.9297839 0.9852109 0.9985544 0.480.3526028 0.5982047 0.8112268 0.9379222 0.9873722 0.9988096 0.490.3769531 0.6238469 0.8281215 0.9453125 0.9892578 0.9990234 0.50

Función de la distribución binomial (continuación)

( )1 1− − = −

=

=

∑F x p qrn r n r

r x

r n

( )

Page 216: Libro estadistica coor1

Estadística

216

z 0 1 2 3 4 5 6 7 8 9-3.0 0.0013 0.0010 0.0007 0.0005 0.0003 0.0002 0.0002 0.0001 0.0001 0.0000-2.9 0.0019 0.0018 0.0017 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084-2.2 0.0139 0.0136 0.0132 0.0129 0.0126 0.0122 0.0119 0.0116 0.0113 0.0110-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0238 0.0233-1.8 0.0359 0.0352 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0300 0.0294-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0570 0.0559-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0722 0.0708 0.0694 0.0681-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0895-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867-0.7 0.242 0.2389 0.2358 0.2327 0.2297 0.2266 0.2236 0.2206 0.2177 0.2148-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2887 0.2843 0.2810 0.2776-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.42470.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641

Valores de la función distribución normal estándar

Φ ( ) ( )z e du P Z zu

z

= = = ≤−

−∞∫

12

2

2

π

Page 217: Libro estadistica coor1

Estadística

217

z 0 1 2 3 4 5 6 7 8 90.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.53590.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.57530.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.61410.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.65170.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.68790.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.72240.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.75490.7 0.7580 0.7611 0.7642 0.7673 0.7703 0.7734 0.7764 0.7794 0.7823 0.78520.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.81330.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.83891.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.86211.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.879 0.8810 0.88301.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.90151.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.91771.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9278 0.9292 0.9306 0.93191.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9430 0.94411.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.95451.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.96331.8 0.9641 0.9648 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9700 0.97061.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9762 0.97672.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.98172.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.98572.2 0.9861 0.9864 0.9868 0.9871 0.9874 0.9878 0.9881 0.9884 0.9887 0.98902.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.99162.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.99362.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99522.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.99642.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.99742.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.99812.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.99863.0 0.9987 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000

Valores de la función distribución normal estándar (Continuación)

Φ ( ) ( )z e du P Z zu

z

= = = ≤−

−∞∫

12

2

2

π

Page 218: Libro estadistica coor1

Estadística

218

Page 219: Libro estadistica coor1

Estadística

219

B I B L I O G R A F I A Acosta Flores J.J. (1975). Teoría de Decisiones en el Sector Público y en la Empresa Privada. Representaciones y Servicios de Ingeniería. México. Acosta Flores J.J. (1989). Como Mejorar su Habilidad para Tomar Decisiones.DEAC (Desarrollo Integral Empresarial y Consultoria S.A. de C.V.) México. Baker, R.J.Principios básicos de análisis estadístico. Novena Edición, Prentice Hall, México, 1998. Batanero, C., Godino, J. D. y Navarro-Pelayo, V. Razonamiento combinatorio. Síntesis, Madrid, 1994. Batanero, C., Godino, J. D., Vallecillos, A., Green, D. R. y Holmes, P. Errors and difficulties in understanding elementary statistical concepts. International Journal of Mathematics Education in Science and Technology, 25 (4), 527-547, Madrid, 1994. Bryc, W. y Pelikan, S. Basic Statistics. Ed. Paraninfo, España, 1997. Cabriá, S. Filosofía de la estadística. Servicio de Publicaciones de la Universidad de Valencia, España, 1994. De Leeuw Jan, Statistics: The study of stability in variation; Universidad de California, E.E.U.U., 1995. Emmett J. Vaughan(1997). Risk Management. John Wiley Sons Inc. Engel, A. Probabilidad y Estadística. Valencia: Mestral Universidad, España, 1988.

Page 220: Libro estadistica coor1

Estadística

220

Friendly, M. Métodos exploratorios y gráficos de análisis de datos.. York University, E. E. U.U.,1995. Godino, J. D., Batanero, C. Y Cañizares, M. J. Azar y Probabilidad. Madrid, España, 1987. H. Fernández-Abascal, Marta Guijarro, José Luis Rojo y José A. Sanz. Cálculo de Probabilidades y Estadística, Editorial Ariel. 1ª Edición, España, 1994. Hawkins, A., Jollife, F. y Glickman, L. Teaching statistical concepts. New York, E.E.U.U., 1992. Jaynes, E.T. Probability theory: the logic of science. Universidad de Princeton, Inglaterra, 1994. Kapadia, R. y Borovnick, M. Chance encounters: Probability in Education. A review of Research and Pedagogical perspectives. Dordrecht: Reidel, Alemania, 1992. Gil Aluja J. (1999).Elementos para una teoría de la decisión en la incertidumbre. Milladoiro. Spain. González Santoyo F., Flores J., Flores B. (2000). La Incertidumbre en la Evaluación Financiera de Empresas. FeGoSa Ingenería Administrativa y la FCA-Universidad Michoacana de San Nicolás de Hidalgo México. Grinstead, Charles. Introducción a la probabilidad. (Swarthmore College) y Snell, J.Laurie, Dartmouth College, Inglaterra, 1995. Kaufmann A., Gil Aluja J. (1990) Las Matemáticas del Azar y de la Incertidumbre (elementos básicos para su aplicación en economía). Centro de Estudios Ramón Arces. España. R. W. Walpole. Probabilidad y Estadística para Ingenieros. Representaciones y Servicios de Ingeniería. México, 1984.

Page 221: Libro estadistica coor1

Estadística

221

Ramírez S.D. (1998). Sistemas de decisión en condiciones de incertidumbre con evaluación ponderada aplicados al análisis financiero SIGEF. Reus Spain. Rios, Sixto. Estadística Matemática Aplicada. Ed. Paraninfo, Madrid, España, 1996. Rivadulla, A. Probabilidad e Inferencia científica. Ed. Anthropos, Barcelona, España, 1991. Rivas, Mateo. La estadística en la investigación social y los negocios. Ed. Paraninfo. Madrid, España, 1993. Sierra Bravo, Raúl. Análisis estadístico y modelos matemáticos para las ciencias sociales. Ed. Paraninfo, Madrid, España, 1997. Shaughnessy, J. M. Research in probability and statistics: reflections and directions. Ed. D. A. Grouws, Handbook of research on mathematics teaching and learning (pp. 465 - 494). Londres 1995. Snedecor, G. W. Statistical Methods. Ed. Ames, E:E.U.U., 1980. Spurr, William A., Charles P. Bonini (1995). Toma de decisiones en administración mediante métodos estadísticos. Editorial Limusa, México. Swinscow T D V. Statistics at Square One; Novena Edición. Universidad de Georgia, E.E.U.1997. Uspensky, J. V. Introduction to mathematical probability. Mc. Graw Hill, E.E.U.U., 1993. W. Stockburger David. Estadística introductoria, modelos y aplicaciones. Southwest Missouri State University, E.E.U.U., 1996. Wulder, M. A practical guide to the use of selected multivariate statistics. University of Waterloo, Canada, 1998.