estadistica descriptiva programa 2010 (libro)

167
Universidad Autónoma de Nayarit Área Económico Administrativa Índice Programa de Estudio por Competencias Profesionales Integradas 1. DATOS DE IDENTIFICACIÓN NOMBRE Y CLAVE DE LA UNIDAD DE APRENDIZAJE ESTADISTICA TBEA209 DOCENTE(S) RESPONSABLE(S) Hermilio Hernández Ayón, Guillermo Meseguer Valenzuela, Josué Salvador Sánchez Rodríguez, Alma Cecilia Quezada Sánchez, Saúl Eduardo Hernández Ayón, Ricardo Gómez Álvarez, Carlos Alberto Polanco Gómez, Diana Isabel Maldonado Parra, Alejandro Acebo Gutiérrez, Fco. Javier Hernández Ayón, Ernesto Navarrete Méndez y Genaro Flores Camarena TIPO DE UNIDAD DE APRENDIZAJE ACADEMIA Básica Estadística de Área ÀREA DE FORMACIÒN LÍNEA DE FORMACIÒN T.U.D.C. Básica de área Básica y transversal Curso, Taller Horas teoría Horas Practica Horas de estudio independiente Total de horas Valor en créditos 96 32 32 128 8 FECHA DE ELABORACIÒN FECHA DE ACTUALIZACIÒN 10 de junio del 2009 13 de agosto de 2010 Elaborado por: Actualizado por: Hermilio Hernández Ayón, Guillermo Hermilio Hernández Ayón, Guillermo Hernández Ayón, H y Casillas Barajas, A 1

Upload: bertin-gerardo-garcia-herrera

Post on 11-Dec-2014

249 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Estadistica Descriptiva Programa 2010 (Libro)

Universidad Autónoma de NayaritÁrea Económico Administrativa

ÍndicePrograma de Estudio por Competencias Profesionales

Integradas

1. DATOS DE IDENTIFICACIÓN

NOMBRE Y CLAVE DE LA UNIDAD DE APRENDIZAJEESTADISTICA TBEA209

DOCENTE(S) RESPONSABLE(S)Hermilio Hernández Ayón, Guillermo Meseguer Valenzuela, Josué Salvador Sánchez Rodríguez, Alma Cecilia

Quezada Sánchez, Saúl Eduardo Hernández Ayón, Ricardo Gómez Álvarez, Carlos Alberto Polanco Gómez, Diana Isabel Maldonado Parra, Alejandro Acebo Gutiérrez, Fco. Javier Hernández Ayón, Ernesto Navarrete Méndez y Genaro

Flores Camarena

TIPO DE UNIDAD DE APRENDIZAJE ACADEMIABásica Estadística de Área

ÀREA DE FORMACIÒN LÍNEA DE FORMACIÒN T.U.D.C.Básica de área Básica y transversal Curso, Taller

Horasteoría

HorasPractica

Horas de estudio independiente

Total de horas

Valor en créditos

96 32 32 128 8

FECHA DE ELABORACIÒN FECHA DE ACTUALIZACIÒN10 de junio del 2009 13 de agosto de 2010

Elaborado por: Actualizado por:Hermilio Hernández Ayón, Guillermo Meseguer Valenzuela, Josué Salvador Sánchez Rodríguez, Saúl Eduardo Hernández Ayón, Ricardo Gómez Álvarez, Carlos Alberto Polanco Gómez.

Hermilio Hernández Ayón, Guillermo Meseguer Valenzuela, Josué Salvador Sánchez Rodríguez, Alma

Cecilia Quezada Sánchez, Saúl Eduardo Hernández Ayón, Ricardo Gómez Álvarez, Carlos Alberto Polanco Gómez,

Diana Isabel Maldonado Parra, Alejandro Acebo Gutiérrez, Fco. Javier Hernández Ayón, Ernesto Navarrete Méndez y

Genaro Flores Camarena

Hernández Ayón, H y Casillas Barajas, A 1

Page 2: Estadistica Descriptiva Programa 2010 (Libro)

2. PRESENTACIÒN

Justificación: La estadística es hoy por hoy uno de los métodos más recomendados para realizar investigaciones en el área Económico – Administrativa, ya que ofrece grandes ventajas al permitir trabajar sobre muestras en lugar de poblaciones, lo que ahorra tiempo, dinero y esfuerzo. En este sentido, el conocimiento y manejo de la estadística permiten al profesional, formado en alguna de las carreras pertenecientes al área económico administrativa, resolver con metodología científica los problemas de las diversas organizaciones sociales.

Ubicación: El curso de Estadística, se ubica en el tercer ciclo del plan 2009 y pertenece a las unidades de aprendizaje de área.

Línea de formación que fortalece: Es una asignatura complementaria y transversal, es decir, sirve de apoyo y herramienta de análisis para el resto de unidades de aprendizaje.

Relación con el perfil de egreso: El curso de estadística junto con el de metodología de la investigación, forman parte del eje metodológico que permite al egresado analizar, interpretar y resolver la problemática de los diversos sectores de la población, así como adiestrarse en los procesos de la investigación.

Definición de la unidad de aprendizaje: La estadística es una rama de la matemática que se utiliza para acopiar, organizar, analizarla e interpretar información, para la toma de decisiones. Espacios curriculares con los que se vincula: La estadística se vincula horizontalmente con bases teóricas de la investigación científica y metodología de la investigación; verticalmente con lenguaje y pensamiento matemático, matemáticas básicas, matemáticas financieras, estadística aplicada e investigación de operaciones.

4. UNIDADES DE COMPETENCIA Al término del curso de estadística, el estudiante será lo suficientemente competente para reconocer las diversas fuentes que le proporcionan información en forma de datos; organizar, analizar e interpretar la información utilizando las herramientas de la estadística descriptiva, así como utilizar ciertos métodos probabilísticos que le permitan realizar inferencias y/o proyecciones para la toma de decisiones.

5. ATRIBUTOS O SABERES

Saberes Teóricos

Conoce los alcances y aplicaciones de la Estadística. Identifica fuentes generadoras de información Domina el concepto y la clasificación de variable. Clasifica, analiza e interpreta información estadística. Organiza y presenta datos a partir del análisis de frecuencias,

tabulación y graficación. Conoce y aplica las técnicas de tendencia central y dispersión para

el análisis estadístico de datos simples y datos agrupados. Domina el concepto de probabilidad, sus modelos y reglas de

probabilidad. Maneja el concepto de esperanza matemática y distribución de

Hernández Ayón, H y Casillas Barajas, A 2

Page 3: Estadistica Descriptiva Programa 2010 (Libro)

probabilidad continua y distribución de probabilidad discreta Resuelve casos prácticos utilizando las técnicas de la distribución

binomial, hipergeométrica, Poisson y normal. Entiende los alcances y limitaciones de las distribuciones de

probabilidad que utilice.

Saberes prácticos

Investiga la importancia y aplicación de la Estadística descriptiva e inferencial.

Maneja las variables y escalas de medición. Aplica los criterios de presentación de datos a partir de tablas y

gráficas. Analiza e interpreta los resultados estadísticos. Utiliza el concepto de probabilidad y de valor esperado para tomar

decisiones. Decide que distribución de probabilidad utilizar, y como encontrar

sus valores.

Saberes formativos

Fomenta el uso de las técnicas estadísticas para la toma de decisiones.

Fomenta la capacidad de observación, acopio y análisis de datos. Valora la ventaja de la interpretación y presentación de datos. Fomenta el uso de la inferencia estadística en procesos de

investigación. Fomenta el trabajo en equipo, la inter y multidisciplina Asume el compromiso discrecional y ético del uso de la

información estadística.

Hernández Ayón, H y Casillas Barajas, A 3

Page 4: Estadistica Descriptiva Programa 2010 (Libro)

6. DESGLOSE DE CONTENIDOS TEÓRICO PRÁCTICOS (temática)1. INTRODUCCIÓN Y CONCEPTOS BÁSICOS

1.1. Origen de la estadística y conceptos básicos.1.2. Surgimiento de la estadística.1.3. La estadística y su relación con otras disciplinas.1.4. Clasificación de la estadística.1.5. Tipos de estudios estadísticos.1.6. Aplicaciones de la estadística.1.7. Fuentes generadoras de información.1.8. La estadística en el proceso de investigación.1.9. Métodos para generar información estadística.1.10. Concepto de variable.1.11. Niveles y escalas de medición: nominal, ordinal, de intervalo y de razón o proporción.1.12. Escala de intervalo y escala de razón.1.13. Práctica.1.14. Ejercicios

2. ANÁLISIS DE DATOS Y DISTRIBUCIÓN DE FRECUENCIAS2.1. Distribución de frecuencias.2.2. Representación gráfica.

2.2.1. Gráfico poligonal y ojiva2.2.2. Gráfico de barras.2.2.3. Grafico circular o de pastel.2.2.4. Histograma.

2.3. Práctica.2.4. Ejercicios.

3. MEDIDAS DE TENDENCIA CENTRAL (datos simples)3.1. Media aritmética.3.2. Mediana.3.3. Moda.3.4. Rango medio.3.5. Media geométrica.3.6. Media armónica.3.7. Ejercicios.

4. MEDIDAS DE DISPERSIÓN (datos simples)4.1. Rango.4.2. Varianza.4.3. Desviación estándar.4.4. Regla empírica para la desviación estándar.4.5. Coeficiente de variación.4.6. La forma en un conjunto de datos.

4.6.1. Asimetría.4.6.2. Curtosis.

4.7. Ejercicios.5. ANALISIS ESTADÍSTICO PARA DATOS AGRUPADOS

5.1. Media aritmética.5.2. Moda.5.3. Mediana.5.4. Media geométrica.5.5. Media armónica.5.6. Medidas de dispersión para datos agrupados

5.6.1. Varianza5.6.2. Desviación estándar5.6.3. Coeficiente de variación.

5.7. Ejercicios.6. PROBABILIDAD

6.1. Fundamentos básicos de probabilidad.6.2. Modelo subjetivo, clásico y de frecuencias relativas.6.3. Teoría de conjuntos.6.4. Reglas de probabilidad6.5. Tablas de contingencias y de probabilidades6.6. Teorema de Bayes6.7. Técnicas de Conteo6.8. Ejercicios.

7. DISTRIBUCION DE PROBABILIDADES: VARIABLES ALEATORIAS DISCRETAS7.1. Concepto de esperanza matemática7.2. Distribución Binomial7.3. Distribución Hipergeométrica7.4. Distribución de Poisson7.5. Ejercicios.

8. DISTRIBUCION DE PROBABILIDADES: VARIABLES ALEATORIAS CONTINUAS8.1. Distribución Normal o curva de Gauss8.2. Cálculo de áreas bajo la curva normal8.3. Ejercicios

Hernández Ayón, H y Casillas Barajas, A 4

Page 5: Estadistica Descriptiva Programa 2010 (Libro)

7. ACCIONES

Cada unidad temática está diseñada con una parte teórica y una práctica. En la primer parte del curso, el alumno aplica tres técnicas de recopilación de información: censo, encuesta y experimentación. Las dos primeras prácticas se realizan en binas y la última es de manera individual. Los alumnos exponen los resultados encontrados en equipos ante el resto del grupo. Una segunda parte de trabajo práctico al momento de analizar una serie de datos de una variable cuantitativa, la cual someten al análisis descriptivo de datos agrupados. Dicho trabajo lo entregan individualmente. Una tercera parte práctica es la resolución de problemas con aplicación en la estadística inferencial, particularmente la distribución binomial, hipergeométrica, Poisson y normal estándar. La primera parte se pondera en el rubro de investigación y el resto forma parte del portafolio, esto para fines de la evaluación final del curso.

8. CAMPO DE APLICACIÓN

El curso se desarrolla en el aula. Para los trabajos de investigación deben acudir al INEGI. El trabajo independiente se pide que sea en la biblioteca, apoyándose en la bibliografía recomendada. El curso requiere de una calculadora científica, además se solicita un solo cuaderno para el curso de estadística, ya que se revisa al finalizar el curso. También se pide que adquieran el Texto de apoyo didáctico de “Estadística Básica”, elaborado por los integrantes de la Academia de Estadística y editado por la UAN.

9. EVALUACIÓN DEL DESEMPEÑO DEL ALUMNO

Evidencias de desempeño Criterios de desempeño Acudir y presentar estadísticas de una

población estatal, nacional o mundial, donde se señalen sus características demográficas más importantes.

Realizar una encuesta a sus propios compañeros respecto a determinada variable.

Realizar una investigación experimental que les genere información y presentar los resultados y el proceso.

Exponer los resultados de los diversos trabajos en binas y/o individual.

Presentar documento con el análisis estadístico de datos agrupados sobre cierta variable elegida previamente por el profesor.

Resolver y presentar los problemas elegidos al azar por el profesor.

Presentar libreta con apuntes del curso

Se toma en cuenta la observación y el análisis que se haga de las diferentes variables observadas en la población elegida.

Se toma en cuenta la variable, la

estructura de la encuesta, los resultados obtenidos y el trabajo en equipo.

Se toma en cuenta la creatividad, inventiva y genialidad para generar información cuando no existe.

Se toma en cuenta la forma de exponer los resultados encontrados

Se toma en cuenta la presentación y contenido de la descripción del caso analizado.

Se toma en cuenta el proceso y resultado que se utilizó para resolución de problemas.

Se checa desde el programa, apuntes completos, orden y notas sobre tareas e interpretaciones individuales.

Hernández Ayón, H y Casillas Barajas, A 5

Page 6: Estadistica Descriptiva Programa 2010 (Libro)

10. CALIFICACIÓNPortafolio 30%Participación 20%Examen de Conocimiento 40%Investigación temática 10%

11. ACREDITACIÓN

Cumplir como mínimo con el 80 % de asistencia

Obtener como mínimo 60 puntos de calificación en los exámenes aplicados.

Hernández Ayón, H y Casillas Barajas, A 6

Page 7: Estadistica Descriptiva Programa 2010 (Libro)

12. BIBLIOGRAFÍA BIBLIOGRAFÍA BÁSICA

1. ANDERSON, David R., Sweeney, Dennis J. y Williams, Thomas A. Estadística para Administración y Economía. CENGAGE Learning. México. 2008.

2. BERENSON, Mark L. y Levine, David M. Estadística Básica en administración. Prentice Hall, México.1992.

3. CHAO, Lincoln L., Estadística para las Ciencias Administrativas, Edit. McGraw-Hill

4. HERNANDEZ, Ayón H., Casillas Barajas, A. y cols. Estadística Básica. Texto de apoyo didáctico. UACyA. UAN. 2009.

5. KAZMIER, Leonard, Alfredo Díaz Mata, Estadística Aplicada a la Administración y a la Economía. Edit. McGraw-Hill

6. LEVIN, Richard, David S. Rubin, Estadística para Administradores. Edit. Prentice Hall.

BIBLIOGRAFÍA COMPLEMENTARIA

a. ALLISTER, Harry E. Elementos de Estadística en la Economía y los Negocios. ECASA

b. Centro de Investigación y de Estudios Avanzados, Curso de Estadística, I.P.N.

c. CHISTESEN, Howard B., Estadística Paso a Paso, Edit. Trillas.

d. DANIEL, Wayne W., Estadística Aplicada a las Ciencias Sociales y la Educación, Edit. McGraw-Hill

e. ELORZA, Haroldo, Estadística para las Ciencias Sociales y el Comportamiento. Edit. Oxford.

f. HANKE, John E. y Reitsch, Arthur, Estadística para Negocios, Edit. McGraw-Hill.

g. HINES, William, Douglas C. Montgomery. Probabilidad y Estadística para Ingeniería y Administración. Edit. CECSA.

h. INFANTE Gil, Said, Guillermo P. Zarate de Lara. Métodos Estadísticos, Edit. Trillas.

i. JOHNSON, Robert, Estadística Elemental, Edit. Trillas.

j. MANUAL de la Teoría de Probabilidades y Estadística Matemática. Edit. Mir-Moscú.

k. MASON/LIND/MARCHAL, Estadística para Administración y Economía. Edit. Alfaomega.

l. MAYES, Anne C., David G. Mayes, Fundamentos de Estadística para Economía. Edit. Limusa.

m. PORTILLA, Estadística. Edit. Interamericana.

n. ROJAS, Soriano Raúl, Guía para Elaborar Investigaciones en Ciencias Sociales. Edit. Plaza y Valdez.

o. SPIEGEL, Murray R., Estadística, Edit. McGraw-Hill.

p. TARO, Yamane, Estadística. Edit. Harla.

13.- PERFIL DE LOS DOCENTES PARTICIPANTES EN LA UNIDAD DE APRENDIZAJE:

Tres profesores responsables de este curso cuentan con perfil de ingeniería: química, sistemas e industrial, así como un contador público y un licenciado en administración. Todos con estudios de maestría.

Hernández Ayón, H y Casillas Barajas, A 7

Page 8: Estadistica Descriptiva Programa 2010 (Libro)

HORARIO DE CLASES PERIODO AGOSTO-DICIEMBRE 2010Hora/día Lunes Martes Miércoles Jueves

8:00 - 9:00 C3-2(B3)9:00 -10:00

M3-1(B1)M3-1(B1) M3-1(B1)

10:00 -11:00C3-2(B3)

11:00 -12:00 C3-2(B3)

Exámenes parcialesGrupo/exam. 1ER 2DO Portafolio

M3-1 Lunes 27 sept 6 diciembre 9 de diciembreC3-2 Martes 5 oct 7 diciembre 8 de diciembre

Pag. 62 eje. 1,2,3,6 pag 71 eje. 7,8,9 pag 93 5,7

CONSIDERACIONES DEL DOCENTE:

1.- EvaluaciónPortafolio 0-30%Participación 0-15%Exámenes de conocimientos 0-40%Asistencia y puntualidad 0-15%

El mayor puntaje de asistencia la obtendrá quien tenga mayor número en ellas, en cadena se señalarán los demás puntajes.

A quien se le sorprenda con un acordeón en algún examen tendrá que repetir el curso, no se permiten consultar apuntes en los exámenes.

El uso de celulares queda restringido dentro del salón de clases, quien desee hacer o recibir llamadas de celular tendrá que hacerlo fuera del salón de clases.

ASISTENCIA Y PUNTUALIDAD:Símbolo Concepto Puntos

A Asistencia 2R Retardo 1F Falta 0

PARTICIPACIÓN:Símbolo Concepto Puntos

A Participación relevante 2B Participación poco relevante 1C Sin participación 0

El día del examen será único, siendo válido para presentarlo fuera de la fecha, un problema de salud debidamente justificado (hospitalización).

PORTAFOLIO O TRABAJOS

Hernández Ayón, H y Casillas Barajas, A 8

Page 9: Estadistica Descriptiva Programa 2010 (Libro)

El portafolio será escrito a mano debidamente engargolado y con buena presentación, quien entregue un fólder sencillo o en un sobre Manila con unas hojas agrupadas con un clip no tendrá calificación en el portafolio, lo anterior se aplicará también en caso de existir un trabajo final, el trabajo final (en caso de que haya y el portafolio se entregará por separado).La carátula del trabajo y/o portafolio deberá contener cuando menos:

Nombre de la UniversidadNombre de la Unidad Académica.Nombre de la unidad de aprendizajeLogo de la UniversidadLogo de la Unidad académicaNombre del trabajoTratamiento y nombre completo del maestroTratamiento y nombre completo del alumnoSemestre que cursa el alumnoGrupo y licenciatura del alumnoFecha expresada en mes y año.

SEGUNDA PAGINA SERA UN ÍNDICE CON PAGINACIÓN

Los días en que se ausenten los alumnos los temas serán para investigación de los mismos.

EXÁMENESSerán 3 dentro del periodo escolar impostergables.

TAREASSerán para poder participar en el salón de clases no para entregar al maestro.

MATERIALESLibro de estadística básica, lápiz, pluma, borrador, hojas de papel cuadriculado, calculadora científica.

Hernández Ayón, H y Casillas Barajas, A 9

Page 10: Estadistica Descriptiva Programa 2010 (Libro)

Í N D I C E

1.- INTRODUCCIÓN................................................................................................11.1 Origen de la Estadística y conceptos básicos....................................................21.1.1 Surgimiento de la Estadística..........................................................................21.1.2 La Estadística y su relación con otras disciplinas...........................................21.2 Clasificación de la Estadística............................................................................31.2.1 Tipos de estudios Estadísticos........................................................................41.3.1 Fuentes generadoras de información..............................................................51.4 La Estadística en el proceso de investigación...................................................61.4.1 Métodos para generar información estadística ...............................................61.5 Concepto de variable..........................................................................................71.5.1 Niveles y Escalas de medición: nominal, ordinal, de intervalo y de razón o proporción...............81.5.2 Escala nominal y escala de ordinal.................................................................91.5.3 Escala de intervalo y escala de razón.............................................................9Práctica1...................................................................................................................9

2.- ANÁLISIS Y DISTRIBUCIÓN DE FRECUENCIAS.............................................102.1 Distribución de frecuencias................................................................................102.2 Representación gráfica.......................................................................................112.2.1 Gráfico poligonal..............................................................................................122.2.2 Gráfico de barras.............................................................................................122.2.3 Gráfico circular o de pastel..............................................................................132.2.4 Histograma......................................................................................................14Práctica2...................................................................................................................15Ejercicios..................................................................................................................15

3.- MEDIDAS DE TENDENCIA CENTRAL (datos no agrupados o simples).........193.1 Media aritmética.................................................................................................193.2 Mediana..............................................................................................................203.3 Moda...................................................................................................................223.4 Rango medio......................................................................................................233.5 Media geométrica...............................................................................................243.6 Media armónica..................................................................................................26Ejercicios..................................................................................................................28

4.- MEDIDAS DE DISPERSIÓN (datos no agrupados ) ......................................324.1 Rango.................................................................................................................324.2 Varianza.............................................................................................................334.3 Desviación estándar...........................................................................................344.3.1 Regla empírica para la desviación estándar...................................................364.4 Coeficiente de variación.....................................................................................374.5 La forma en un conjunto de datos......................................................................384.5.1 Asimetría.........................................................................................................384.5.2 Curtosis...........................................................................................................40Ejercicios..................................................................................................................42

5.- ANÁLISIS ESTADÍSTICO PARA DATOS AGRUPADOS...................................455.1 Media aritmética.................................................................................................495.2 Moda para datos agrupados...............................................................................505.3 Mediana para datos agrupados..........................................................................505.4 Media geométrica para datos agrupados...........................................................51

Hernández Ayón, H y Casillas Barajas, A 10

Page 11: Estadistica Descriptiva Programa 2010 (Libro)

5.5 Media armónica para datos agrupados..............................................................515.6 Medidas de dispersión para datos agrupados: Varianza, Desviación estándar y Coeficiente de variación...........................................................................................52Ejercicios..................................................................................................................54

6.- PROBABILIDAD..............................................................................566.1 Fundamentos básicos........................................................................................566.2 Modelo subjetivo.................................................................................................586.3 Modelo clásico....................................................................................................586.4 Modelo de frecuencia relativa.............................................................................59Ejercicios..................................................................................................................626.5 Teoría de conjuntos............................................................................................636.5.1 Eventos colectivamente exhaustivos..............................................................646.5.2 Eventos mutuamente excluyentes..................................................................656.5.3 Eventos complementarios...............................................................................656.5.4 Eventos independientes..................................................................................656.5.5 Eventos dependientes.....................................................................................666.6 Reglas de probabilidad.......................................................................................666.7 Tablas de contingencia y de probabilidades......................................................68Ejercicios..................................................................................................................716.8 Teorema de BAYES...........................................................................................75Ejercicios..................................................................................................................786.9 Técnicas de conteo............................................................................................79Ejercicios..................................................................................................................81

7.- DISTRIBUCIONES DE PROBABILIDAD................................................847.1 Distribución de probabilidad...............................................................................857.1.1 Media y Varianza de las distribuciones discretas............................................86Ejercicios..................................................................................................................897.2 Distribución Binomial..........................................................................................907.2.1 Distribución Binomial acumulada...................................................................92Ejercicios..................................................................................................................937.3 Distribución Hipergeométrica.............................................................................947.4 Distribución de Poisson......................................................................................96Ejercicios..................................................................................................................997.5 Distribución Exponencial....................................................................................100Ejercicios..................................................................................................................102

8.- DISTRIBUCIÓN NORMAL..................................................................1038.1 Distribución normal estándar..............................................................................1048.1.2 Aproximación de la distribución normal a la distribución Binomial..................110Ejercicios..................................................................................................................115

REFERENCIAS...................................................................................120APENDICE A. Tabla de la distribución normal estándar.................................121APENDICE B. Tabla de la distribución Binomial......................................................122APENDICE C. Tabla de la distribución de probabilidad de Poisson ......................123

Hernández Ayón, H y Casillas Barajas, A 11

Page 12: Estadistica Descriptiva Programa 2010 (Libro)

INTRODUCCIÓN

La estadística es una de las disciplinas que más avance han tenido en los últimos tiempos. Como metodología de apoyo es la que mejor se ha adaptado al desarrollo de las ciencias. Nadie podría imaginar que lo que inició como una actividad censal se convertiría en una práctica cotidiana de acopio y análisis de información para la toma de decisiones de tipo político, económico, social y hasta bélico.

Analizar información convertida en datos, diseñar modelos de muestreo o estudiarlos, son solo algunas de las aplicaciones de la estadística. Como herramienta de análisis, ofrece una considerable serie de ventajas que permiten, mediante muestreos y modelos estadísticos adecuados, obtener información de poblaciones completas que no se obtendrían por otros métodos o experimentos, mucho menos al costo tan reducido que representa la modelación estadística. La estadística les proporciona el argumento necesario cuando se requiere demostrar algo, ya que se apega a los pasos del método científico. El área económica y administrativa es muy dinámica y versátil, por lo que la estadística esta llamada a ser el método por excelencia para realizar indagaciones en todos los campos.

En la primera parte de este texto se analiza lo que se considera como estadística descriptiva, es decir, el análisis plano de las características de un fenómeno o evento, mientras que en la segunda parte, se analiza la denominada estadística inferencial, donde la probabilidad es el principal argumento de los modelos matemáticos.

Esta obra se generó a partir de la aportación de los docentes que integran actualmente la Academia de Estadística de la Unidad Académica de Contaduría y Administración, la cual forma parte del área (DES) Económica Administrativa de la Universidad Autónoma de Nayarit, y se tomó a partir de varias referencias bibliográficas conocidas en ámbito de la divulgación científica, así como de la experiencia en la cátedra cotidiana, a los que hacemos un reconocimiento especial por sus aportes.

Ninguna obra puede concebirse como definitiva, por lo que este Texto de Apoyo Didáctico queda a merced de los propios docentes titulares de la materia de Estadística para realizar las modificaciones pertinentes en próximas ediciones.

Finalmente señalar que este texto cubre los contenidos del programa del primer curso de Estadística de las carreras de Contaduría, Administración y Mercadotecnia e intenta ser una propuesta para toda el área.

Hernández Ayón, H y Casillas Barajas, A 1

Page 13: Estadistica Descriptiva Programa 2010 (Libro)

1. FUNDAMENTOS Y CONCEPTOS BÁSICOS

1.1. Origen de la Estadística y conceptos básicos

La Estadística es una ciencia matemática que se ocupa de reunir, organizar y analizar datos, que permiten hacer interpretaciones, resolver problemas como el diseño de experimentos y tomar de decisiones. Ante todo es una herramienta de apoyo para todas las disciplinas, ya que nos permite obtener información referida a grandes grupos de individuos conociendo datos de algunos de ellos.

1.1.1. Surgimiento de la Estadística

El desarrollo científico de la Estadística se fundamenta a partir de los años 30 a raíz de los problemas planteados en la sociedad industrial, por el desarrollo de otras ramas de las Matemáticas y de otros campos como la Biología, la Medicina, la Economía, la Informática, la Política y las áreas Administrativas y Contables, entre otras.

A lo largo de la historia, el hombre ha recopilado información en forma de datos y símbolos que han servido para mostrar eventos, sucesos y hechos de la realidad de ese momento. Las primeras civilizaciones Egipcias, Griegas y Romanas contaban ya con sus sistemas de recopilación de datos para cobrar impuestos y reclutar soldados. En la edad media, era frecuente que las instituciones eclesiásticas llevaran registros acerca de nacimientos, muertes y matrimonios; pero no fue sino hasta 1790 en que Estados Unidos encabezó la realización de censos cada 10 años, actividad que continúa realizándose en casi todos los países y cuyo propósito es analizar las características de su población con fines particularmente políticos y económicos.

1.1.2. La Estadística y su relación con otras disciplinas

Con la aparición de la informática como elemento complementario en todas las ramas del saber, se inicia un proceso de generación de información sin precedentes en la historia de la humanidad. Como resultado se tiene que, en las últimas dos décadas, se ha generado más información que en todos los años de nuestra historia.

Hernández Ayón, H y Casillas Barajas, A 2

Page 14: Estadistica Descriptiva Programa 2010 (Libro)

Actualmente, la estadística se ha convertido en un método efectivo para describir con aceptable exactitud los valores de datos socioeconómicos, políticos y culturales, entre muchos otros de carácter disciplinar, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico consiste no sólo en reunir, organizar y/o analizar datos sino, sobre todo, en la habilidad para realizar interpretaciones a partir de un determinado estudio.

Por otra parte, el desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas. La probabilidad es útil para comprobar la confiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios.

1.2. Clasificación de la Estadística

La estadística de divide en dos ramas: estadística descriptiva y estadística inferencial. La primera referida a los métodos que implican recopilar, organizar, interpretar y representar datos, con el objeto de obtener una descripción o caracterización lo más completa y fiel posible de un fenómeno estudiado. Dicho proceso implica observar, medir y registrar características o variables, para luego realizar la interpretación numérica o gráfica correspondiente.

La segunda comprende aquellos métodos que hacen posible estimar las características de una población a partir del análisis de una muestra. En la inferencia estadística se incluye la toma de decisiones, en forma de proyección o pronóstico, lo cual se obtiene a partir de la aplicación de modelos probabilísticos, es decir, la base de la inferencia estadística se obtiene a partir de la probabilidad matemática.

En estadística es necesario tener un claros algunos conceptos, sobre todo los de población y muestra, ya que los análisis que se obtienen son diferentes en cada uno de ellos.

Población es la totalidad de elementos (universo de estudio) o cosas que se consideran en el estudio, y pueden ser personas, plantas, animales, viviendas, objetos, microorganismos o cualquier otra entidad de elementos.

Muestra: porción o parte de la población que se toma para un determinado estudio o análisis y que además tiene las mismas características de la población

Hernández Ayón, H y Casillas Barajas, A 3

Page 15: Estadistica Descriptiva Programa 2010 (Libro)

Parámetro es una medida o cantidad que se establece y se utiliza para describir una característica de una población.

Estimador o estadístico de prueba es un cálculo o medida que se utiliza para estimar el valor de un parámetro a partir del estudio de una muestra, el cual sirve para obtener conclusiones sobre los verdaderos parámetros de una población.

Generalmente una población resulta demasiado grande como para obtener información de toda la población completa, debido a lo tardado, complicado y costoso del proceso, por ello se utilizan métodos de muestreo, los cuales permiten hacer inferencias científicamente válidas sobre la totalidad de la población.

En los procesos políticos, por ejemplo, es muy común el uso de la encuesta de opinión, la cual sería imposible aplicarla a la totalidad de votantes1, por lo que se escoge una muestra representativa de esa población para obtener los datos de interés. A las conclusiones que se llegue se les asocia una probabilidad sobre la esperanza o confianza que se tiene de que los resultados de la muestra reflejen la verdadera conducta de los votantes de toda la población.

1.2.1. Tipos de estudios Estadísticos

Algunos autores distinguen dos tipos de estudios estadísticos: enumerativos para referirse a la toma de decisiones sobre una población y/o sus características a partir del análisis de una muestra, por lo que interesa saber que hay en la población. Mientras tanto, los estudios analíticos se refieren a la toma de decisiones sobre un proceso para mejorar el desempeño futuro, es decir aquí la forma en que se recopilan datos es la variable de interés.1 En este caso, al total de votantes registrados se le denomina Marco de MuestreoHernández Ayón, H y Casillas Barajas, A

Población(Parámetros)

MMuestraEstadístico

s de Prueba

Inferencia Estadística

4

Page 16: Estadistica Descriptiva Programa 2010 (Libro)

1.3 Aplicaciones de la Estadística

¿Para qué sirve la Estadística?

El mundo en que vivimos es el mundo de la información y de la comunicación. Miles de cifras se analizan y evalúan diariamente para saber hacia dónde orientar las políticas de desarrollo y las decisiones a tomar, oportunidad que solo ofrece la estadística.

Pero la estadística no es del todo conocida. Sólo se sabe de ella por los resultados de las encuestas que diariamente se escuchan o se leen en los medios de comunicación. Sin embargo la estadística, como rama de la ciencia matemática, es una ciencia amplísima que permite obtener desde resúmenes generales de las actividades de la empresa hasta estimar el comportamiento de las ventas que se conseguirán en el futuro, o averiguar la relación que existe entre la inversión destinada a la promoción empresarial y las ventas obtenidas, e incluso, mantener una clasificación de clientes respecto de sus características.

Frente a los modelos de desarrollo actuales, se conocen cuatro tipos de empresas: “aquellas que hacen que las cosas sucedan, aquellas que creen que pueden hacer que las cosas sucedan, aquellas que desean que sucedan y aquellas que no saben que algo ha sucedido". Estos escenarios, entre algunos otros, son los que se pueden realizar teniendo como recurso metodológico a la estadística.

1.3.1 Fuentes generadoras de información

Si no existe información o datos que analizar, no hay lugar para la aplicación de la estadística. No obstante, en el mundo actual lo que más abunda es la información, insumo principal para el análisis estadístico que permite prever acciones ante fenómenos que pueden afectar determinada organización social.

Las fuentes generadoras de información son todas aquellas instancias que llevan registros con datos de la actividad humana. Una organización social, sea una empresa, dependencia, cooperativa, familia, escuela, etcétera, genera información financiera, contable, de inventarios, de personal, producción, ventas, informes, entre otros, de tal suerte que con la información generada se pueden hacer análisis e interpretaciones en beneficio de ellos mismos. Toda la actividad humana genera información diaria que en su mayoría se registra por instancias oficiales como el Instituto Nacional de Estadística Geografía e Informática, el Sistema de Administración Tributaria, el Registro Civil, las Bolsas de Valores, las Escuelas, Universidades e Institutos y

Hernández Ayón, H y Casillas Barajas, A 5

Valued Acer Customer, 14/08/11,
SERVICIO
Page 17: Estadistica Descriptiva Programa 2010 (Libro)

otras muchas dependencias tanto públicas como privadas. Los Centros de Investigación por su parte mantienen registros de las investigaciones y avances que se realizan en las diversas áreas del saber, las que se convierten en insumos de nuevos proyectos.

Toda esta información generada es materia prima para el análisis estadístico, pero si no fuera esto suficiente y quisiéramos generar nuestra propia información, podemos diseñar entonces instrumentos de acopio informativo como guías de entrevista y cuestionarios que permitirán captar la información deseada para realizar análisis estadísticos sobre opiniones, preferencias, oferta y demanda, entre otros.

1.4 La Estadística en el proceso de investigación

El uso de métodos estadísticos como auxiliares en el análisis de datos ha crecido enormemente en los últimos tiempos en todo el mundo, debido a la aceptación y éxito demostrado en la toma de decisiones, común denominador de todos los campos de la actividad humana. La dinámica del desarrollo tecnológico le otorgó a la estadística un lugar de privilegio como método de investigación de bajo costo, y propició el diseño de toda una serie de paquetes software estadísticos para computadora entre ellos el SAS, STATS y SPSS, entre otros.

Un tomador de decisiones sensato busca evaluar su información con el objeto de elegir el curso de una acción que rinda el máximo de beneficio al mínimo costo. Para el especialista o el investigador la parte medular de la información son los datos; sin datos no hay información. Si los datos están sesgados, son ambiguos o tienen algún error, es muy probable que las mejores pruebas diseñadas no compensen tales deficiencias.

1.4.1 Métodos para generar información estadística

El método más usual para recopilar información es el censo, siendo Estados Unidos el país que más destaca por la precisión, cobertura y técnicas que utiliza en sus procesos. En México, el Instituto Nacional de Estadística Geografía e Informática (INEGI) es el encargado de llevar a cabo los censos, los cuales son necesarios para la planeación de acciones sobre vivienda, alimentación, seguridad, salud e inversión, entre otras. Se distingue por que la información se obtiene del cien por ciento de la población.

Hernández Ayón, H y Casillas Barajas, A 6

Page 18: Estadistica Descriptiva Programa 2010 (Libro)

Un segundo método para la obtención de datos es a través de la experimentación, lo cual incluye pruebas más avanzadas de análisis y tratamiento estadístico. Normalmente se requieren pruebas de laboratorio o piloteo sobre grupos testigo o muestras a escala que luego son aplicables a una población. El tratamiento de variables bajo condiciones controladas es una característica de este método.

El tercer método consiste en obtener datos a partir de la aplicación de encuestas. Aquí no se ejerce control sobre el comportamiento de variables que se investigan, sino más bien se hacen preguntas a grupos muestra acerca de sus creencias, opiniones, actitudes y conductas, entre otras categorías de análisis. El tipo de encuesta (cuestionario o entrevista) depende de la naturaleza de la población y de la muestra bajo estudio.

Para que un estudio sea útil, los datos recolectados deben ser válidos, es decir, debe favorecerse el concepto necesario sobre lo que pudiera considerarse conveniente.

1.5 Concepto de variable

Dentro de los procesos de investigación, es común la denominación de variables en referencia a las diversas características que identifican a cierto suceso o fenómeno (por ejemplo; una pregunta puede dar como resultado diferentes respuestas). El concepto de variable se define como una característica que cambia respecto del tiempo, del lugar, de una persona otra, etcétera, es decir, se trata de una característica no constante y cuya variación es posible medir.

Si una variable es susceptible de ser cuantificada, entonces se convierte en un indicador dentro de una determinada investigación, ya que dicha variabilidad y su verificación, permitirán comprobar hipótesis de trabajo.

Existen dos tipos de variables: cualitativas y cuantitativas. Las primeras generan respuestas categóricas (si, no, regular, bueno, etc.), mientras que las segundas arrojan respuestas numéricas. Dentro de las variables cuantitativas numéricas, existen las continuas (dato normalmente dimensional que proviene de un proceso de medición instrumental) y las discretas (número finito frecuentemente adimensional).

Hernández Ayón, H y Casillas Barajas, AORDINALES

CUALITATIVA o CATEGORICA

NOMINALES

7

Page 19: Estadistica Descriptiva Programa 2010 (Libro)

1.5.1 Niveles y Escalas de medición: nominal, ordinal, de intervalo y de razón o proporción.

Los datos recolectados se miden de manera indistinta. Hasta los datos cuantitativos discretos pueden considerarse como producto de un proceso de medición por conteo. Existen cuatro niveles de medición más usados: Escala nominal, Escala ordinal, Escala de intervalos y Escala de razón.

1.5.2 Escala nominal y escala ordinal

Cuando en la clasificación de datos observados no es importante el orden se tiene un nivel de medición nominal. Si por el contrario, el orden es necesario durante el conteo de datos observados se tiene un nivel de medición ordinal.

Escala nominal (no importa el orden)

Tipo de sangre A, B, O+, O-

Filiación política PAN, PRI, PRD, PT, PVEM

Escala Ordinal (sí importa el orden)

Comportamiento: Bueno, Regular, Malo.Satisfacción al cliente: Muy satisfecho, satisfecho, insatisfecho.

Ambas escalas son consideradas débiles, sobre todo la nominal, dado que, a pesar de que se asegura que algo es mejor, mayor o preferido, no se puede saber cuanto es mayor, mejor o preferido.

Hernández Ayón, H y Casillas Barajas, A

Ejemplo Respuesta Tipo de variable

¿Ahorra usted? Sí, No Cualitativa nominal

¿Cómo le pareció el servicio?

Bueno, Malo, Regular Cualitativa ordinal

¿Cuantos hijos tiene? Número Cuantitativa discreta

¿Cual es su edad? Años Cuantitativa continua

VARIABLES

CUANTITATIVA o NUMERICA CONTINUAS

DISCRETAS

8

Page 20: Estadistica Descriptiva Programa 2010 (Libro)

1.5.3 Escala de intervalo y escala de razón

Estas escalas se consideran más potentes que las anteriores, ya que permiten discernir no sólo cuál de los valores es el mayor, sino qué tanto. Una escala por intervalos es una escala ordenada. En el caso de la estatura de una persona es importante la diferencia entre una y otra (1.60 vs. 1.65 o 170 vs. 1.75), es decir la diferencia de 5 centímetros, tiene el mismo significado, tanto para el primer intervalo como para el segundo.

Si en la escala es importante, además de las diferencias, un cero real que permita realizar cocientes de mediciones, la escala se convierte en una de razón. El caso de las temperaturas es un caso especial, ya que en la escala Celsius o Fahrenheit existe un cero arbitrario, por lo que no pueden considerarse como escalas de razón. Esto no sucede con la escala absoluta Kelvin, en la que sí puede entenderse el cero absoluto como real.

Temperatura (°C o °F) Escala de intervaloTiempo calendario Escala de intervaloEstatura Escala de razónPeso Escala de razónEdad Escala de razónSueldo Escala de razón

2. ANÁLISIS DE DATOS Y DISTRIBUCIÓN DE FRECUENCIAS

Para iniciar un proceso de recopilación de información se requiere de un conocimiento previo del objeto de estudio y de una planeación de actividades a desarrollar. Reconocer el tipo de variables a cuantificar o medir requiere de la habilidad de observar, para luego identificar la fuente generadora de información, sea a través de censos (INEGI), generada a partir de experimentación (pruebas de laboratorio) o recopilada a partir de instrumentos como la encuesta.

2.1 Distribución de frecuencias

La parte central en un análisis estadístico lo conforman los datos o valores que se obtienen de una variable determinada. Sin datos no

Hernández Ayón, H y Casillas Barajas, A

PRACTICA 1

A) Identificar tres fuentes de información censal por cada Sector Económico (Primario, Secundario y Terciario) y que tipo de información generan.

B) Identificar tres fuentes generadoras de información experimental.C) Identificar tres instancias que obtienen información mediante encuesta.

9

Page 21: Estadistica Descriptiva Programa 2010 (Libro)

existe posibilidad de obtener información sobre el fenómeno que se está investigando. Por ello es preciso en primer término hacer una revisión de datos y tratar de organizarlos de la mejor manera posible. Al arreglo ordenado de los datos, teniendo como base una escala de valor se le denomina frecuencia. Así por ejemplo, si tenemos al fin de cursos las calificaciones de español de 15 niños y queremos saber su frecuencia, ordenaríamos los datos de la siguiente forma.

Ejemplo 2.1: Calificaciones de español: 7, 10, 8, 8, 10, 9, 7, 8, 9, 9, 9, 7, 10, 8 y 10.

Calificación Frecuencia678910

03444

Total 15

Ejemplo 2.2: Se está interesado en conocer la calidad de alimentación de 50 niños en una comunidad rural, donde los valores de la variable cualitativa son:

Muy deficienteDeficienteRegularBuenaMuy buena

MDDRB

MB

Los datos recogidos por la encuesta2 fueron los siguientes:

BRRD

MDRDB

MDR

RBDRRDMBDDB

RD

MDRDBDR

MDD

DBDRMDDRMBDR

MDBDRD

MDRD

MDB

2 El proceso de recopilación de información se realizó a partir de una encuesta con datos socioeconómicos.Hernández Ayón, H y Casillas Barajas, A 10

Page 22: Estadistica Descriptiva Programa 2010 (Libro)

Arreglo ordenado de datos

Categoría(calidad de la alimentación)

ConteoFrecuenci

a Absoluta

Frecuencia

RelativaMDDRB

MB

||||| |||||||| ||||| ||||| ||||||| ||||| |||||||||| |||||

8171582

(8/50)=0.16

0.340.300.160.04

Total 50 1.00

En la primera columna de la tabla aparecen los cinco valores posibles de la variable calidad de la alimentación, que dan lugar a cinco categorías. En la segunda columna se muestra el procedimiento que se utilizó para clasificar las respuestas, mientras que en la tercera columna aparecen los números absolutos por categoría y, en la cuarta, la fracción que le corresponde respecto a la unidad (8/50, 17/50, …).

2.2 Representación gráfica

Es muy usual en estadística el uso de gráficos para representar ilustrativamente los resultados obtenidos. La representación gráfica de un conjunto de datos, sean de una población o de una muestra, permite obtener información respecto a la forma de cómo se distribuyen los valores de una variable de interés.

Dentro de la representación gráfica se reconocen cuatro tipos de gráficos:

a) Gráfico poligonalb) Gráfico de barrasc) Gráfico circular o de pasteld) Histograma de frecuencias

2.2.1 Gráfico Poligonal

En el polígono de frecuencias, el arreglo se diseña tomando a las abscisas (eje de las X) como el valor de la categoría bajo estudio y el eje de las ordenadas (Y) como la frecuencia, es decir, el dato que se repite “n” cantidad de veces.

Hernández Ayón, H y Casillas Barajas, A 11

Page 23: Estadistica Descriptiva Programa 2010 (Libro)

De esta manera, en el eje X, la primera categoría representa a Muy Deficiente alimentación (MD), la segunda Deficiente (D), y así sucesivamente.

2.2.2 Gráfico de Barras

La representación gráfica en forma de barras utiliza el mismo diseño que en caso anterior respecto a los ejes X-Y. Su configuración queda al criterio del analista de datos, ya que lo ancho de cada barra para el caso de variables cualitativas, solo es referencial e ilustrativo, no obstante, la condición es que se mantenga una misma anchura.

Las variables numéricas o cuantitativas sí requieren de una magnitud o rango constante generalmente dimensional, ya que cada barra representará el número de datos que se encuentran dentro de dicho rango de valores. Las barras deben estar separadas y no juntas para diferenciarlo del histograma.

Hernández Ayón, H y Casillas Barajas, A 12

Page 24: Estadistica Descriptiva Programa 2010 (Libro)

2.2.3 Gráfico Circular o de Pastel

Este tipo de gráficos se utiliza con frecuencia para representar en forma de porcentaje la porción o parte de un todo, donde dicho total representa el 100%. Diseñarlo manualmente significaría considerar como 100% el círculo equivalente a 360°. De ahí que cada componente representa una cantidad determinada de grados dentro del círculo y, por tanto, su equivalencia o valor de la categoría considerada. Por ejemplo si dividimos entre 4 los 360° da como resultado un ángulo de 90°, equivalente al 25% del círculo. Trazar este tipo de proporciones no significa mayor problema, sin embargo, en cantidades fraccionadas la dificultad aumenta.

360° o 100% 180° o 50% 90° o 25% 45° o 12.5%

Paquetes estadísticos como Excel, entre otros, son herramientas que resuelven rápidamente el problema, dado que, conteniendo los valores de la variable estudiada, solo necesitamos identificar el ícono y el tipo de gráfico a diseñar.

Hernández Ayón, H y Casillas Barajas, A 13

Page 25: Estadistica Descriptiva Programa 2010 (Libro)

2.2.4 Histograma

En ocasiones, dada la cantidad y característica de los datos, no es posible representar cada variable por su valor puntual, por lo que es conveniente agrupar los datos en intervalos de clase.

El histograma de frecuencias es un gráfico donde se requiere conocer previamente los intervalos de clase. Tanto la cantidad de intervalos como su longitud se construyen a partir del criterio del investigador o analista experto. La altura de cada barra representa la cantidad de valores que se encuentran dentro de la amplitud elegida, mientras que la anchura representa un valor mínimo y otro máximo dentro de una escala de valores. Como condición se admite que el valor máximo de una determinada barra es, al mismo tiempo, el valor mínimo de la siguiente (de ahí que las barras no deben estar separadas). No obstante, se debe procurar que un dato pertenezca solo a una barra y no a dos o más al mismo tiempo.

Histograma de frecuencias3

EJERCICIOS 3 Los datos del histograma no corresponden fielmente al ejemplo “tipo de alimentación” señalado con anterioridad, dado el valor categórico de la variable.Hernández Ayón, H y Casillas Barajas, A

PRACTICA 2

A partir de la variable “estatura” de los alumnos del grupo construya:a) Una tabla de frecuenciasb) Un gráfico de barrasc) Un gráfico poligonald) Un gráfico circulare) Un histograma de frecuencias

Comente y explique sobre las dificultades encontradas en cada caso

14

Page 26: Estadistica Descriptiva Programa 2010 (Libro)

1. Las calificaciones finales de 80 estudiantes en la materia de Estadística figuran en la siguiente tabla:

68 50 89 57 90 95 79 5273 30 67 81 93 69 45 8561 78 73 68 62 60 76 9356 62 43 60 47 36 55 5596 80 82 74 95 62 76 7279 67 73 94 85 76 85 6065 75 55 27 78 88 63 7140 27 75 78 63 59 68 4535 75 61 48 62 58 83 7479 82 97 72 50 74 71 57

a) Identifique las calificaciones extremas.b) Construya una tabla con las siguientes categorías: frecuencia absoluta (fa),

frecuencia relativa (fr), frecuencia relativa acumulada (fra) y frecuencia porcentualizada (f%).

c) Que porcentaje de alumnos aprobaron (calificación mayor a 60).

2. En 1997 ocurrieron en el Estado de Nayarit una cantidad de 4,103 defunciones por diversas causas de enfermedad; como se muestra en la siguiente tabla.

a) Que porcentaje corresponde a cada una de las causas.b) Diseñe el gráfico que mejor se adapte a los datos.c) Identifique la causa más frecuente y la menos frecuente.d) Convierta los porcentajes tomando como base a 10, 1000 y 10000

habitantes.

CAUSA DEFUNCIONES

Enfermedades del corazón. 746Tumores malignos. 623Accidentes. 384Diabetes mellitus. 306Enfermedad cerebro vascular. 261Homicidio y lesiones inflingidas intencionalmente por otra persona.

161

Otras enfermedades pulmonares obstructivas crónicas

129

Neumonía e influenza 125Cirrosis y otras enfermedades crónicas del hígado. 123Ciertas afecciones originadas en el periodo perinatal. 95Deficiencias de la nutrición 85Bronquitis crónica, asma y enfisema 71Sida 52Otras causas. 942

Fuente: INEGI. Censo General de Población y Vivienda 2000.

Hernández Ayón, H y Casillas Barajas, A 15

Page 27: Estadistica Descriptiva Programa 2010 (Libro)

3. El tiempo en horas que tarda un taller de servicio automotriz en realizar la revisión rutinaria de garantía se registra en la tabla siguiente.

4.3 4.5 4.4 4.13.1 2.0 5.9 3.46.6 6.7 2.2 3.26.3 3.8 5.5 3.32.7 2.6 2.1 3.7

a) Construya una tabla de frecuencias con intervalos de media hora, una hora y 1.5 horas.

b) ¿A qué conclusiones se puede llegar acerca de la productividad de los mecánicos si se toma en cuenta la distribución de frecuencias?

c) Si la administración del taller considera que más de 6.0 horas equivale a un mal desempeño ¿De qué magnitud es el problema?

4. Una empresa registra en un mes del año los siguientes servicios ofrecidos al público en las 20 sucursales.

823 427 468 308669 360 349 752722 588 634 586217 321 904 641648 555 847 766

a) La compañía cree que una sucursal no puede mantenerse financieramente con menos de 475 servicios mensuales ¿qué porcentaje representan estas empresas?

b) Es también política de la compañía otorgar una bonificación económica al gerente de la sucursal que genere más de 725 servicios mensuales ¿qué porcentaje se beneficiará?

c) Ordene los datos de la tabla y represéntelos de manera gráfica

5. Represente, en gráfico circular, el siguiente ejemplo. En una Escuela Primaria de 2000 niños, 600 se encuentran en Primero, 490 en Segundo, 320 en Tercero, 250 en Cuarto y el resto en partes iguales en Quinto y Sexto años. Dos de cada 3 son niñas en primero, en segundo 1.9 niñas por cada 2 niños, en tercero es proporcional, en cuarto hay 2.5 hombres por cada 2 mujeres, en quinto hay un 10% mas de mujeres que de hombres y en sexto año tres quintas partes son hombres.

6. Según un estudio de campo, la proporción de vehículos que circulan diariamente por la Ciudad de Tepic es la siguiente: 23% son unidades Nissan, 20% Ford, 15% Chevrolet, 14% Dodge Chrisler, 10% Volkswagen y el 18% corresponde a Otras Marcas como Honda, Mitsubitshi, Mazda, Toyota, entre otras. Represente gráficamente la información anterior, utilizando gráficos alternativos de barra y polígono, en planos vertical y horizontal.

7. La siguiente tabla, muestra la población total de México y de cada uno de los Municipios del Estado de Nayarit.a) Obtenga los porcentajes de hombres y mujeres por municipiob) Qué porcentaje representa la población de Tepic respecto del total del Estado y

del Paísc) ¿Existe diferencia entre los porcentajes de hombres y mujeres del Estado

respecto del País? Comente.d) ¿Qué porcentaje de municipios rebasan los cincuenta mil habitantes?

Hernández Ayón, H y Casillas Barajas, A 16

Page 28: Estadistica Descriptiva Programa 2010 (Libro)

e) Represente el resultado del inciso a) tomando como base 1, 10, 100, 1000 y 10000

MÉXICO Población total Hombres Mujeres97 361,711 47 354, 486 50 007, 325

NAYARITPoblación total Hombres Mujeres

919, 739 454, 268 465, 471MunicipiosAcaponeta 36, 641 18, 156 18, 305Ahuacatlan 15, 319 7, 617 7, 702Amatlán de Cañas 12, 053 6, 093 5, 960Bahía de Banderas 59, 782 30, 371 29, 411Compostela 65, 804 32, 532 33, 272Del Nayar 26, 561 13, 127 13, 434Huajicori 10, 291 5, 201 5, 090Ixtlán del Río 25, 371 12, 153 13, 218Jala 16, 142 7, 870 8, 272Rosamorada 34, 653 17, 471 17, 182Ruiz 21, 675 10, 960 10, 715San Blas 42, 741 22, 155 20, 586San Pedro Lagunillas 7, 778 3, 898 3, 880Santa María del Oro 20, 823 10, 525 10, 298Santiago, Ixcuintla 95, 311 47, 652 47, 659Tecuala 42, 227 21, 210 21, 017Tepic 305, 025 147, 063 157, 962Tuxpan 31, 185 15, 421 15, 764Xalisco 37, 612 18, 342 19, 270Yesca, La 12, 925 6, 451 6, 474

Fuente: INEGI. Censo General de Población y Vivienda 2000.

8. Las estaturas del grupo matutino G-1 de la Facultad de Contaduría y Administración de la UAN, fueron las siguientes.

1.75 1.59 1.69 1.82 1.58 1.50 1.55 1.71 1.70 1.891.56 1.72 1.77 1.70 1.64 1.75 1.76 1.70 1.69 1.741.67 1.62 1.80 1.65 1.72 1.50 1.70 1.74 1.68 1.591.66 1.65 1.60 1.60 1.70 1.56 1.83 1.66 1.69 1.561.65 1.63 1.58 1.76 1.67 1.68 1.58 1.68 1.75 1.71

Si el propósito es representar gráficamente los datos ¿Qué dificultades se tienen?, ¿Cual gráfica convendría mejor?, ¿Que se propone para resolver tal problema?

9. Con la información del ejemplo anterior, agrupe:a) Los menores a 1.60 metrosb) Los menores a 1.70 pero a la vez mayores a 1.60 metrosc) Los menores a 1.80 pero a la vez mayores a 1.70 metrosd) Los mayores a 1.80 metros.

Cuantos alumnos hay en cada caso y que porcentaje le corresponde a cada inciso. Obtenga una tabla con los nuevos porcentajes por categoría (inciso) y acumulada. Represente los datos en gráfico circular.

Hernández Ayón, H y Casillas Barajas, A 17

Page 29: Estadistica Descriptiva Programa 2010 (Libro)

3. MEDIDAS DE TENDENCIA CENTRAL (datos no agrupados o simples)

Un conjunto de datos, por sí mismo, puede no darnos la suficiente información. Para ello, se utilizan ciertas herramientas estadísticas que nos permiten caracterizar o describir el verdadero valor que representa un conjunto de datos agrupados o no agrupados. Las medidas de tendencia central más usuales son la media, la mediana y la moda.

La medida de tendencia central es un valor que se calcula para un conjunto de datos que se utiliza para describirlos o caracterizarlos, lo cual permite tener un perfil cuantitativo aproximado de la realidad de ese momento. El cálculo más usualmente conocida es la media aritmética, promedio o simplemente media, ya que determina un valor promedio representativo de todo un conjunto de datos.

En general, las medidas de tendencia central son valores que representan a todo un conjunto de datos. El proceso desde el acopio de información hasta los cálculos que se realizan para conocer la media aritmética, la moda, la mediana y el rango medio, entre otros, permiten tener una descripción detallada del conjunto de datos. Las medidas de tendencia central pueden aplicarse sobre muestras (conocidos como estimadores o estadísticos de prueba) o sobre poblaciones completas, a los que se denominan parámetros.

3.1. Media Aritmética

Hernández Ayón, H y Casillas Barajas, A 18

Page 30: Estadistica Descriptiva Programa 2010 (Libro)

Se define como la suma de todos los valores de la variable entre el número de datos. Representa la suma de las magnitudes variables divididas entre el número de elementos.

La media aritmética tiene la ventaja extra de ser el único promedio apropiado para estimar un total y de estar sujeto a un tratamiento algebraico que permite promediar series de medida.

Fórmula de la media aritmética para una muestra

Observe que x (variable o característica) toma valores desde i hasta n, siendo n el tamaño de la muestra, mientras que la i representa los valores de la variable.

Fórmula de la media aritmética para una población

En este caso N es el total de valores de la población bajo estudio, representa el promedio de la población y x toma valores desde i hasta N.

Una interpretación más específica sería la siguiente: El promedio de la población representado por la letra , resulta ser un parámetro de la población bajo estudio. Por otra parte, si es el valor promedio de una muestra representativa de esa población, se dice que es un estimador de , porque nos da una idea del valor de . En general, mientras más grande sea el tamaño de la muestra, la media muestral ( ) diferirá menos de la media poblacional (), es decir, el resultado será mas certero.

Ejemplo 3.1: Se desea saber el promedio estatura (en metros) entre los alumnos de la carrera de Administración; para ello se elige al azar una muestra de 10 alumnos.

Alumno Estatura (m)

1234

1.701.681.761.81

Hernández Ayón, H y Casillas Barajas, A 19

Page 31: Estadistica Descriptiva Programa 2010 (Libro)

5678910

1.731.651.781.831.741.79

Aplicando la fórmula para la media, tenemos que:

Ejemplo 3.2: En determinado mes, 8 vendedores de artículos electrónicos vendieron las siguientes cantidades de aparatos electrónicos: 8, 11, 5, 14, 8, 11, 16, 11. Considerando a este mes como la población, el número promedio de unidades vendidas en ese mes son:

Observe que en ambos ejemplos se especifica claramente el tipo de valores, muestra y población, respectivamente. A pesar de que el procedimiento para el cálculo es el mismo, el resultado se interpreta distinto, ya que, en el primer caso, el promedio de la estatura en la muestra escogida es de 1.747 metros, es decir, es una estatura representativa del grupo de donde se extrajo la muestras; mientras que el promedio real de la población de aparatos electrónicos vendidos fue de 10.5.

3.2. Mediana

La mediana (Md), en una serie de datos, es el valor de la variable asociado o correspondiente al punto central de la serie de datos previamente ordenados en función de su magnitud.

El valor de la mediana divide una serie de datos de manera que, la mitad de los datos (50%) son mayores y/o menores del punto central. Es más apropiado utilizar la mediana en lugar que la media cuando se presentan valores extremos en un conjunto de datos. Se aplica a variables categóricas ordinales y variables numéricas, muy útil por ejemplo en caso de nóminas de sueldos, facturación, ventas, valoraciones, entre otros.

Hernández Ayón, H y Casillas Barajas, A 20

Page 32: Estadistica Descriptiva Programa 2010 (Libro)

Para calcular la mediana de un conjunto de datos, primero se deben ordenar en función del valor de la variable; de mayor a menor o de menor a mayor. A éste conjunto se le denomina arreglo ordenado; después se utiliza la siguiente fórmula para determinar el punto central (Pc)

En una serie de datos pueden presentarse dos casos: Si el número de datos es par o impar. En el primer caso, el Pc = (n + 1)/2 se localiza entre dos valores de la variable, para lo cual, la mediana será el promedio entre esos dos valores. En el segundo caso, el valor de la mediana será el que esté directamente asociado al Pc.

Ejemplo 3.3: Utilizando el ejemplo anterior de las estaturas de estudiantes, tenemos que el número de datos son diez, es decir, se trata de una serie par, por lo que en este caso, cálculo correspondiente para

la mediana será:

Es decir, el valor de la mediana estará ubicado entre la posición 5 y la posición 6 de los diez valores de la muestra.

1.65 1.68 1.70 1.73 1.74 1.76 1.78 1.79 1.81 1.83Ordenamiento y posición de datos

1 2 3 4 5 6 7 8 9 10

El valor de la mediana, de acuerdo a la posición 5.5, es un valor entre 1.74 y 1.76, por lo que (1.74 + 1.76) / 2 = 1.75 metros, que es un valor muy similar al de la media aritmética. Entiéndase entonces que el 50% de las estaturas son mayores a 1.75, mientras que el otro 50% son estaturas menores a ese mismo valor.

Obsérvese que si el valor menor fuera de 1.20 y/o el mayor de 2.10, esto no afecta a la mediana, ya que la posición sería la misma y, por tanto, el valor de la mediana sería el mismo. Esto comprueba que la mediana se aplica mejor a conjunto de datos con valores extremos.

Finalmente, en caso de que haya números empatados y el posicionamiento del punto sea uno de ellos, se toma sin dificultad aquel

Hernández Ayón, H y Casillas Barajas, A

Valor menor Pc = 5.5 Valor menor

21

Page 33: Estadistica Descriptiva Programa 2010 (Libro)

donde marque el Pc sin importar cuantos empates o repeticiones existan.

3.3. Moda (Mo)

Es el valor que se presenta con mayor frecuencia en una serie de datos. Se le obtiene fácilmente si el conjunto de datos está ordenado, y no se afecta si existen valores extremos. Al igual que la mediana, sólo se le utiliza para propósitos descriptivos, ya que el valor es relativo y variable.

Cabe aclarar que en algunos casos (cuando un número no se repite), la moda no existe, y así se especifica. Sin embargo, el hecho de decir que no existe, no significa que la moda sea igual a cero, ya que la moda puede tomar valores positivos, negativos o ser cero.

Por otra parte, si dos números se repiten igual número de veces, se dice que el resultado es bimodal, o simplemente se señalan los números con igual moda.

Ejemplo 3.4

Para los valores 2, 3, 4, 4, 4, 4, 4, 6 y 7 el valor modal es 4.

En el caso de valores de temperaturas: -4°, -2°, -1°, -1°, 0°, 0°, 0°, +3°, +5°, la moda es igual a 0°.

Ejemplo 3.5

De las siguientes cantidades, correspondientes al consumo de alimentos de l5 personas en un restaurante, obtenga la moda respectiva: $1000, 1000, 1000, 25000, 2500, 2500, 3500, 4000, 5300, 9000, 12500, 13500, 24500, 27500 y 30900.

La moda es el valor más frecuente, por lo que en este caso, es de 1000 y 2500 bimodal.

3.4. Rango Medio

El rango medio (Rm) es el promedio entre el extremo mayor y el extremo menor de una serie de datos, y puede ayudarnos para tener una muy ligera idea de cómo están los valores. Se debe tener cautela con el promedio obtenido, ya que con valores muy extremos el

Hernández Ayón, H y Casillas Barajas, A 22

Page 34: Estadistica Descriptiva Programa 2010 (Libro)

promedio puede no resultar representativo del conjunto de datos. Se utiliza para cálculos rápidos en análisis financieros o para pronósticos del clima.

Ejemplo 3.6: De acuerdo a un estudio exploratorio, un día caluroso registra las siguientes temperaturas en grados centígrados: 20, 32, 35, 27, 32, 30, 28, 36, 25 y 33. En este caso, el rango medio corresponde a:

Rango medio = (20 + 36) / 2 = 28 °C

3.5. Media Geométrica

Es otra medida de posición que suele utilizarse en la rama del comercio y la economía en series de datos como tasas de interés, inflación y de crecimiento, así como en la elaboración de números índices, entre otras, donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. Es un cálculo donde intervienen todos los valores, por lo que no se pierde información, no obstante, el resultado puede ser influido por valores muy extremos.

En general, la media geométrica depende del número y características de los datos, y para el cálculo se utilizan dos procedimientos:

Procedimiento 1. Cuando se trata de pocos valores y de baja magnitud, puede utilizarse la siguiente fórmula.

Es decir, la n-ésima raíz del producto de los valores de la variable. Es útil cuando los números son positivos, ya que si son negativos o existe un cero, el resultado puede ser negativo o inexistente. Con números positivos, la media geométrica es un valor ligeramente menor a la media aritmética.

Hernández Ayón, H y Casillas Barajas, A 23

Page 35: Estadistica Descriptiva Programa 2010 (Libro)

Ejemplo 3.7: Sean los números 2, 4 y 8. La media geométrica (Mg) se define mediante:

Procedimiento 2. Otra forma de realizar el cálculo es a través del logaritmo neperiano siguiente:

Utilizando el mismo ejemplo anterior tenemos:

Por lo tanto, Mg = Antilog 0.60206, y Mg = 4

Las aplicaciones más frecuentes de la media geométrica se realizan en instituciones bancarias para el cálculo de promedios de tasas de variación y de tasas de interés compuesto.

Ejemplo 3.8: Suponga que en tres bancos diferentes se presenta una diferencia en sus tasas de interés mensual (%), como sigue:

BANCO A BANCO B BANCO CMes 1Mes 2Mes 3Mes 4Mes 5Mes 6

1.72.32.21.92.22.3

1.93.12.82.52.52.7

2.51.61.82.93.53.0

¿Cuál de los Bancos ofrece en promedio una menor tasa de interés?

Banco A

Banco B

Hernández Ayón, H y Casillas Barajas, A 24

Page 36: Estadistica Descriptiva Programa 2010 (Libro)

Banco C

3.6. Media Armónica

Los promedios de velocidades dentro de una distancia constante representan un tema de interés para ciertas empresas, sobre todo tratándose de gastos generales de transporte y combustibles. Es importante controlar y vigilar los tiempos de reparto, los gastos de hidrocarburos y la duración de refacciones de vehículos, entre otras cosas. Este tipo de cálculos se obtienen mediante la aplicación de la Media Armónica (Mh), la cual se define mediante la siguiente fórmula.

Donde N representa el número de vehículos, Xi es la velocidad de cada vehículo y Mh es la media armónica (velocidad promedio: distancia por tiempo).

Ejemplo 3.9: Suponga que una empresa utiliza cuatro camiones de reparto de mercancía por semana, los cuales parten desde la empresa matriz hasta la ciudad destino situada a 100 millas. Los camiones mantuvieron una velocidad promedio los 40, 47, 48 y 50 millas por hora durante el trayecto. ¿Cuál resulta ser la velocidad promedio de los cuatro camiones?

Este procedimiento es el más adecuado al problema planteado, ya que si se aplica la media aritmética, el promedio que se obtiene (40+47+48+50)/4 = 46.25 millas por hora. Esta diferencia se debe a la media aritmética supone intervalos de tiempo constantes, lo cual no

Hernández Ayón, H y Casillas Barajas, A 25

Page 37: Estadistica Descriptiva Programa 2010 (Libro)

necesariamente es cierto. Lo correcto, mediante este procedimiento es considerar los tiempos de cada vehículo, es decir, 2.50, 2.13, 2.08 y 2.0 horas respectivamente. El tiempo total para cubrir las 400 millas es de 8.71 horas, entonces el verdadero valor se obtiene mediante (400/8.71) = 45.92 millas por hora. Si, por ejemplo, se hubieran mantenido las velocidades de 40, 47, 48 y 50 durante el mismo tiempo, el promedio correcto hubiera sido 46.25 millas por hora.

La media armónica se utiliza también para encontrar el precio promedio de artículos. Supóngase que un repartidor de periódicos de una editorial entrega un ejemplar matutino y uno vespertino. Paga 5 centavos por cada ejemplar del periódico matutino y 4 centavos por el vespertino. ¿Qué precio promedio diario paga? Este problema requiere de la media armónica. Esta medida mostraría que el repartidor paga 4.44 centavos por ejemplar, y no 4.50 centavos. De nueva cuenta, la media armónica es apropiada debido a que se especifican datos constantes como si fueran variables, en este caso el número de periódicos que se compran a cada precio.

EJERCICIOS

1. A partir de los siguientes datos, tomados de una muestra aleatoria de 20 estudiantes de la Unidad Académica de Contaduría y Administración, realice los cálculos que se piden.

Edad en años Peso en Kg. Estatura en m.Mujeres Hombres Mujeres Hombres Mujeres Hombres

Hernández Ayón, H y Casillas Barajas, A 26

Page 38: Estadistica Descriptiva Programa 2010 (Libro)

17 25 48 58 1.62 1.7022 21 55 70 1.69 1.6920 18 60 65 1.70 1.7119 17 63 63 1.68 1.6519 22 70 67 1.71 1.6718 26 52 69 1.69 1.7821 28 58 71 1.70 1.8322 35 67 75 1.72 1.8517 18 59 58 1.66 1.7619 17 60 63 1.68 1.6820 21 72 65 1.69 1.5923 23 66 72 1.76 1.8018 20 63 69 1.70 1.7029 27 58 78 1.72 1.8816 19 57 56 1.67 1.6824 19 69 76 1.58 1.8131 22 75 74 1.70 1.7926 18 72 76 1.69 1.8618 24 66 68 1.60 1.7520 26 62 69 1.63 1.82

a) Represente gráficamente los datos por género y por variable.b) Obtenga la media aritmética, moda, mediana y rango medio a partir de cada

variable (edad, peso y estatura) y por géneroc)Obtenga la media geométrica para la variable estatura por génerod)Que conclusiones se pueden hacer respecto de la edad entre hombres y mujeres.e) Que conclusiones se pueden hacer respecto del peso entre hombres y mujeres.f) Que conclusiones se pueden hacer respecto de la estatura entre hombres y

mujeres.

2. Dos granjas de camarones están siendo monitoreadas para conocer cual está operando mejor según la alimentación que se les da. Para observar la comparación entre ambos, se capturan diez camarones geográficamente al azar de cada Estanque y se mide talla y peso. El reporte respecto de la talla es el siguiente.

Estanque 1 2.51 2.95 2.13 3.22 3.54 2.93 3.08 4.75 2.83 4.51Estanque 2 3.64 2.57 3.89 3.30 3.76 4.12 2.96 3.88 4.29 3.62

Determine:a) Las medidas de Tendencia Centralb) En cual estanque se observa un mayor crecimiento en promediod) Si el requisito para venderle a EU es que sobrepasen de 3.0 cm en promedio, ¿podrá vender la empresa el producto? ¿Cuál o cuales estanques?

3. El departamento de producción de una empresa embotelladora está interesado en investigar cual de las dos líneas de producción opera mejor. Para ello se toman aleatoriamente 20 muestras de cada línea y se mide el volumen de llenado en mililitros, resultando lo siguiente.

MAQUINA 1 (línea 1)

MAQUINA 2 (línea 2)

340 313315 318312 315335 324

Hernández Ayón, H y Casillas Barajas, A 27

Page 39: Estadistica Descriptiva Programa 2010 (Libro)

318 318310 315319 312338 318330 326316 312314 319318 324315 322317 333325 336322 328318 325321 316314 319316 321

Calcule para cada línea de producción:a) Medidas de tendencia central (media aritmética, moda, mediana y rango medio)b) Cual línea de llenado opera con mayor volumen promedioc) En cual línea de llenado se observan más valores extremosd) Si el volumen límite mínimo permitido según la Norma Oficial Mexicana es de 340

mililitros, cual línea (s) operan fuera de norma.e) Que se puede comentar respecto del valor de la mediana

4. Las calificaciones de un examen final ordinario de Estadística en una muestra representativa de 20 alumnos de la carrera de Contaduría y de Administración arrojó los siguientes resultados.

9856456737

6055907085

8046406530

9060705670

a) Calcule las medidas de tendencia central (media, moda, rango medio y media aritmética)b) Que porcentajes de alumnos aprobaron y reprobaron el examen

5. El sueldo promedio que percibe un empleado en una empresa cigarrera de la ciudad de Tepic es de 4,500 pesos por mes. Un estudio revela que la mediana tiene valor de 3,800 pesos mensuales y la moda de 4,600. ¿Como se explica esta diferencia? Como dato adicional, la empresa cuenta con 1200 empleados en sus diferentes turnos.

6. Las tasas de interés bancario en los últimos seis meses en cuatro bancos principales de la ciudad de Tepic son como sigue:

BANCO A BANCO B BANCO C BANCO D1.231.521.342.051.841.96

2.101.651.731.961.771.85

1.351.431.491.981.921.19

2.121.781.091.151.182.11

Hernández Ayón, H y Casillas Barajas, A 28

Page 40: Estadistica Descriptiva Programa 2010 (Libro)

a)Cual banco ofrece la mayor tasa de interésb) Cual banco ofrece la menor tasa de interés

7. Un inversionista pretende abrir una cuenta con cien mil pesos en aquel banco que le ofrezca una mayor tasa de interés. Se recabó información en 5 bancos durante 12 meses.

BIMESTRE

BANCO A BANCO B BANCO C BANCO D BANCO E

123456

2.32.52.12.93.23.0

2.192.523.473.042.201.95

2.432.953.493.133.981.94

2.322.953.371.982.672.89

2.83.43.72.83.83.9

a) Recomiende al inversionista el banco que mayor interés le proporcionab) Cuanto ganará por tenerlo un año en ese Banco, a tasa fijac) Si en lugar de invertir se pide un préstamo por la misma cantidad, ¿cuál banco

recomendaría?

8. Una empresa utiliza cuatro camiones para el reparto de su mercancía diariamente. Con el fin de determinar el gasto de combustibles y complementos se monitorean por un tiempo sus velocidades promedio, resultando de 40, 55, 32 y 38 kilómetros por hora en promedio por cada camión repartidor.

a) ¿Cuál es la velocidad promedio de los cuatro camiones de reparto?b) Si el rendimiento para cada uno es de 4, 4.8, 5.2 y 3.9 kilómetros por litro de

gasolina, respectivamente, cual es el consumo de gasolina promedio por día.c) Cual es el costo en combustibles por camión si el precio de gasolina es de 5.35

pesos por litro, además de un 10% adicional en gastos de complementos por camión.

9. Las velocidades promedio en tramos iguales de un vehículo durante su trayecto de la ciudad de Tepic a la ciudad de Guadalajara fueron las siguientes: 70, 120, 85, 60, 95 y 50. a) ¿Cual resulta ser el promedio de velocidad durante el trayecto?b) Si la distancia total es de 290 kilómetros ¿En que tiempo logró llegar?c) Considerando el promedio de velocidad ¿Cuál fue el gasto de combustible si el

vehículo tiene un rendimiento de 10 kilómetros por litro?

Hernández Ayón, H y Casillas Barajas, A 29

Page 41: Estadistica Descriptiva Programa 2010 (Libro)

4. MEDIDAS DE DISPERSIÓN (datos no agrupados)

Así como existe una serie de cálculos matemáticos para conocer la tendencia central de una serie de datos, existen también las medidas de dispersión, es decir, el grado de variación o turbulencia de los datos. Dos conjuntos de datos pueden tener las mismas medidas de tendencia central, pero ser muy diferentes en términos de su dispersión.

Las medidas de dispersión más básicas normalmente utilizadas son el rango, la varianza, la desviación estándar y el coeficiente de variación.

4.1. Rango (Ro)

El rango puede definirse como la diferencia que existe entre el valor mayor y el valor menor de la variable, es decir, es la magnitud entre los dos números extremos. Sirve para observar qué tan dispersos se encuentran los valores dentro de un conjunto de datos. A pesar de que al rango se le considera como una medida de dispersión simple, la desventaja de usarlo es que el cálculo no toma en cuenta la forma en que se distribuyen los datos entre los valores más grandes y los más pequeños.

Hernández Ayón, H y Casillas Barajas, A 30

Page 42: Estadistica Descriptiva Programa 2010 (Libro)

Ejemplo 4.1. Se desea conocer el rango de temperaturas en una ciudad del occidente del país, cuyos registros durante un determinado día fueron los siguientes:

Hora 6:00 9:00 12:00 15:00 18:00 21:00 24:00° C 21 26 34 36 31 28 20

Ro = Valor máximo (-) Valor mínimo = 36° C – 20° C = 16° C

No obstante, el rango resulta ser el mismo si el conjunto de datos es más grande. Por ejemplo, si tenemos doce lecturas realizadas de temperatura en °C (30.5, 29, 27.5, 23, 24, 32, 20, 25, 21, 28, 22, 36), el valor del rango es el mismo, o sea, la diferencia entre el mayor y el menor 36 – 20 = 16°C. De aquí que, como medida de dispersión, se debe tener precaución con el valor resultante, sobre todo cuando existen dos valores muy extremos.

4.2. Varianza

La varianza y la desviación estándar son dos medidas de dispersión que sí toman en cuenta la forma en que se encuentran agrupados los valores en un conjunto de datos. Estos cálculos estadísticos sirven para determinar lo cercano o alejado que se encuentran los datos respecto de un valor promedio o media. Nunca, la varianza ni la desviación estándar pueden ser negativas, pero sí pudieran ser cero, que sería cuando no hay variación en los datos, es decir, cuando todas las observaciones de la muestra tuviesen el mismo valor, lo cual es muy poco frecuente.

Por naturaleza, todo evento o fenómeno se compone de características y datos eminentemente variables. Así vemos por ejemplo como ninguna actividad económica, política o social permanece constante. Existen personas con diferentes pesos, estaturas, coeficientes intelectuales, edad, pulso, etc. Esto también sucede con las empresas, con las bolsas de valores o con la política, entre otros eventos.

La varianza4 de una muestra se define como el promedio de los cuadrados de las diferencias entre cada una de las observaciones de un conjunto de datos respecto de la media y se representa con una S2. Con la varianza se conoce qué tan dispersos se encuentran los datos a partir

4 Algunos autores la definen como el grado de dispersión o simplemente variabilidad de un conjunto de datos.Hernández Ayón, H y Casillas Barajas, A 31

Page 43: Estadistica Descriptiva Programa 2010 (Libro)

de un valor central o sea la media aritmética, la cual se comporta como “punto de equilibrio”.

Sea una muestra que contiene n observaciones X1, X2 ..., Xn, la varianza muestral en este caso será como sigue.

O en forma de sumatoria más simple

Donde = media aritmética de la muestran = tamaño de la muestraXi = i-ésimo valor de la variable aleatoria X

Por otra parte, si tenemos que analizar el total de datos en una población, la fórmula de la varianza quedaría como:

Donde N sería el total de datos de la población a tomar en cuenta.

4.3. Desviación Estándar

La desviación estándar de una muestra se define como la raíz cuadrada de la varianza muestral, y se denota mediante el símbolo S. Esta medida de dispersión es más usual que la varianza, ya que las unidades no son cuadradas. Por ejemplo, las unidades en la varianza pueden ser en pulgadas cuadradas, dólares cuadrados o metros cuadrados, lo cual no sucede con la desviación estándar.

La fórmula de la desviación estándar para una muestra determinada es:

Hernández Ayón, H y Casillas Barajas, A 32

Page 44: Estadistica Descriptiva Programa 2010 (Libro)

Y para el caso de una población, la desviación estándar está dada por la raíz cuadrada de la varianza, como sigue:

Ejemplo 4.2. A partir de los datos siguientes, correspondientes a las estaturas de 10 alumnos de Contaduría, obtenga el valor de la varianza y la desviación estándar.

Alumno 1 2 3 4 5 6 7 8 9 10Estatura 1.75 1.63 1.78 1.72 1.65 1.58 1.62 1.64 1.68 1.70

Promedio o media aritmética = (1.75 + 1.63 + ... + 1.70)/10

= 1.675

Varianza

Varianza

S2 = (1.75 – 1.675) 2 + (1.63 – 1.675) 2 + ... + (1.70 – 1.675) 2 10 - 1

S 2 = 0.0039

Desviación estándar

S = = y S = 0.0625

Este valor indica que la mayor parte de las estaturas del grupo de alumnos se encuentra 0.0625 metros por encima y por debajo del valor promedio, el cual fue de 1.675 metros.

En suma, las medidas de dispersión, cumplen con lo siguiente:

Hernández Ayón, H y Casillas Barajas, A 33

Page 45: Estadistica Descriptiva Programa 2010 (Libro)

Mientras más “separados” o dispersos estén los datos, mayor será el valor del rango, la varianza y la desviación estándar.

Si los datos están más “concentrados” o son homogéneos, menor será el rango, la varianza y la desviación estándar.

Si las observaciones de un conjunto de datos tienen el mismo valor, el rango, la varianza y la desviación estándar serán igual a cero.

Otra forma de calcular la varianza y la desviación estándar es a partir de las siguientes fórmulas abreviadas.

Donde las sumatorias pueden surgir a partir del diseño de una tabla que contenga todas las observaciones a estudiar.

4.3.1. Regla empírica para la desviación estándar

En la mayor parte de los conjuntos de los datos, gran parte de las observaciones tienden a aglutinarse cerca de la mediana, es decir, regularmente son datos homogéneos o cuasi simétricos.

Cuando no se presenta un sesgo extremo, se puede utilizar lo que se denomina regla empírica, para examinar la propiedad de variabilidad de los datos, y lograr una mejor comprensión de lo que la desviación estándar mide.

La regla empírica dice que, para la mayor parte de los conjuntos de datos, se encontrará que aproximadamente dos de cada tres observaciones (es decir, el 67%) están comprendidas dentro de la distancia de una desviación estándar en torno a la media y que aproximadamente entre el 90 y 95% de las observaciones están Hernández Ayón, H y Casillas Barajas, A 34

Page 46: Estadistica Descriptiva Programa 2010 (Libro)

comprendidas en una distancia de dos desviaciones estándar en torno a la media.

Por ello, la desviación estándar, como medida de dispersión promedio alrededor de la media ayuda a comprender cómo se distribuyen las observaciones arriba y abajo de la media y ayuda a concentrar la atención y señalar observaciones poco comunes (es decir, anormales) cuando se analiza un conjunto de datos.

La regla de Bienaymé – Chebyshev, señala que, sin importar cómo se distribuye un conjunto de datos, el porcentaje de observaciones que están contenidos dentro de k desviaciones estándar en torno a la media debe ser de, cuando menos (1 – 1/k) 100%.

Es decir, la regla cumple con lo siguiente:

Por lo menos [1 – (1/22)] 100% = 75% de las observaciones deben estar contenidas dentro de ±2 desviaciones estándar alrededor de la media.

Al menos de [1 – (1/32)] 100% = 88.89% de las observaciones deben estar contenidas dentro de ±3 desviaciones estándar en torno a la media.

Cuando menos [1 – 1/42)] 100% = 93.75% de todas las observaciones deben estar incluidas dentro de ±4 desviaciones estándar alrededor de la media.

Finalmente, si los datos forman la distribución gaussiana, es decir, cumplen con la distribución normal (o en forma de campana), el 68.25% de todas las observaciones están dentro de ±1 desviación estándar alrededor de la media, en tanto que el 95.44% corresponderá a ±2, el 99.73% a ±3 y el 99.99% a ±4 desviaciones estándar en torno a la media.

Esta información es bastante valiosa en el análisis de datos, ya que si un conjunto aleatorio de datos de determinado fenómeno se distribuye de manera normal, se podría saber con exactitud probabilística, lo cercano o alejado de la media esté una observación determinada.

4.4. Coeficiente de Variación

A diferencia de las medidas que ya se han estudiado, el coeficiente de variación es una medida relativa de dispersión. Se expresa como porcentaje y no en términos de unidades como en el caso de las demás medidas de dispersión.

Hernández Ayón, H y Casillas Barajas, A 35

Page 47: Estadistica Descriptiva Programa 2010 (Libro)

Como medida relativa se utiliza cuando se compara la variabilidad de dos o más conjuntos de datos expresados en diferentes unidades de medición. Se representa mediante “Cv” y mide la dispersión de los datos con respecto a la media en términos de proporción.

La fórmula del coeficiente de variación para una muestra bajo estudio es como sigue:

Donde S = desviación estándar del conjunto de datos= media del conjunto de los datos

El coeficiente de variación, para el caso de una población, debe cumplir también la relación entre la media y la desviación estándar poblacionales, como sigue:

Ejemplo 4.3. De acuerdo al ejemplo 4.2, determine el Coeficiente de Variación.

Del cálculo se obtuvo que la media aritmética tiene un valor de 1.675 m., mientras que la desviación estándar es de 0.0625, por lo que el Cv = (0.0625/1.675)*100 = 3.73 %. Es decir, el porcentaje de las diferencias promedio respecto de la media aritmética.

4.5. La Forma en una conjunto de datos

Otra propiedad importante que tiene un conjunto de datos se refiere a la forma en que se distribuyen. Una distribución de datos puede ser simétrica o sesgada, dependiendo del grado de asimetría y curtosis.

4.5.1. Asimetría (Ca)

El concepto de asimetría se aplica a la forma que tiene la curva normal (simétrica, asimétrica negativa o asimétrica positiva), es decir, se toma en consideración el valor promedio o media aritmética respecto del valor central o mediana.

Criterios de observación:

Hernández Ayón, H y Casillas Barajas, A 36

Page 48: Estadistica Descriptiva Programa 2010 (Libro)

Si la mediana y la media aritmética de un conjunto de datos son iguales se dice que los datos son simétricos (o con sesgo cero), ya que se considera que, los valores que se encuentran, tanto por debajo de la media, como por arriba, se compensan entre sí.

Si la media es mayor que la mediana, entonces se dice que los datos tienen un sesgo positivo o hacia la derecha, lo cual indica que se tiene una mayor cantidad de valores superiores.

Si la media es menor que la mediana, se dice entonces que los datos sufren de un sesgo negativo o hacia la izquierda, dado que se tendrá una mayor cantidad de valores bajos.

Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría de Fisher, que viene definido como:

Como resultado de la aplicación de la fórmula se puede obtener lo siguiente:

Ca = 0: Distribución simétrica; existe la misma concentración de valores a la derecha que a la izquierda de la media.Ca > 0: Distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a la izquierda.Ca < 0: Distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que del lado derecho.

Donde Ca: coeficiente de asimetrían: tamaño de la muestrani: observaciones de igual valor (repeticiones)xi: valor de la observación o variablexm: valor de la media aritmética

Hernández Ayón, H y Casillas Barajas, A 37

Page 49: Estadistica Descriptiva Programa 2010 (Libro)

4.5.2. Curtosis (Cc)

Otro procedimiento que nos permite conocer la forma que toma un conjunto de datos es por medio de lo que se denomina el Coeficiente de Curtosis, el cual sirve para analizar el grado de concentración de valores alrededor de la zona central.

Se reconocen tres tipos de distribuciones según el grado de curtosis:

Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

El cálculo del Coeficiente de Curtosis se obtiene mediante la siguiente fórmula:

Los resultados pueden ser los siguientes:

Cc = 0: Distribución mesocúrticaCc > 0: Distribución leptocúrticaCc < 0: Distribución platicúrtica

Hernández Ayón, H y Casillas Barajas, A 38

Page 50: Estadistica Descriptiva Programa 2010 (Libro)

Ejemplo 4.4. A partir de la siguiente tabla de estaturas, determine los coeficientes de asimetría y de curtosis. ¿Qué forma tienen los datos?

Estatura ni (xi – xm)2 (xi – xm)2(ni) (xi – xm)3 (xi – xm)3(ni)1.56 2 0.020354 0.040709 -0.002904 -0.0058081.65 5 0.002774 0.0138706 -0.000146 -0.0007301.66 2 0.001820 0.0036414 -0.000077 -0.0001551.69 3 0.000160 0.0004815 -0.000002 -0.0000061.70 4 0.000007 0.0000285 -0.000000 -0.0000001.72 5 0.000300 0.0015016 0.000005 0.0000261.74 2 0.001393 0.0027870 0.000052 0.0001041.76 4 0.003286 0.0131469 0.000188 0.0007531.78 1 0.005979 0.0059799 0.000462 0.0004621.81 2 0.0115197 0.0230394 0.001236 0.002472xm =

1.70267n = 30

= 0.0475927

= 0.1055477

= -0.001186

= -0.002882

Ejemplo 4.5. Describa el símbolo que corresponda.

Símbolo SímboloMedia aritmética poblacional Tamaño de muestraModa Media aritmética muestralRango medio Desviación estándar

muestralMediana PoblaciónDesviación estándar poblacional

Coeficiente de asimetría

Rango Coeficiente de variación

EJERCICIOS

1. Dos granjas de camarones están siendo monitoreadas para conocer cual está operando mejor según la alimentación que se les da. Para observar la comparación entre ambos, se capturan diez camarones de cada estanque y se compara la talla en centímetros. Estanque 1 2.5 2.9 2.1 3.2 3.5 2.9 3.0 4.7 2.8 4.5

Hernández Ayón, H y Casillas Barajas, A 39

Page 51: Estadistica Descriptiva Programa 2010 (Libro)

Estanque 2 3.6 2.5 3.8 3.3 3.7 4.1 2.9 3.8 4.2 3.6Determine:

a) Las medidas de tendencia Central b) Las medidas de dispersión c) Cual estanque opera mejor (regular)d) Si el requisito para venderle a EU es que sobrepasen de 3.0 cm., promedio,

¿podrá vender la empresa el producto? ¿cuál o cuales estanques?

2. El Hospital Central de la Ciudad de Tepic, registró en el mes de enero promedios por día y por semana, las siguientes consultas médicas por problemas respiratorios.Día 1: 38 Obtenga: a) Las medidas de Tendencia CentralDía 2: 26 b) Las medidas de DispersiónDía 3: 31Día 4: 28Día 5: 41Día 6: 30Día 7: 17

3. Las estaturas y pesos en una muestra tomada al azar entre hombres y mujeres aparece en la tabla siguiente.

a) Cual género presenta un mayor promedio por variable (estatura y de peso)

b) En cual de ellos existe una mayor variabilidad de datos (por variable y género)

c) Cual es el peso mas uniforme (hombres o mujeres)d) Cual es la estatura mas uniforme (hombres o mujeres)

Peso en Kg. Estatura en m.MUJERES HOMBRES MUJERES HOMBRES

48 58 1.62 1.7055 70 1.69 1.6960 65 1.70 1.7163 63 1.68 1.6570 67 1.71 1.6752 69 1.69 1.7858 71 1.70 1.8367 75 1.72 1.8559 58 1.66 1.7660 63 1.68 1.6872 65 1.69 1.5966 72 1.76 1.8063 69 1.70 1.7058 78 1.72 1.8857 56 1.67 1.6869 76 1.58 1.8175 74 1.70 1.7972 76 1.69 1.8666 68 1.60 1.7562 69 1.63 1.82

4. Una empresa embotelladora mantiene en revisión sus dos líneas de llenado. Para ello se realiza un muestreo al azar de cada Máquina, de donde se obtuvieron los siguientes resultados

Hernández Ayón, H y Casillas Barajas, A 40

Page 52: Estadistica Descriptiva Programa 2010 (Libro)

MAQUINA 1 (línea 1)

MAQUINA 2 (línea 2)

340 313315 318312 315335 324318 318310 315319 312338 318330 326316 312314 319318 324315 322317 333325 336322 328231 325321 316314 319316 321

Después de realizar los cálculos correspondientes y tomando en consideración que la Norma Oficial Mexicana (NOM) señala como llenado mínimo promedio los 335 mililitros con 5% de dispersión, determine ¿Cuál de las líneas de llenado según usted debe quedar fuera de operación y porque?

5. Un estudio exploratorio, respecto a los sueldos que ganan los empleados por día, en cuatro diferentes tiendas de la ciudad de Tepic, arrojó los siguientes valores.

Hernández Ayón, H y Casillas Barajas, A 41

Page 53: Estadistica Descriptiva Programa 2010 (Libro)

LEY SORIANA WALMART ISSSTE9879769079808870106976958

67859690103958588746585

6867728095959076956890939578

751109011011011090907511075759090

a) Cual tienda ofrece en promedio un mayor sueldob) En cual de ellas se observan sueldos más dispersosc) En cual tienda es más regular el pagod) En cual existe un mayor rango de datos extremose) En cual de ellas se observan sueldos más estables o regularesf) En el caso de la tienda Soriana, cuantos empleados sobrepasan del salario

promediog) Que información le proporciona el dato de la moda para el caso de la tienda del

ISSSTE

5. ANÁLISIS ESTADÍSTICO PARA DATOS AGRUPADOS

Tanto las medidas de tendencia central como de dispersión que se han visto en temas anteriores, están orientadas hacia el análisis estadístico de datos no agrupados, es decir, conjunto de datos reales que, por ser

Hernández Ayón, H y Casillas Barajas, A 42

Page 54: Estadistica Descriptiva Programa 2010 (Libro)

tamaños de muestra pequeños, no ofrecen dificultad alguna para tomarlos en cuenta a todos. No obstante, en ocasiones es necesario trabajar con series de datos mayores, que sin la ayuda de cálculos estadísticos para datos agrupados o sin el apoyo de paquetes y medios electrónicos, sería prácticamente imposibles de ser analizados. Por ello, al igual que para datos no agrupados (originales), también existen técnicas de análisis para datos agrupados.

Los datos agrupados son aquellos que, debido a la cantidad de valores u observaciones a manejar por el analista, se hace necesario agruparlos en intervalos de clase de acuerdo a su frecuencia. El cálculo que se obtiene mediante esta vía, son aproximaciones a lo que ocurre realmente, es decir, se acepta que trabajar con datos no agrupados tiene una mayor confiabilidad y validez.

Como se vio al principio del texto, existen formas de agrupar los datos de un conjunto en escalas de igual amplitud, señalando en cada intervalo el número de datos que ahí se encuentran, a lo que hemos denominado frecuencia de clase.

Ejemplo 5.1 Con el fin de conocer la producción de naranjas en una huerta, se tomó una muestra de cien árboles y se contaron las naranjas cosechadas por cada árbol. Los datos obtenidos se ordenaron (de menor a mayor) y son los que se muestran en la siguiente tabla.

Tabla No.5.1 Producción de naranjas en una huerta.382 749 973 1131 1264439 775 976 1140 1275457 784 978 1143 1279482 796 985 1148 1293511 813 989 1148 1310546 821 1001 1154 1318550 827 1008 1157 1329556 843 1012 1158 1332571 849 1030 1170 1338571 850 1045 1183 1371595 859 1049 1185 1383628 863 1052 1190 1397661 874 1058 1194 1404672 878 1066 1199 1418679 892 1089 1203 1427690 915 1094 1231 1436706 926 1106 1235 1449706 932 1109 1238 1456731 945 1120 1241 1468744 960 1126 1260 1534

Hernández Ayón, H y Casillas Barajas, A 43

Page 55: Estadistica Descriptiva Programa 2010 (Libro)

Como se observa, se tienen 100 datos que oscilan entre 382 y 1534, por lo cual será conveniente establecer intervalos de longitud igual en el eje X, ya que, de lo contrario, se ocuparía una longitud muy amplia (aproximadamente de 1 metro) e imposible de representar gráficamente. Por ello, a partir de la tabla original de datos es posible construir una tabla de distribución de frecuencias tomando como base un intervalo constante al que llamaremos clase, como sigue:

Tabla 5.2. Tabla de distribución de frecuencias.Intervalo de clase

(IC)

Frecuencia absoluta

(fa)

Frecuencia relativa

(fr)

Frecuencia relativa acumulada

(fra)

Frecuencia porcentualizada

(fp)382 - 526527 - 671672 - 816817 - 961

962 - 11061107 - 1251

1252 - 1396

1397 - 1541

58

12151722129

0.050.080.120.150.170.220.120.09

0.050.130.250.400.570.790.911.00

5%8%12%15%17%22%12%9%

Total 100 1.00 100

Cada intervalo se denomina clase, y los límites del intervalo se reconocen como límites de clase.

Pero ¿cómo se obtuvieron los intervalos y sus frecuencias?

Para determinar el intervalo de clase a utilizar, se recomienda lo siguiente:

Cada valor debe pertenecer a uno y sólo un intervalo Los intervalos deben tener igual longitud Es deseable que no queden intervalos a los que no pertenezca

ningún dato El número de intervalos se puede determinar de acuerdo al

número de datos disponibles. Para ello no hay regla fija, pero se puede tomar como criterio el señalado en la siguiente tabla.

TABLA 5.3

Tamaño de muestra Número de intervalos

Hernández Ayón, H y Casillas Barajas, A 44

Page 56: Estadistica Descriptiva Programa 2010 (Libro)

Menos de 10De 10 a 20De 20 a 45De 45 a 90De 90 a 180De 180 a 360De 360 a 720Más de 720

45678910

entre 10 y 20

Una vez elegido el número de intervalos, se puede determinar la magnitud o amplitud de dichos intervalos a partir de la diferencia entre el valor mayor y el menor (rango), dividido entre el número de intervalos. Para el caso del ejemplo anterior, el número de intervalos a escoger, de acuerdo a la tabla 2.3, sería de 8, puesto que el tamaño de la muestra es de 100 y, la amplitud de cada intervalo será:

Este valor se irá sumando a partir del número más pequeño: 382 + 144 = 526; 527 + 144 = 671 y así sucesivamente hasta cubrir todos los datos.

Como no existe una regla fija, se pudo haber escogido una amplitud más cómoda: 145 o 150 e iniciar el conteo a partir de una cantidad más exacta como 200 o 300, lo que generaría un número distinto de intervalos, sin embargo, esto queda al criterio y experiencia del analista; sólo debe cuidarse que cada dato se ubique en uno, y sólo un, intervalo de clase.

Esta forma de establecer intervalos de clase, permite representar, a través de un histograma de frecuencias, tal cantidad de datos sin necesidad de representar gráficamente cada valor. El histograma resultante del ejemplo anterior se representa finalmente como sigue.

Hernández Ayón, H y Casillas Barajas, A 45

Page 57: Estadistica Descriptiva Programa 2010 (Libro)

0

5

10

15

20

25

382 - 526

527 - 671

672 - 816

817 - 961

962 - 1106

1107 - 1251

1252 - 1396

1397 - 1541

Intervalos de clase

Fre

cuen

cia

abso

luta

Figura 5.1 Histograma de frecuencias.

En los paquetes computacionales ya mencionados como Excel y SPSS, entre otros, existen diferentes herramientas de apoyo que permiten realizar cualquier tipo de diseño dada la creatividad y el ingenio personal, donde las barras pueden convertirse en cilindros, conos o cualquier otra figura geométrica que represente de una manera mas ilustrativa los datos.

Para trabajar con datos agrupados se requiere entonces del intervalo de clase, el punto medio de esa clase, la frecuencia y otros cálculos. Esto es, la tabla se va complementando con tantas columnas como necesidades haya de información.

La tabla de distribución de frecuencias (tabla 2.2) muestra en la segunda columna la cantidad de valores (frecuencia absoluta), que se encuentran en cada intervalo de clase, por ejemplo hay 5 datos (árboles) dentro del intervalo 382 - 526; 8 en el intervalo 526 - 670,… La tercer columna o frecuencia relativa se calcula con base al total de datos, esto es, 5/100 = 0.05, 8/100 = 0.08... Por su parte, la frecuencia relativa acumulada, como su nombre lo indica, va sumando el valor del intervalo inmediato superior: (0.05 + 0.08 = 0.13), (0.13 + 0.12 = 0.25), (0.25 + 0.14 = 0.39)… Por último, la cuarta columna (frecuencia porcentualizada) se obtiene multiplicando por 100 la frecuencia relativa.

Hernández Ayón, H y Casillas Barajas, A 46

Page 58: Estadistica Descriptiva Programa 2010 (Libro)

A partir de esta agrupación de valores de la variable en intervalos de clase, es posible aplicar también un análisis de tendencia central y de dispersión.

5.1. Media aritmética. Para obtener la media aritmética se requiere conocer el punto medio de clase o marca de clase (mc) y la frecuencia absoluta (fa). Con la sumatoria de los productos de estas dos columnas, dividido entre el número total de datos (n), se obtiene el valor promedio de producción de naranjas, cuya fórmula es la siguiente.

Intervalo de clase

(IC)

Frecuencia absoluta

(fa)

Punto medio de clase (mc)

Producto(fa)(mc)

382 - 526527 - 671672 - 816817 - 961

962 - 11061107 - 1251

1252 - 1396

1397 - 1541

5812151722129

4545987428861030117413181462

2,2704,7848,90412,40417,51027,00215,81613,158

Total (n) 100 = 7664 = 101,848

De esta manera la media aritmética calculada para los datos agrupados será:

Este resultado es similar a la media calculada para datos no agrupados (1010.83), es decir, si se suman todos los cien valores reales, sin utilizar intervalos, el resultado que se obtiene es más exacto.

5.2. Moda para datos agrupados

Hernández Ayón, H y Casillas Barajas, A 47

Page 59: Estadistica Descriptiva Programa 2010 (Libro)

Para un conjunto de datos agrupados, la moda se calcula mediante la fórmula siguiente:

Mo = Lri + c

Siendo:

Lri Límite real inferior del IC que contenga la moda. Este intervalo es donde se encuentra la mayoría de árboles, es decir, entre el IC 1107 y 1251, por lo que el Lri = (1107 + 1106)/2 = 1106.5

D1 Diferencia entre la frecuencia del IC que contenga la moda y la frecuencia de la clase inmediata anterior: 22 – 17 = 5

D2 Diferencia entre la frecuencia del IC que contenga la moda y la frecuencia de la clase inmediata posterior: 22 – 12 = 10

C Amplitud del IC que contenga la moda: 1107 – 1106 = 144

Mo = 1154.5

5.3. Mediana para datos agrupados

La mediana para un conjunto de datos agrupados se calcula utilizando la fórmula siguiente:

Md = Lri + c

Siendo:Lri Límite inferior del IC que contenga la mediana. La mediana

se encuentra en el punto (N+1)/2, por lo que el lugar 50.5 se encuentra entre el IC 962 y 1106; entonces Lri = (962 +961)/2 = 961.5 Población total dividida entre dos: O sea 100/2 = 50

f1 Suma de frecuencias hasta el IC anterior al que contenga la mediana: 40 árboles

f2 Frecuencia del IC que contenga la mediana: 17 árbolesC Amplitud del IC que contenga la mediana: 144

Md = 1046.215.4. Media geométrica para datos agrupados

La media geométrica para el caso de datos agrupados, se determina mediante las siguientes fórmulas:

Hernández Ayón, H y Casillas Barajas, A 48

Page 60: Estadistica Descriptiva Programa 2010 (Libro)

La fórmula anterior, se puede escribir en términos de logaritmos como

5.5. Media armónica para datos agrupados

Para un conjunto de datos agrupados, se calcula de la siguiente manera:

En general:

Hernández Ayón, H y Casillas Barajas, A 49

Page 61: Estadistica Descriptiva Programa 2010 (Libro)

5.6. Medidas de dispersión para datos agrupados: Varianza, Desviación estándar y Coeficiente de variación.

Por otra parte, para calcular la varianza y la desviación estándar en un conjunto de datos agrupados, se pueden desarrollar fórmulas de definición similares a la media, por ejemplo:

Utilizando valores del mismo ejemplo sobre naranjas por árbol, con media aritmética igual a 1018. 48, tenemos.

Intervalo de clase

(IC)

Punto medio de la clase (mc)

Frecuencia absoluta o de

clase (fa)(mc - ) (mc - )2

(mc - )2

*fa

382 - 526527 - 671672 - 816817 - 961962 - 1106

1107 - 1251

1252 - 1396

1397 - 1541

4545987428861030117413181462

58

12151722129

-564.48-420.48-276.48-132.4811.52155.52299.52443.52

318637.67

176803.43

76441.19

17550.95

132.7124186.4

789712.2

3196710.

0

1593188.31414427.4917294.2263264.2

2256.1532102.31076546.71770389.9

TOTALES = 7664 100 7569469.4

= 1018.48

Este valor es un poco diferente del que se obtiene al tomar en cuenta todos los datos (S2 = 77548.54) es decir, realizando el análisis con las fórmulas para datos no agrupados como se explicó al principio. Sin embargo, como se ha señalado, el hecho de trabajar con datos agrupados da idea aproximada de cómo se distribuyen.

Hernández Ayón, H y Casillas Barajas, A 50

Page 62: Estadistica Descriptiva Programa 2010 (Libro)

La varianza de una población solo difiere en el tamaño de los datos, o

sea N.

Mientras tanto la desviación estándar para datos agrupados que utiliza el mismo símbolo conocido S, quedaría definido como la raíz cuadrada de la varianza.

Para una muestra:

Del ejemplo, S = 7569469.4 = 276.51

Para una población:

La fórmula del coeficiente de variación es la misma tanto para datos simples como para datos agrupados, por lo que, del ejemplo:

Donde S = desviación estándar= media aritmética

EJERCICIOS

1. A partir de la siguiente tabla de datos obtenga por género y por variable las siguientes medidas de dispersión:

Hernández Ayón, H y Casillas Barajas, A 51

Page 63: Estadistica Descriptiva Programa 2010 (Libro)

Edad en años Peso en Kg. Estatura en mts.MUJERES HOMBRE

SMUJERES HOMBRE

SMUJERES HOMBRE

S17 25 48 58 1.62 1.7022 21 55 70 1.69 1.6920 18 60 65 1.70 1.7119 17 63 63 1.68 1.6519 22 70 67 1.71 1.6718 26 52 69 1.69 1.7821 28 58 71 1.70 1.8322 35 67 75 1.72 1.8517 18 59 58 1.66 1.7619 17 60 63 1.68 1.6820 21 72 65 1.69 1.5923 23 66 72 1.76 1.8018 20 63 69 1.70 1.7029 27 58 78 1.72 1.8816 19 57 56 1.67 1.6824 19 69 76 1.58 1.8131 22 75 74 1.70 1.7926 18 72 76 1.69 1.8618 24 66 68 1.60 1.7520 26 62 69 1.63 1.82

a) Desviación estándarb) Rangoc) Coeficiente de variaciónd) Con base en los resultados obtenidos explique la

variabilidad de la variable edad, peso y estatura de hombres respecto a las mujeres.

2. Los datos que aparecen a continuación son el resultado de las ventas de dos sucursales del mismo giro por mes, durantes dos años (en miles).

Sucursal A

Sucursal B

34 1331 1831 1533 2431 1831 1539 1238 1830 2631 1234 1938 2435 2237 33

Hernández Ayón, H y Casillas Barajas, A 52

Page 64: Estadistica Descriptiva Programa 2010 (Libro)

35 3632 2821 2531 1634 1936 2131 3230 2529 20

a) Cual tienda tiene en promedio mejores ventas.b) En cual de ellas se observan ventas más establesc) Cual es el promedio de ventas por día en cada una de ellasd) Considerando una sola serie de datos entre A y B, que promedio

de ventas se tiene.e) Con los datos agrupados (una sola serie), obtenga gráficos de

puntos, circular, histograma y ojiva.f) Que información proporciona la mediana y la moda de datos

agrupados

6. PROBABILIDAD

En nuestras actividades diarias nos hemos acostumbrado a escuchar comentarios que están relacionados o llevan implícito el concepto de probabilidades: los pronósticos meteorológicos señalan las probabilidades de lluvia; los médicos nos dicen qué probabilidades hay de que nuestras enfermedades se curen por medio de determinados tratamientos terapéuticos; los encuestadores políticos nos dicen qué oportunidad tiene un candidato de ganar las elecciones, etc.

Hernández Ayón, H y Casillas Barajas, A 53

Page 65: Estadistica Descriptiva Programa 2010 (Libro)

Sin tener en cuenta la profesión que se haya elegido, algo sí es seguro: en algún momento se han de tomar decisiones. Con mucha frecuencia esto tendrá que hacerse sin conocer todas las consecuencias de tales decisiones. Los inversionistas, por ejemplo, deben decidir sobre la conveniencia de invertir en una acción en particular con base en sus expectativas de rendimientos futuros. Los empresarios, al decidir comercializar un producto enfrentan la incertidumbre sobre la posibilidad de éxito. Todo esfuerzo por reducir el nivel de incertidumbre en el proceso de toma de decisiones incrementará enormemente la probabilidad de que se tomen decisiones más inteligentes y bien informadas.

La inferencia estadística se basa en los fundamentos de la teoría de la probabilidad, rama de las matemáticas que se ocupa de los fenómenos que se producen al azar, o fenómenos aleatorios, como también se les suele llamar. En tal sentido, el propósito de este tema es ilustrar las formas en las cuales puede medirse la posibilidad o probabilidad de ocurrencia de eventos futuros.

6.1 Fundamentos Básicos

La teoría de la probabilidad, formulada en 1654, y el cálculo de probabilidades se atribuyen a los matemáticos franceses Blas Pascal (1623-1662) y Pierre de Fermat (1601- 1665).

La probabilidad es la posibilidad numérica entre 0 y 1 de que ocurra un evento. Si la probabilidad de que ocurra un evento es medida mediante valores comprendidos entre 0 y 1, entonces, entre mayor sea la probabilidad de que ocurra un evento, la probabilidad asignada estará más próxima a 1. La probabilidad de certeza es 1. La probabilidad de una imposibilidad es 0. Esto se puede expresar de la manera siguiente:P (evento cierto) = 1P (evento imposible) = 0Por tanto, la probabilidad de un evento tiene un rango de 0 P (E1 ) 1

Un experimento es un proceso o actividad que conduce a un resultado u observación. Según esta definición, un experimento puede ser tan simple como lanzar una moneda para ver si cae águila o sello, o tan complicado como un experimento formal que tenga por objeto averiguar cuál es entre varios métodos de enseñanza el más efectivo. Todo experimento conlleva a un resultado único bien definido. Lanzar un dado es un experimento, por lo que un resultado bien definido para este experimento es el número 1, 2, 3, 4, 5 o 6. Otro experimento puede consistir en revisar un producto para determinar si cumple con ciertas especificaciones de fabricación, donde los posibles resultados son (1) “defectuoso” o (2) “no defectuoso”. También puede ocurrir que, ante un

Hernández Ayón, H y Casillas Barajas, A 54

Page 66: Estadistica Descriptiva Programa 2010 (Libro)

examen aplicado a estudiantes, los resultados posibles sean “aprobar” o “reprobar”. A cada uno de los posibles resultados que se obtienen de un experimento, se denomina “evento”.

El conjunto de todos los posibles resultados de un experimento es el espacio muestral (SS); por ejemplo el espacio muestral de lanzar un dado es

SS = (1, 2, 3, 4, 5, 6)

Mientras que el espacio muestral para el experimento de lanzar una moneda al aire es:

SS = (águila, sello)

La probabilidad de que al menos uno de los eventos que están en el espacio muestral ocurra es igual a 1. Si se lanza un dado, el resultado debe ser un número entre 1 y 6. Debido a que esto es una certeza puede decirse que:

A pesar de la difundida aplicación de los principios de la probabilidad, existen sólo tres formas generalmente aceptadas para la ocurrencia de eventos: (1) el modelo subjetivo, (2) el modelo clásico (o a priori) y (3) el modelo de frecuencia relativa (o a posteriori).

Hernández Ayón, H y Casillas Barajas, A 55

Page 67: Estadistica Descriptiva Programa 2010 (Libro)

Modelo subjetivo

En muchas ocasiones no se dispone de datos históricos registrados. Por tanto no es posible calcular la probabilidad a partir del pasado. La única alternativa es estimar la probabilidad con base en nuestro mejor criterio. El modelo subjetivo requiere establecer la probabilidad de algún evento con base en la mejor evidencia disponible. Existen muchos eventos de interés cuyas probabilidades de ocurrencia no se pueden calcular de acuerdo con los métodos de frecuencia relativa o de probabilidad a priori. Estos métodos no prestan ninguna ayuda para calcular la probabilidad de que, por ejemplo, haya vida en un planeta distante, o de que en los próximos 10 años se descubra algún remedio contra el cáncer, o de que determinada persona vaya a destacar en la universidad, o de que un equipo de fútbol vaya a ganar el campeonato.

La magnitud de la probabilidad que una persona asigna subjetivamente a un evento depende del grado de crédito que esa persona le dé a la ocurrencia del evento. Así pues, es posible asignarle probabilidades a eventos que sólo se presentan una sola vez. A diferencia del método de probabilidad de frecuencia relativa, la probabilidad subjetiva no depende de la posibilidad de repetición de un experimento. En muchos casos esto apenas puede ser una conjetura hecha sobre cierta base. El modelo subjetivo se utiliza cuando se desea asignar una probabilidad a un evento que nunca ha ocurrido y que se estima que puede ocurrir. La probabilidad de que una mujer sea elegida como Presidente de México es un ejemplo. Debido a que no hay datos sobre los cuales confiar, se deben analizar las opiniones y creencias para obtener una estimación subjetiva. Este modelo subjetivo de probabilidades prevaleció durante años entre los campesinos para determinar en que momento iniciarían las lluvias y el tipo de tormentas que se esperaban, los cuales asignaban una probabilidad estimativa al observar el comportamiento de las aves.

6.3. Modelo Clásico

De los tres métodos para medir la probabilidad, el modelo clásico es el que se relaciona con mayor frecuencia con las apuestas y juegos de azar.

La probabilidad clásica de un evento E se determina mediante:

Aun sin conocer a fondo la probabilidad clásica, se puede estar consciente de que la probabilidad de obtener una cara en un solo lanzamiento de una moneda es de la mitad. Esto puede ilustrarse usando la fórmula

Hernández Ayón, H y Casillas Barajas, A 56

Page 68: Estadistica Descriptiva Programa 2010 (Libro)

Existe solo una forma en que puede ocurrir el evento (se obtiene una cara), y existen dos posibles resultados (una cara y un sello). De igual forma, la probabilidad de sacar un 3 con un dado de 6 caras es:

Existe solo una forma en que puede ocurrir el evento (caer un 3), y seis posibles resultados.

La probabilidad clásica implica la determinación de la probabilidad de algún evento a priori, es decir, puede conocerse el resultado antes del experimento (antes del hecho). Por tanto, antes de sacar una carta de una baraja de 52, se puede determinar que la probabilidad de sacar un as es:

6.4. Modelo de Frecuencia Relativa

El modelo de frecuencia relativa utiliza datos que se han observado empíricamente, registra la frecuencia con que ha ocurrido algún evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con base en estos datos históricos (por ello se le denomina a posteriori). Esta interpretación de probabilidad depende de la idea de regularidad estadística, que establece que las frecuencias relativas tienden a estabilizarse y a aproximarse a un valor fijo después de un gran número de repeticiones de un experimento, aunque fluctúen considerablemente cuando sólo se han hecho algunos ensayos del experimento.

La probabilidad de un evento con base en el modelo de frecuencia relativa se determina mediante

Hernández Ayón, H y Casillas Barajas, A 57

Page 69: Estadistica Descriptiva Programa 2010 (Libro)

Ejemplo 6.4.1. Asumiendo que durante el año anterior hubo 50 nacimientos en un hospital local, de los que 32 de los recién nacidos fueron niñas. El modelo de frecuencia relativa revela que, la probabilidad de que el siguiente nacimiento (o un nacimiento seleccionado aleatoriamente) sea una niña, es:

Ejemplo 6.4.2. Un importador de cristal irlandés recibe envíos de cajas de tres artículos. El monitoreo en 100 cajas indicaron que el número de artículos dañados que había en cada caja, fue el siguiente.

Número de defectos (E)

Número de Cajas

P (E)

0123

40272112

40/100 = 0.40

27/100 = 0.27

21/100 = 0.21

12/100 = 0.12

100 1.00

En el pasado, 21 de las 100 cajas totales contenían exactamente 2 artículos dañados. Entonces el modelo de frecuencia relativa asignaría una probabilidad de que dos artículos en cualquier caja dada estuvieran dañados así:

P (2) = 21/100 = 0.21

La probabilidad para cada resultado individual se muestra en la última columna, la cual suma 1.

Un problema común con el modelo de frecuencia relativa resulta cuando se hacen estimaciones con un número insuficiente de observaciones. Por ejemplo, se asume que en los dos vuelos de una aerolínea en los que se hicieron registros el año pasado estuvieron retrasados al llegar a su destino. Por tanto, se concluye que el vuelo que se abordará el próximo mes en la misma aerolínea, también estará retrasado. Aunque tales inferencias son comunes, no existen suficientes

Hernández Ayón, H y Casillas Barajas, A 58

Page 70: Estadistica Descriptiva Programa 2010 (Libro)

datos como para sacar tal conclusión y se deben evitar las decisiones basadas en tales inferencias.

EJERCICIOS

1. ¿Cuál modelo de probabilidad es apropiado para cada uno de los experimentos enumerados a continuación? Explique su respuesta.

a) La Bolsa Mexicana de Valores hoy cerrará a la alza.b) Una unidad de producción será defectuosa.c) Sacar un número impar (1, 3 o 5) con un dado.d) En las próximas horas se espera un terremoto de 5° en la escala de Richter

2. Cite tres ejemplos de negocios para cada uno de los tres modelos de probabilidad.

Hernández Ayón, H y Casillas Barajas, A 59

Page 71: Estadistica Descriptiva Programa 2010 (Libro)

3. La siguiente tabla muestra el número de computadoras vendidas diariamente por una tienda

Número de computadoras vendidas

Número de días

01234

1243182025

Determine la probabilidad de que el número de computadoras que se vendan hoy sea:a) 2.b) Menos de 3.c) Más de 1.d) Por lo menos 1.

4. En las cuatro últimas finales del campeonato de fútbol, un aficionado lanzó una moneda al aire y cayó cara todas las veces. Una persona cercana le sugiere que pedir sello esta vez aumentará la probabilidad de que gane el lanzamiento. ¿Está en lo cierto o está equivocado? Explique su respuesta.

5. ¿Cuál modelo de probabilidad utilizó en el problema anterior?

6. Durante el año anterior, las ventas semanales de una boutique para damas han sido “bajas” durante 16 semanas, “considerables” durante 27 semanas y “altas” el resto de las semanas. Cuál es la probabilidad de que las ventas de esta semana sean:

a) Considerablesb) Bajasc) Altasd) Por lo menos considerables

6.5. Teoría de Conjuntos

El estudio de la probabilidad y especialmente el cálculo de probabilidades se facilita con el concepto de conjunto. Fue George Cantor (1845-1918), quien en la segunda parte del siglo XIX empezó a desarrollar la teoría de conjuntos, la cual ha sido de gran importancia no solo en el campo de la probabilidad y la estadística, sino que es fundamental en la matemática moderna.

Definición: Un conjunto es una colección bien definida de objetos.

A los objetos de que está compuesto un conjunto se les llama elementos. Con frecuencia es de utilidad identificar cómo pueden relacionarse los conjuntos entre sí. Se asume que se han identificado dos conjuntos A y B. Cada uno contiene numerosos elementos. Es

Hernández Ayón, H y Casillas Barajas, A 60

Page 72: Estadistica Descriptiva Programa 2010 (Libro)

completamente posible que algunos elementos estén en ambos conjuntos. Por ejemplo, se asume que el conjunto A consta de todos los estudiantes de la clase de estadística, y el conjunto B consta de todos los estudiantes de la Facultad que están especializándose en el posgrado de Administración Pública. Aquellos elementos (estudiantes) que están en ambos conjuntos son los especialistas en Administración Pública de la clase de estadística. Tales estudiantes constituyen la intersección entre A y B. La intersección entre A y B (que se escribe AB) consta de los elementos que son comunes tanto en A como en B. Se utilizan las letras mayúsculas como A, B, C ó D para designar conjuntos y letras minúsculas a, b, c, x, y, etc., para designar los elementos del conjunto.

El diagrama de Venn es una herramienta útil para mostrar la relación entre conjuntos. Este modelo, fue desarrollado el matemático inglés John Venn (1834 – 1923). En el diagrama pueden verse los dos conjuntos A y B que, para el caso del ejemplo, sería los estudiantes que están tanto en el conjunto A (la clase) como en el conjunto B (especialistas en Administración Pública).

A B

Intersección entre A y B (A B) Es el conjunto de todos los elementos que están tanto en A como en B.

Para que ocurra A B, tanto A como B deben ocurrir. El estudiante debe estar en la clase de estadística y en la especialización de Administración Pública.

La unión de A y B (A B) consta de tales elementos que están en A, en B o en ambos. Como se ve en la figura anterior, todos los estudiantes que están en la clase (conjunto A) sin tener en cuenta su especialización y todos los especialistas en Administración Pública (conjunto B) sin tener en cuenta que están en la clase de estadística, son elementos de A B.

Unión de A y B (A B) Es el conjunto de todos los elementos que están en A o en B.

Hernández Ayón, H y Casillas Barajas, A

A

B

61

Page 73: Estadistica Descriptiva Programa 2010 (Libro)

Para que un elemento esté en A B, solo necesita estar en el conjunto A o en el conjunto B o en ambos.

6.5.1. Eventos colectivamente exhaustivos

Una comprensión precisa de la probabilidad requiere del entendimiento de las formas como pueden relacionarse los eventos. Los eventos colectivamente exhaustivos constan de todos los posibles resultados de un experimento y constituyen su espacio muestral. Los eventos colectivamente exhaustivos de lanzar un dado son 1, 2, 3, 4, 5, y 6. Además, debido a que existe la certeza de que uno de estos ocurrirá, su probabilidad combinada será igual a 1:

P (1 o 2 o 3 o 4 o 5 o 6) = 1

Los eventos colectivamente exhaustivos de lanzar una moneda son dos (águila y sello). De aplicar un examen son también dos (aprobar y reprobar).

Eventos colectivamente exhaustivos

Cuando se toman en cuenta todos los posibles resultados de un experimento. Constituyen el espacio muestral.

6.5.2. Eventos mutuamente excluyentes

Dos o más eventos son mutuamente excluyentes, si en caso de ocurrir uno los otros no pueden ocurrir. Los eventos “pasar” y “reprobar” respecto a un examen determinado son mutuamente excluyentes, puesto que ninguna persona puede, al mismo tiempo, pasar y reprobar un examen.

Si A y B son mutuamente excluyentes, la probabilidad P(A B) = 0, ya que no existen características comunes entre A y B, o simplemente no pueden ocurrir simultáneamente. Por ejemplo, sacar una cara o un sello al lanzar una moneda una vez o seleccionar una unidad de producción y encontrarla defectuosa o no defectuosa son eventos mutuamente excluyentes.

Eventos mutuamente excluyentes

Dos eventos son mutuamente excluyentes si la ocurrencia de uno prohíbe o rechaza la ocurrencia del otro.

Hernández Ayón, H y Casillas Barajas, A 62

Page 74: Estadistica Descriptiva Programa 2010 (Libro)

6.5.3. Eventos complementarios

Son los eventos en los que si un evento no ocurre, el otro debe ocurrir. Si un evento A es lanzar un número par con un dado (2, 4 o 6), el complemento es lanzar un número impar (1, 3 o 5). Si no se obtiene un número par, se debe obtener un número impar. El complemento de A se escribe como A’, y se denomina “no A”.

Los eventos complementarios también son colectivamente exhaustivos porque si A’ no ocurre, A debe ocurrir. Por tanto:P(A) + P (A’) = 1Y, P (A) = 1 – P (A’).

6.5.4. Eventos independientes

Son eventos en los que la ocurrencia de uno no tiene nada que ver con la ocurrencia del otro. Algunos ejemplos incluyen el resultado del lanzamiento de una moneda y el de un dado. El resultado del lanzamiento de una moneda no afecta al resultado del lanzamiento de un dado. Dos lanzamientos de una moneda también son eventos independientes.

¿Los resultados de sacar dos cartas de una baraja son eventos independientes? Es decir, ¿el resultado de sacar la primera carta afecta la probabilidad del segundo resultado? Depende de si se reemplaza o no la primera carta antes de sacar la segunda. Sea el primer evento sacar una reina y el segundo evento sacar un as. De acuerdo con el modelo clásico, la probabilidad de sacar una reina en el primer intento es P (Q) = 4/52. La probabilidad de sacar un as en el segundo intento depende de si la primera carta fue reemplazada antes de sacar la segunda.

Si la carta se mantiene fuera de la baraja después del primer intento, entonces la probabilidad de sacar un as es P(A) = 4/51 debido a que 4 de las 51 cartas restantes son ases. Si la carta se regresa a la baraja antes del segundo intento, la probabilidad de sacar un as en el segundo intento es P(A) = 4/52.

Cuando se saca de un conjunto finito, como por ejemplo una baraja de cartas, dos eventos son independientes si y solo si se realiza el reemplazo. Sin embargo, si el primer elemento no se reemplaza antes de sacar el segundo elemento, los dos eventos son dependientes.

Hernández Ayón, H y Casillas Barajas, A 63

Page 75: Estadistica Descriptiva Programa 2010 (Libro)

6.5.4. Eventos dependientes

Son aquellos eventos en los que la ocurrencia de uno depende de la ocurrencia del otro. La probabilidad de que un estudiante repruebe un examen, depende de si se presenta o no. La probabilidad de sacar un as negro de entre una baraja de 52 cartas es 2/52, ya que de los cuatro ases existentes, dos son rojos y dos negros.

6.6. Reglas de probabilidad

Existen reglas que permiten calcular probabilidades de eventos más complejos, los cuales se refieren a operaciones básicas de la multiplicación, la adición y la división. Estas reglas de probabilidad dependen de la naturaleza de los eventos, sean ellos dependientes o independientes. La siguiente tabla resume el procedimiento de cálculo para cada uno de ellos.

Eventos independientes Eventos dependientesAdición (A, B) P(A B) = P(A) + P(B) P(A B) = P(A) + P(B) - P(A

B).Multiplicación (A, B) P(A B) = P(A) * P(B) P(A B) = P(A|B) * P(B)Condicional (A, B) P(A|B) = P(A) P(A|B) = P(A B)/P(B)

Cuando existen eventos mutuamente excluyentes, por ejemplo aprobar y reprobar, (eventos independientes) donde no existen características comunes entre ellos, la adición reconoce su independencia al considerar la suma entre el valor de la probabilidad de cada evento (en este caso A y B). En contraste, en eventos dependientes o que no son mutuamente excluyentes, la regla plantea que se debe restar a dicha suma, la intersección o parte común. La razón por la cual se debe restar la probabilidad conjunta cuando los eventos no son mutuamente excluyentes es para evitar el doble conteo.

La probabilidad de sacar un as o una de las trece cartas de corazones negros es P(A) + P(C) – P(A C). Los eventos A y C no son mutuamente excluyentes debido a que ambos ocurren si se sacara el as de corazones negros. Por tanto, P(A) + P(C) – P(A C) = (4/52) + (13/52) – (1/52) = 16/52. Cuando se cuentan los cuatro ases, se considera el de corazones negros. Cuando se cuentan las trece cartas de corazones negros se incluye el as de corazones negros otra vez. Debido a que solo hay un as de corazones negros, es necesario restarlo una vez.

Hernández Ayón, H y Casillas Barajas, A 64

Page 76: Estadistica Descriptiva Programa 2010 (Libro)

En la multiplicación mientras tanto, las probabilidades se multiplican para el caso de eventos independientes. Por ejemplo la probabilidad de los dos eventos independientes: “sacar un tres” con un dado y “una cara” con una moneda, aunque no es común que esto suceda, se obtiene como P(3 C) = P(3) x P(C) = (1/6) x (1/2) = 1/12. No obstante, en eventos dependientes, esta regla depende de la probabilidad condicional, la cual puede obtenerse previamente.

El propietario de un hotel ha modernizado sus instalaciones para atraer a los clientes. Observa que el 20% de los autos que pasan por allí, se detienen para alquilar un cuarto. ¿Cuál es la probabilidad de que los próximos dos carros se detengan? Asumiendo que estos dos eventos son independientes, P(S1 S2) = P(S1) x P(S2) = (0.20) x (0.20) = 0.04. La probabilidad de que los dos próximos carros alquilen un cuarto es de 4%. ¿Cuál es la probabilidad de que el primer auto pare y el segundo no lo haga? P(S1 S2) = P(S1) x P(S2) = (0.20) x (0.80) = 0.16.

Si los eventos son dependientes, entonces por definición, se debe considerar el primer evento al determinar la probabilidad del segundo. Es decir, la probabilidad del evento B depende de la condición de que A ya haya ocurrido, y su cálculo requiere del principio de probabilidad condicional.

Por otra parte, con frecuencia se desea determinar la probabilidad de algún evento, dado que antes otro evento ya haya ocurrido. A esta probabilidad se le llama probabilidad condicional y se denota como P (AB) y se lee como “probabilidad de A dado B”, es decir, la probabilidad de que A ocurra bajo la condición de que B también ocurra.

La probabilidad condicional se utiliza comúnmente en el planteamiento de un negocio para revisar la probabilidad de algún evento dado sobre el cual se ha recabado información adicional. Por ejemplo, se puede estimar la probabilidad de que se haga una venta (V) a un cliente antiguo P(V) = 0.80. Sin embargo, si se sabe posteriormente que este cliente ahora está comprando a alguien de la competencia, se puede revisar la probabilidad de que se haga una venta dado que el competidor (C) ha presentado una oferta P(VC) = 0.30.

Para ilustrar con un ejemplo, se sabe que la probabilidad de sacar un rey P(K) de una baraja de 52 cartas es 4/52 debido a que hay cuatro reyes en una baraja. Sin embargo, es de suponer que se desea saber la probabilidad de que la carta sacada fuese un Rey dada la información adicional de que es una figura (F). Es decir, P(KF). Ya que 4 de las 12 figuras de una baraja son reyes, P(KF) = 4/12, y no 4/52.

Hernández Ayón, H y Casillas Barajas, A 65

Page 77: Estadistica Descriptiva Programa 2010 (Libro)

6.7. Tablas de contingencias y de probabilidades

Las tablas de contingencia son útiles para calcular la probabilidad de eventos. Por ejemplo; sean 500 empleados que laboran en la empresa Megacable de Nayarit dedicada a la instalación de redes para televisión por cable, de los que 170 están clasificados como personal Administrativo (Ad), 290 como trabajadores de Línea (Li) y 40 empleados Auxiliares (Au). Los eventos colectivamente exhaustivos son Ad, Li y Au. Si un empleado se selecciona al azar, entonces,

P (Ad) = 170/500 = 0.34P (Li) = 290/500 = 0.58P (Au) = 40/500 = 0.08

Debido a que ocurre la certeza de que el empleado seleccionado provenga de una de estas tres categorías colectivamente exhaustivas, P (A o L o P) = 0.34 + 0.58 + 0.08 = 1.00

Los datos completos del personal de la empresa Megacable se ilustran en la siguiente tabla.

Clasificación de los empleadosGénero Personal Línea Auxiliar Total

Hombres (M)Mujeres (F)

Total

12050170

150140290

301040

300200500

La tabla muestra que de los 170 miembros del personal administrativo, 120 son hombres y 50 son mujeres. La tabla de probabilidad se construye dividiendo cada una de las entradas de la tabla anterior entre los 500 trabajadores totales.

Clasificación de los empleadosGénero Personal (A) Línea (L) Auxiliar (P) Total

Hombres (M)Mujeres (F)

Total

120/500 = 0.24

50/500 = 0.10

170/500 = 0.34

150/500 = 0.30

140/500 = 0.28

290/500 = 0.58

30/500 = 0.06

10/500 = 0.02

40/500 = 0.08

300/500 = 0.60

200/500 = 0.40

500/500 = 1.00

Los valores en las márgenes de la tabla (valores totales) se llaman probabilidades marginales. El total de filas o de columnas son las Hernández Ayón, H y Casillas Barajas, A 66

Page 78: Estadistica Descriptiva Programa 2010 (Libro)

probabilidades de eventos independientes, por ejemplo la probabilidad de que el personal sea hombre (0.60) es independiente de que sea mujer (0.40). Igualmente, la probabilidad del personal de línea es independiente del personal administrativo. En tanto los valores del centro de la tabla (ínter septos), corresponden a probabilidades de eventos conjuntos o dependientes.

Por ejemplo, la probabilidad de seleccionar un trabajador de línea de manera aleatoria es P (L) = 0.58 y la probabilidad de seleccionar un hombre es P(M) = 0.60. Asimismo, la probabilidad de seleccionar un elemento del personal administrativo hombre, es decir, un trabajador que sea parte del personal administrativo y que sea hombre, es P(MA)= 0.24. Una probabilidad marginal se encuentra como la suma de las probabilidades correspondientes. Por tanto: la probabilidad de que el personal seleccionado sea mujer es, P(M) = P(M A)+ P(M L)+ P(M P) = 0.24 + 0.30 + 0.06 = 0.60.

Aunque el uso de una tabla puede simplificar los cálculos de probabilidad, existen ejemplos en los cuales es difícil la creación de una tabla, por tanto se requiere el uso de fórmulas.

Ejemplo. El gerente de créditos de una tienda departamental recolecta datos sobre 100 de sus clientes. De los 60 hombres, 40 tienen tarjeta de crédito (C). De las 40 mujeres, 30 tienen tarjeta de crédito (C). Diez de los hombres tienen saldos vencidos (B), mientras que 15 de las mujeres tienen saldos vencidos (B). El gerente desea determinar la probabilidad de que un cliente seleccionado al azar sea:

a. Una mujer con tarjeta de crédito.b. Una mujer con un saldo.c. Un hombre sin un saldo.d. Un hombre con un saldo.

Solución:Crear una tabla de probabilidad es difícil ya que existen tres factores: género, tarjeta de crédito y saldo en la tarjeta, por lo cual es recomendable el uso de la fórmula.

a. P(F C) = P(F) x P(CF). Claramente, la probabilidad de que sea mujer P(F) = 40/100 = 0.40. Además, de las 40 mujeres 30 tienen tarjeta de crédito. Por tanto, dado que el cliente es una mujer, la probabilidad de que tenga una tarjeta de crédito es P(CF) = 30/40. Entonces, P(F C) = P(F) x P(CF) = (40/100) x (30/40) = 0.30.

b. P(F B) = P(F) x P(BF). De las 40 mujeres, 15 tienen saldos. Dado que el cliente es una mujer, la probabilidad de que tenga saldo es de

Hernández Ayón, H y Casillas Barajas, A 67

Page 79: Estadistica Descriptiva Programa 2010 (Libro)

15/40. De manera que P(F B) = P(F) x P(BF) = (40/100) x (15/40) = 0.15

c. P(M D) = P(M) x P(B’M). Debido a que 50 de los 60 hombres no tienen saldos, P(B’M) = 50/60. Entonces, P(M D) = P(M) x P(B’M) = (60/100) x (50/60) = 0.50

d. P(M B) = P(M) x P(BM). De los 60 hombres, 10 tienen saldos. P(BM) = 10/60. Por lo que P(M B) = P(M) x P(BM) = (60/100) x (10/60) = 0.10

En el ejemplo de TV/CABLE DE NAYARIT, la probabilidad de que un empleado sea un trabajador hombre o un trabajador administrativo es P(M) + P(A) – P(M A) = 0.60 + 0.34 – 0.24 = 0.70. De nuevo, se debe restar la probabilidad conjunta P(M A), debido a que se incluyeron trabajadores administrativos al contarse todos los hombres y se incluyeron hombres al contar todos los trabajadores administrativos. Es decir, los trabajadores administrativos hombres se contaron dos veces.

EJERCICIOS

1. Dada una baraja de 52 cartas, el conjunto A consta de los 13 corazones negros y el conjunto B son los cuatro ases. Identifique cuáles cartas están incluidas en (AB) y (A B).

2. Haga un diagrama de Venn para ilustrar el ejercicio anterior.

3. Algunos de los trabajadores, hombres y mujeres de una planta gran industria tienen educación secundaria. El conjunto A consta de los trabajadores hombres, el conjunto B de las trabajadoras mujeres, el conjunto C es el conjunto con educación secundaria, y el conjunto D es el conjunto de los trabajadores que no tienen educación secundaria. Identifique y explique (A C), (B D) y (A C).

4. Para el problema anterior, ¿cuál es la diferencia entre (B D) y (B D)?

5. Dadas las condiciones del ejercicio 9, identifique los eventos que son:a) Mutuamente excluyentesb) Colectivamente exhaustivos con respecto al géneroc) Si 300 de los 1000 trabajadores son hombres, ¿cuál es la probabilidad

de que un trabajador sea mujer P(F)? ¿Qué papel jugó la regla de la complementariedad en su respuesta?

6. Describa tres ejemplos relacionados con los negocios en los cuales los eventos sean independientes.

7. Se recolectó información en 500 Licenciados en Administración, que son egresados de la UAN y que actualmente estén llevando algún curso de postgrado, o que estén laborando en la industria privada o en alguna

Hernández Ayón, H y Casillas Barajas, A 68

Page 80: Estadistica Descriptiva Programa 2010 (Libro)

dependencia oficial, respecto a sus opiniones sobre si la economía del país podría ser estable, podría expandirse o podría entrar en un periodo de contracción en el futuro próximo. Sin embargo, parte de la información se perdió, resultando la siguiente tabla de contingencia parcial. Con base en los datos restantes, cree una tabla de probabilidad.

Opinión respecto a la economía del paísOcupación del entrevistado

Estable (E)

Expansión (X)

Contracción (C)

Total

Estudiante (P)Industria privada (I)Dependencia oficial (G)Total

125(50)25200

(100)3540(175)

10025(0)125

(325)11065(500)

De la tabla de probabilidades halle:a) P (P)b) P (G)c) P (P E)d) P (P X)e) P (G C)f) Determine la probabilidad marginal de P.g) Determine la probabilidad marginal de I.

8. La revista Forbes (febrero de 1977) clasificó las 120 ciudades de Estados Unidos de acuerdo con la calidad de vida, con base en parte del porcentaje de empleados que tenían título universitario. Los resultados se ven en la siguiente tabla de contingencia parcial en donde A es menos del 15% con título universitario, B es del 15 al 20% con título universitario y C es más del 20% con título universitario. Realice una tabla de probabilidad y responda las preguntas que se presentan en la siguiente tabla:

Calidad de vidaPorcentajes con título

universitario Pobre (P)

Bueno (G)

Excelente (E) Total

ABC

Total

10

20

20

1060

2040

20

a) ¿P (A)?b) ¿P (P B)?c) ¿P (E C)?d) ¿P (A G)?

9. Se les pidió a cien estudiantes universitarios que dijeran qué tipo de programas de TV preferían. La tabla muestra las cien respuestas clasificadas a la vez según el nivel de estudios de los universitarios y según el tipo de programa preferido.

Tipo de programa

Nivel de estudiosBachillerato (A) Licenciatura

(B)Posgrado

(C) Total

Hernández Ayón, H y Casillas Barajas, A 69

Page 81: Estadistica Descriptiva Programa 2010 (Libro)

Deportes (S) 15 8 7 30Noticias (T) 3 7 20 30Drama (V) 5 5 15 25

Comedia (W) 10 3 2 15Total 33 23 44 100

Calcule para conjunto dependiente e independiente:

a) P(S) b) P(T C) c) P(ABC)

d) P(todo estudiante que ve noticias)

e) P(U f) P(T|C) g) P(W B) h) P(estudiante con posgrado)

10. De la tabla de probabilidades que se creó para resolver el Ejercicio 12,

a) Calcule P(EP).b) Si eres licenciado en Administración que está estudiando un posgrado

¿es más probable que pronostique una economía estable en el país que si trabaja con el gobierno?

c) Dado que usted trabaja en la industria privada ¿es más probable que usted pronostique una contracción en la economía del país que un estudiante de posgrado?

d) Si usted trabaja para el gobierno, ¿cuál de los tres pronósticos es más probable que haga?

11. La mayoría de las estaciones de servicio venden tres tipos de gasolina: corriente, súper y premium. Con frecuencia, alguna de cada tipo está enriquecida con etanol. La tabla de contingencia que se muestra a continuación ilustra la tabla de porcentajes de cliente que prefieren cada tipo.

Corriente (R)

Súper (S)

Premium (P)

Total

EtanolSin etanolTotal

0.050.150.20

0.100.400.50

0.050.250.30

0.200.801.00

Determine la probabilidad de que el siguiente cliente prefiera:

a) Corriente o etanol. P (R E)b) Super o sin etanol. P (S E’).c) Premium o etanol. P (P E).d) Premium o sin etanol. P (P E’)

Solución:

a) P (R E) = P(R) + P(E) - P(R E) = 0.20 + 0.20 – 0.05 = 0.35b) P (S E’) = P(S) + P(E’) - P(S E’) = 0.50 + 0.80 – 0.40 = 0.90c) P (P E) = P(P) + P(E) - P(P E) = 0.30 + 0.20 – 0.05 = 0.45d) P (P E’) = P(P) + P(E’) - P(P E’) = 0.30 + 0.80 – 0.25 = 0.85

Hernández Ayón, H y Casillas Barajas, A 70

Page 82: Estadistica Descriptiva Programa 2010 (Libro)

12. De los 10 chips de un computador, 4 están defectuosos. ¿Cuál es la probabilidad de seleccionar 3 sin que haya reemplazo, de los cuales sólo uno sea defectuoso?

¿Cómo puede ocurrir el evento? Existen tres formas en las cuales sólo uno puede ser defectuoso: (1) sólo el primero es defectuoso; (2) sólo el segundo es defectuoso, y (3) sólo el último es defectuoso. De acuerdo con la regla de la multiplicación.

La primera forma es:La segunda forma es:La última forma es:

Con: D, defectuoso. D’, no defectuoso.

P(D1 D2‘ D3‘) = 4/10 x 6/9 x 5/8= 120/720P(D1‘ D2 D3‘) = 6/10 x 4/9 x 5/8= 120/720P(D1‘ D2‘ D3) = 6/10 x 5/9 x 4/8= 120/720

Debido a que el evento “sólo uno es defectuoso” puede suceder de la primera forma, la segunda forma o la tercera forma, se debe adicionar las tres probabilidades de acuerdo con la regla de la adición. Por lo que: P (sólo uno es defectuoso) = 120/720 + 120/720 + 120/720 = 0.50.

13. El mercadólogo de un gimnasio desea construir un perfil de miembros para desarrollar una campaña publicitaria que atraiga a clientes potenciales típicos de quienes actualmente prefieren este gimnasio. El 30% de los miembros actuales son mujeres, el 80% de ellas es menor de 30 años. El 60% de los hombres son menores de 30 años. ¿Cuál es la probabilidad de que un miembro seleccionado de manera aleatoria sea:a) ¿Una mujer menor de 30 años?b) ¿Una mujer mayor de 30 años?c) ¿Un hombre mayor de 30 años o una mujer menor de 30?d) ¿Mayor de 30 años?e) ¿Un hombre o una mujer mayor de 30 años?

14. Dentro de una localidad pequeña, de un total de 1,000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres, 500 tienen trabajo. Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea:

a) ¿Un bachiller empleado?b) ¿Empleado pero no bachiller?c) ¿Desempleado o un bachiller?d) ¿Desempleado o no bachiller?

15. Una tienda de deportes vende dos tipos de zapatos para correr, que llamaremos modelo 1 y modelo 2. Las probabilidades de que un cliente dado compre zapatos del modelo 1 es de P(M1) = 0.40 y la probabilidad de que compre el modelo 2, P(M2) = 0.30. La probabilidad de que compre ambos es P(B) = 0.10. ¿Cuál es la probabilidad de que un cliente compre o M1 o M2?

16. Un corredor de bolsa sabe por experiencias anteriores que la probabilidad de que un cliente compre acciones es del 65%. La probabilidad de que un cliente compre un bono del gobierno si ya tiene acciones es del 35%.

a) ¿Cuál es la probabilidad de que el cliente posea ambos?b) ¿Son los dos eventos B y S independientes? Explique.

Hernández Ayón, H y Casillas Barajas, A 71

Page 83: Estadistica Descriptiva Programa 2010 (Libro)

6.8. Teorema de Bayes

Al inglés Thomas Bayes (1702-1761), un matemático de cierta importancia se le atribuye generalmente el desarrollo de una fórmula para el cálculo de probabilidades conocida como el teorema de Bayes, la cual fue publicada en 1763 después de su muerte. Esta fórmula permite calcular la probabilidad de que algún evento que haya ocurrido (o “efecto) sea el resultado de alguna causa. Esta fórmula se ha empleado bastante en medicina, sobre todo en los campos del diagnóstico por computadora y de la predicción de la permanencia en un hospital.

Se considera también al teorema de Bayes como una de las bases de la moderna teoría de la decisión, que son conocimientos aplicados a la toma de decisiones bajo la incertidumbre. El teorema se puede plantear como sigue:

Si A1, A2, ……………., An, son n eventos mutuamente excluyentes, cuya unión es el conjunto universal, B es un evento arbitrario tal que P(B) > 0 y P(B | Ak) y P(Ak) son conocidos para 1≤ k ≤ n, entonces,

Ejemplo. En un sector de la ciudad, los grupos de ingresos bajos, medios y altos constituyen el 20%, 55% y 25% de la población respectivamente. Se sabe además que el 80% del grupo de bajos ingresos se opone a un proyecto de ley que cursa actualmente en el Congreso. Los porcentajes de los grupos medio y alto son 30% y 10% respectivamente. La información disponible se presenta en la tabla donde se resumen los datos del ejemplo.

Grupo de ingreso

Proporción de la

Proporción del grupo de ingreso opuesto al proyecto de ley

Hernández Ayón, H y Casillas Barajas, A 72

Page 84: Estadistica Descriptiva Programa 2010 (Libro)

PoblaciónBajo 0.20 0.80

Medio 0.55 0.30Alto 0.25 0.10

Se selecciona al azar una persona de esta población y se encuentra que se opone al proyecto de ley. ¿Cuál es la probabilidad de que la persona pertenezca:

a) Al grupo de bajos ingresos?b) Al grupo de ingresos medios?c) Al grupo de altos ingresos?

SoluciónB = Evento de que la persona elegida al azar se opone al proyecto de ley.

A1, A2 y A3 sean los eventos de que la persona seleccionada pertenezca a los grupos de bajos, medios y altos ingresos respectivamente.

Resumen de los cálculos que ilustra la aplicación del Teorema de Bayes.

Evento

Probabilidad a prioriP (A1)

VerosimilitudP(B | A1)

Probabilidad conjuntaP(B A1)

Probabilidad a posteriori

P(A1 |B)A1 0.20 0.80 0.160 0.46A2 0.55 0.30 0.165 0.47A3 0.25 0.10 0.025 0.07

1.00 0.350 1.00

Las probabilidades buscadas son las probabilidades condicionadas de pertenecer a los tres grupos de ingresos dado que el individuo escogido se opone al proyecto de ley. Es decir, se desea calcular P(A1 |B), P(A2 |B) y P(A3 |B).

Se conocen las probabilidades incondicionales de P(A1)=0.20, P(A2)= 0.55 y P(A3) = 0.25. Estas probabilidades se denominan posibilidades a priori puesto que están dadas antes de la selección del individuo que se está analizando.

Las probabilidades condicionales de escoger a un individuo que se oponga a la ley dado que pertenezca a uno de los grupos de ingresos también se conocen. Son: P(B | A1)=0.80, P(B | A2)= 0.30 y P(B | A3) = 0.10. Estas probabilidades se denominan verosimilitudes.

Hernández Ayón, H y Casillas Barajas, A 73

Page 85: Estadistica Descriptiva Programa 2010 (Libro)

Con base a la información anterior, se pueden calcular las siguientes probabilidades conjuntas:

P(B A1) = P(B|A1)P(A1) = (0.80) (0.20) = 0.16P(B A2) = P(B|A2)P(A2) = (0.30) (0.55) = 0.165P(B A3) = P(B|A3)P(A3) = (0.10) (0.25) = 0.025

Con base en estos valores, se emplea el teorema de Bayes para calcular las probabilidades deseadas:

Con base a lo anterior, se puede decir que, dado que el individuo seleccionado se opone al proyecto de ley, la probabilidad de que pertenezca al grupo de bajos ingresos es de 0.46, al grupo de ingresos medios de 0.47 y al grupo de altos ingresos de 0.07.

Debido a que estas probabilidades condicionales se calcularon después de saber que la persona seleccionada se opone al proyecto de ley, se les puede llamar probabilidades a posteriori.

Hernández Ayón, H y Casillas Barajas, A 74

Page 86: Estadistica Descriptiva Programa 2010 (Libro)

EJERCICIOS

1. En el departamento de archivos clínicos de un hospital, tres empleados tienen la tarea de procesar los registros de los pacientes. El primer empleado, C1, procesa el 45% de los registros, el segundo, C2, el 30% y el tercero, C3 el 25%. El primer empleado tiene una tasa de error en su trabajo de 0.03, el segundo de 0.05 y el tercero de 0.02. Se selecciona un registro al azar entre los que se procesaron durante una semana y se encuentra que tiene un error. El bibliotecario de registros médicos desea saber la probabilidad de que el registro haya sido procesado por cada uno de los empleados.

2. En la prisión de las Islas Marías, el 10% de los reclusos estudió hasta tercer grado o menos. El 50% hizo cuarto, quinto o sexto y el 40% más de sexto grado. Por otro lado, el 20% del primer grupo, el 50% del segundo grupo y el 70% del tercero tienen una edad menor de 25 años. Se escoge al azar a un recluso de esa prisión y se halla que tiene menos de 25 años. ¿Cuál es la probabilidad de que ese individuo pertenezca al primer grupo del nivel de estudios? ¿Al segundo? ¿Al tercero?

3. En una clínica de especialistas se ha descubierto que, durante un periodo de varios años, el 20% de los pacientes que llegaron a la clínica habían tenido cierta enfermedad D1, el 30% una segunda enfermedad D2 y el 50% una tercera enfermedad D3. El investigador ha descubierto también que un conjunto de síntomas bien definidos y de fácil reconocimiento, S1, se encontraba en el 25% de los pacientes que tenían la enfermedad D1, en el 60% de los pacientes que tenían la enfermedad D2 y el 80% de los que tenían la enfermedad D3. El investigador quiere utilizar esta información para hacer rápidamente el diagnóstico de los pacientes recién llegados. Si se supone que ha sido admitido un paciente que presenta el conjunto de síntomas S. Cuál es la probabilidad de que esta persona tenga la enfermedad

a) ¿ D1?b) ¿ D2?c) ¿ D3?

4. En un grupo de personas adultas, el 10% presenta educación primaria, el 70 tiene educación secundaria y el 20% educación universitaria. El 5% de los que presentan educación primaria pertenecen al grupo de ingresos “altos”, mientras que el 15% de los que tienen educación secundaria y el 75% de los que tienen educación universitaria pertenecen a este mismo grupo. Si dentro de esta población se selecciona un individuo al azar y se encuentra que está en el grupo de ingresos altos, encontrar la probabilidad de que este individuo sólo presente:

a) Educación primaria, b) Educación secundaria, yc) Educación universitaria.

5. En una gran empresa, un médico ha detectado que el 20% de los casos de emergencia que examina provienen del departamento A, el 10% del departamento B, el 45% del departamento C y el 25% del departamento D. También encontró que el 10% de los casos de emergencia del departamento A, el 5% del departamento B, el 15% del C y el 12% del departamento D son accidentes debido a aparente descuido. Se presenta en la clínica un caso de accidente ocasionado por descuido. ¿Qué probabilidad hay que ese paciente pertenezca al departamento ¿A? ¿B? ¿C? ¿D?

Hernández Ayón, H y Casillas Barajas, A 75

Page 87: Estadistica Descriptiva Programa 2010 (Libro)

6. Un médico ha descubierto en un hospital para enfermedades crónicas que el 15% de los pacientes permanecen en el hospital menos de 30 días, mientras que el 85% permanece 30 días o más. El estudioso también ha descubierto que el 20% de los pacientes que se quedan poco tiempo y el 60% de los que permanecen largo tiempo presentan cierto grupo de características. Si se admite en el hospital a un paciente que presenta dichas características, Cuál es la probabilidad de que ese individuo vaya a permanecer en el hospital:

a) ¿Menos de 30 días?b) ¿30 días o más?

6.9 Técnicas de Conteo

Muchas decisiones comerciales requieren que se cuente el número de subconjuntos que se pueden obtener de un conjunto. De las ventas de una línea que consta de 10 productos, ¿cuántos subconjuntos de 3 productos se pueden ofrecer a los clientes? Siete agentes de ventas están en un concurso para ver quién gana un viaje gratis a Cancún, ¿cuántas órdenes diferentes hay? ¿Cuántos números telefónicos distintos pueden asignarse a una oficina grande dados los dígitos 0-9? Muchos otros ejemplos abundan. Se analizarán cinco técnicas de conteo utilizadas para responder estas preguntas.

Regla de conteo 1. Si cualquiera de k eventos mutuamente excluyentes y colectivamente exhaustivos pueden ocurrir en cada una de las n pruebas, el número posible de resultados está dado por kn.

Ejemplo. Si se lanza una moneda 10 veces, el número posible de resultados es de 1024. En este caso, k es el número de eventos, es decir, 2 (Sello o Águila), mientras el número de pruebas n = 10, y 210 = 1024, donde los resultado posibles pueden ser (SSSSSSSSSS), (SSSSSSSSSA), (SSSSSSSSAS), sucesivamente.

Regla de conteo 2. Si existen k1 eventos en la primera prueba, k2

eventos en la segunda prueba y kn eventos en la prueba n, el número de resultados posibles está dado por (k1)(k2)(k3) … (kn).

Ejemplo. Se desean diseñar placas de circulación para vehículos con dos dígitos numéricos y tres letras. Considerar 10 números (del 0 al 9) y 20 letras del alfabeto.

La solución para tal diseño está dada por la regla 2, donde k1 y k2

corresponden a los dos dígitos numéricos, y k3, k4 y k5 serían las letras complementarias del diseño. Por tanto, (10)(10)(20)(20)(20) = 800,000 placas diferentes, donde los resultados pudieran ser (01 AAA), (02 AAA), (03 AAB), etcétera.

Hernández Ayón, H y Casillas Barajas, A 76

Page 88: Estadistica Descriptiva Programa 2010 (Libro)

Regla de conteo 3. El número de formas en que se pueden ordenar todos los n objetos está dado por n! = n(n-1) … (1), n! se lee como n factorial.

Ejemplo, el número de formas en que se pueden ordenar 5 objetos es igual a n = 5, donde 5! = (5)(4)(3)(2)(1) = 120.

Regla de conteo 4. Permutaciones. El número de formas de ordenar r objetos seleccionados de entre n objetos, está dado por nPr = n!/(n-r)!. Esta regla prevé que en los objetos seleccionados es importante el orden en que se haga el arreglo.

Ejemplo. Se requiere seleccionar tres números telefónicos (r) escogidos de entre 10 estados de la República (n), donde el orden es importante para el agraciado ganador, ya que se trata de tres premios diferentes. En este caso nPr = 10!/(10 – 3)! = 720 formas diferentes de hacer tal selección de ganadores.

Regla de conteo 5. Combinaciones. El número de formas de ordenar r objetos seleccionados de entre n objetos, donde no se toma en cuenta el orden, está dado por nCr = n!/(r!)(n-r)!.

Ejemplo. Si un cliente desea escoger 5 números al azar de entre un total de 25, donde no importa el orden de aparición, es, nCr = 25!/(5!)(25-5)! = 53,130 formas diferentes de escoger 5 de 25, por lo que si el cliente quisiera asegurar el premio del concurso, deberá llenar y pagar 53,130 formas distintas de cinco números, escogidos del 1 al 25.

EJERCICIOS

1. De los 15 miembros del comité directivo de una gran empresa ¿Cuántos comités de 5 miembros pueden seleccionarse si el orden no importa? (todos son elegibles para cualquier cargo).

2. De los 10 ejecutivos, 3 van a ser seleccionados para que funjan como Presidente, Secretario y Tesorero ¿cuántas selecciones distintas son posibles?

Hernández Ayón, H y Casillas Barajas, A 77

Page 89: Estadistica Descriptiva Programa 2010 (Libro)

3. Sus dos compañeros de cuarto están enfermos y a usted lo envían a comprar comida para cada uno de ellos. Si usted debe escoger entre cinco selecciones ¿de cuántas formas puede cumplir con su encargo? (Defina previamente si el orden hace la diferencia.

4. Como responsable del Departamento de Ingeniería de una fábrica de equipos electrónicos debe determinar ¿cuántos reproductores de CD puede ensamblar de tal forma que tengan un sistema de parlantes, un tocadiscos y un mecanismo de sintonización? Si usted puede escoger entre 3 sistemas distintos de parlantes, 4 de tocadiscos y 2 de sintonización, ¿de cuántas formas puede ensamblar los reproductores?

5. De los 12 empleados que laboran en una Agencia de Viajes, 7 han tenido capacitación especial. Si 5 empleados van a ser enviados a Europa, ¿cuál es la probabilidad de que 3 estén dentro de los que han tenido capacitación especial?

6. Una empresa editorial tiene 75 títulos distintos de libros, clasificados por tipo y costo de la siguiente manera:

CostoTipo $10

0$15

0$20

0Ficción

Biografías

Histórico

10124

81017

392

Halle la probabilidad de que un libro seleccionado aleatoriamente sea:

a) Ficción o cueste $100.b) Histórico y cueste $200.c) Histórico y cueste o $100 o $150.d) Ficción y cueste menos de $200.e) Biográfico o cueste $150.f) Biográfico o cueste más de $100.

7. El departamento administrativo de una Universidad tiene acceso a tres máquinas de fax. La probabilidad de que cada una esté fuera de servicio es 20/100, 25/100 y 30/100, respectivamente. Asumiendo independencia entre ellas, encuentre la probabilidad de que:

a) La primera y la segunda estén fuera de servicio.b) La primera y la tercera estén fuera de servicio.c) Todas estén fuera de servicio.d) Ninguna esté fuera de servicio.e) Una esté fuera de servicio.f) Dos estén fuera de servicio.g) Dos o más estén fuera de servicio.

8. Un corredor de bolsa compra tres acciones diferentes. La probabilidad de que la primera aumente su valor es 1/3, la probabilidad de que la segunda aumente es 3/4 y la probabilidad de que la tercera aumente su valor es 1/10. Determine la probabilidad de que:

Hernández Ayón, H y Casillas Barajas, A 78

Page 90: Estadistica Descriptiva Programa 2010 (Libro)

a) Todas aumenten su valor.b) Ninguna aumente su valor.c) Una aumente su valor.d) Dos aumenten su valor.e) Por lo menos dos aumenten su valor.f) Por lo menos una aumente su valor.

9. Una empresa de construcción descubrió que sólo el 20% de todos los trabajos se terminaban a tiempo, mientras que el 30% enfrentaba problemas de sobre costos. Además, los sobrecostos se presentaban el 75% de las veces en las que se terminaba el trabajo a tiempo. El propietario de la empresa desea conocer la probabilidad de que un trabajo:

a) No tenga sobrecostos y se realice a tiempo.b) No tenga sobrecostos o se realice a tiempo.

10. Del problema anterior, ¿Cómo se puede probar que los sobrecostos y la probabilidad de que un trabajo se haga a tiempo no son eventos mutuamente excluyentes?

11. La revista Fortune descubrió que el 10% de los trabajadores en cargos ejecutivos de alto nivel eran mujeres y que el 3% de ellas tenían estudios de Maestría en Administración de Negocios. El consejo directivo de una empresa desea seleccionar una de las mujeres ejecutivas aleatoriamente. ¿Qué probabilidad hay de que seleccionen a una mujer con Maestría en Administración de Negocios?

12. Diez unidades de producción se seleccionan de una línea de producción. Tres de estas 10 son defectuosas. Si se deben sacar 5 de las 10 ¿cuál es la probabilidad de que 2 sean defectuosas?

13. Burger King’s ofrece hamburguesas con una selección de 5 condimentos diferentes: mostaza, pepinillos, salsa de tomate, cebolla y tomate. ¿Cuántas hamburguesas diferentes puede comprar?

14. En una cierta ciudad, las placas de los autos constan de 3 letras seguidas de 3 números. ¿Cuántas placas distintas pueden hacerse?

15. El propietario de un lote de autos ofrece a sus clientes automóviles con 8 opciones diferentes de color, 4 paquetes de interior, y 3 diseños diferentes de techo corredizo. ¿Entre cuántos automóviles pueden escoger los clientes?

16. Estudios realizados por la Secretaría de Educación Pública demuestran que el 30% de los profesores dejan la profesión después de 10 años. Además, entre quienes la abandonan, el 60% tienen un título avanzado, mientras que entre los que no dejan la profesión el 20% tienen un título avanzado. Un profesor acaba de obtener un título avanzado. ¿Cuál es la probabilidad de que deje a los estudiantes y consiga un trabajo distinto?

17. Una empresa manufacturera tiene plantas en dos grandes ciudades del país: Guadalajara y Aguascalientes. La planta de Guadalajara produce el 40% de la producción total, con un 10% en la tasa de defectos. La planta de Aguascalientes tiene una tasa de defectos del 20%. Si sólo se encuentra que una unidad es defectuosa, ¿es más probable que provenga de Guadalajara o de Aguascalientes?

Hernández Ayón, H y Casillas Barajas, A 79

Page 91: Estadistica Descriptiva Programa 2010 (Libro)

18. El Presidente debe seleccionar 5 miembros de una lista de 12 Senadores, de los cuales 7 le apoyan y 5 son de oposición. Si él selecciona al azar, ¿cuál es la probabilidad de que la mayoría del comité apoye al presidente?

19. Una empresa telefónica vende aparatos ofreciendo 5 estilos, 4 colores y 7 opciones de servicio. ¿Cuántos teléfonos diferentes puede ofrecer la empresa a sus clientes?

20. Estudiantes de un grupo de la carrera de Contaduría de la UAN, deben entregar un Ensayo, un Resumen, una Monografía y un Diagnóstico en un solo documento. ¿De cuantas formas pueden realizar y presentar dicha obra? Describa las diferentes formas.

21. En una población de quinientos mil habitantes existe un parque vehicular de120 mil. El departamento de tránsito está interesado en saber con cuantos dígitos y letras puede cubrir tal demanda si solo utiliza los números nones: 1, 3, 5, 7 y 9, y las letras P, A, B, C, T, R, S, N, H y K.

7. DISTRIBUCIONES DE PROBABILIDAD

Las distribuciones de probabilidad son modelos matemáticos que utilizan la probabilidad como elemento fundamental en el análisis de variables aleatorias. Una variable aleatoria es aquella cuyo valor es el resultado de un evento aleatorio.

Anteriormente se analizó el concepto de probabilidad, donde el objetivo era determinar la probabilidad de un evento; en este tema se analizan las probabilidades como un conjunto de resultados posibles a partir de un experimento. (1) Lanzar una moneda tres veces y anotar el número de caras que se obtienen. Los posibles resultados son 0 caras, 1 cara, 2 caras o 3 caras. La variable aleatoria es el número de caras que se obtienen, y los posibles resultados son los valores de la variable aleatoria. Monitorear un contenedor que contiene envases con Hernández Ayón, H y Casillas Barajas, A 80

Page 92: Estadistica Descriptiva Programa 2010 (Libro)

agua con pesos que oscilaban aleatoriamente entre 10 a 25 libras (aproximadamente de 4.5 a 11.3 kg), los pesos reales de los contenedores, en libras, son los valores de la variable aleatoria “peso”.

Variable aleatoria discreta

Las variables aleatorias pueden ser discretas o continuas. Una variable aleatoria discreta puede asumir sólo ciertos valores, con frecuencia números enteros y resulta principalmente del conteo. El número de caras en el experimento del lanzamiento de una moneda es un ejemplo de una variable aleatoria discreta. Los valores de la variable aleatoria se restringen sólo a ciertos valores: 0, 1, 2 y 3. El lanzamiento de un dado, el número de camiones que llegan por hora a un cierto crucero de la ciudad y el número de clientes que están en fila para comprar determinado producto, son ejemplos de variables aleatorias discretas.

Variable aleatoria continua

La variable aleatoria continua resulta principalmente de la medición y puede tomar cualquier valor, al menos dentro de un rango dado. Los pesos del agua mineral es un ejemplo, debido a que los contenedores pueden tomar cualquier valor entre 10 y 25 libras. Otros ejemplos de variables continuas incluyen la estatura de los clientes en una tienda de ropa, los ingresos de los empleados en un centro comercial y el tiempo transcurrido entre la llegada de cada camión a un determinado lugar. En cada caso, la variable aleatoria puede medirse con cualquier valor, incluyendo fracciones de la unidad. Aunque las unidades monetarias no pueden dividirse en un número continuo o infinito de subdivisiones (el peso puede dividirse en 100 veces), comúnmente se tratan como distribuciones continuas de probabilidad.

7.1. Distribución de probabilidad

Una distribución de probabilidad es un despliegue de todos los posibles resultados de un experimento junto con la probabilidad de cada resultado. La probabilidad de lanzar una moneda tres veces y de obtener (1) ninguna cara es 1/8, (2) 1 cara es 3/8, (3) 2 caras es 3/8 y (4) 3 caras es 1/8. Esta distribución de probabilidad se presenta en la tabla siguiente la cual muestra todos los resultados posibles y sus probabilidades. La suma de estas probabilidades es 1. La misma información también se muestra gráficamente.

Tabla 7.1Resultado

(caras)Probabilida

dDistribución discreta 0 1/8

Hernández Ayón, H y Casillas Barajas, A 81

Page 93: Estadistica Descriptiva Programa 2010 (Libro)

de probabilidad para el número de caras.

123

3/83/81/81

Gráfica 7.1 4/8 - 3/8 -

2/8 -

1/8 -

xi

0 1 2 3

Distribución de probabilidad

Es un listado de todos los posibles resultados de algún experimento y de la probabilidad relacionada con cada resultado.

La probabilidad de que la variable aleatoria X tome algún valor específico, xi, se escribe P (X = xi). Por tanto, la probabilidad de que los tres lanzamientos de una moneda resulten en dos caras es P (X= 2) = 3/8. Es importante señalar que: 0 P (X = xi) 1 y la P (X = xi) =1.

7.1.1 Media y varianza de las distribuciones discretas.

Así como se calculó la media para un conjunto de datos, también se puede determinar la media de una distribución de probabilidad. La media de una distribución de probabilidad se denomina valor esperado E (x), y se halla multiplicando cada resultado posible por su probabilidad y sumando los resultados, tal como se muestra en la fórmula:

Media o valor esperado de una distribución de probabilidad

discreta.

= E (x) = [(xi) P (xi)]

Hernández Ayón, H y Casillas Barajas, A 82

Page 94: Estadistica Descriptiva Programa 2010 (Libro)

Donde xi son los resultados individuales.

La distribución de probabilidad para el experimento de lanzar un dado se muestra en las primeras dos columnas de la Tabla 7.2. La columna (3) ilustra el cálculo del valor esperado para el experimento. Cada resultado se multiplica por su respectiva probabilidad y se suman, produciendo = E (X) = 3.5. Esto sugiere que si se lanza un dado ¿se puede obtener 3.5?, difícilmente. Significa que si se promedian los resultados de los lanzamientos del dado (teóricamente, un número infinito) se obtendrá 3.5.

Valor esperado

El valor esperado de una variable aleatoria discreta es la media ponderada de todos los posibles resultados, donde los pesos son las probabilidades respectivas de tales resultados.

La varianza de una distribución de probabilidad es conceptualmente la misma que la varianza de un conjunto de datos. Es el promedio de las desviaciones al cuadrado con respecto a la media. La varianza puede escribirse como:

Varianza de una distribución de probabilidad

2 = [(xi -)2 P (xi)]

Tabla 7.2

Distribución discreta de

probabilidad para el

lanzamiento de un dado.

(1)Solución xi

(2)P (xi)

(3)(xi) P (xi)

(4)(xi - )2 P (xi)

123456

1/61/61/61/61/61/6

1/62/63/64/65/66/6

(1-3.5)2 1/6 = 1.042(2-3.5)2 1/6 = 0.375(3-3.5)2 1/6 = 0.042(4-3.5)2 1/6 = 0.042(5-3.5)2 1/6 = 0.375(6-3.5)2 1/6 = 1.042

1.0 = E (x) = 3.5 2 = 2.92

La fórmula mide la diferencia entre cada uno de los resultados y su media. Estas diferencias se elevan al cuadrado y se multiplican por sus respectivas probabilidades. Luego se suman los resultados. La columna (4) de la tabla revela 2 = 2.92.

La desviación estándar es = 2 = 2.92 = 1.71. La varianza y la desviación estándar tienen la misma interpretación; miden la dispersión de los resultados alrededor de su media. La varianza se expresa en unidades al cuadrado, pero la desviación estándar se expresa en las

Hernández Ayón, H y Casillas Barajas, A 83

Page 95: Estadistica Descriptiva Programa 2010 (Libro)

mismas unidades que la variable aleatoria y consecuentemente tiene una interpretación más racional.

Ejemplo. El número de casas que una inmobiliaria vendió mensualmente varió de 5 a 20 junto con la frecuencia de cada nivel de ventas que aparece en las dos primeras columnas de la tabla que se muestra a continuación.

(1) (2) (3) (4) (5)Número de

mesesCasas

(x)P (xi) (xi) P (xi) (xi - )2 P (xi)

374532

5810121720

3/24 = 0.1257/24 = 0.2924/24 = 0.1675/24 = 0.2083/24 = 0.1252/24 = 0.083

0.6252.3361.6702.4962.1251.660

(5 – 10.912)2 (0.125) = 4.369(8 – 10.912)2 (0.292) = 2.470(10 – 10.912)2 (0.167) = 0.139(12 – 10.912)2 (0.208) = 0.246(17 – 10.912)2 (0.125) = 4.633(20 – 10.912)2 (0.083) = 6.855

24 72 1.00 10.912 = 18.718 = 2

La inmobiliaria espera que estas cifras reflejen un incremento en el número promedio de ventas, por encima del 7.3 que vendió en meses anteriores, y una reducción en la variabilidad de las ventas mensuales que habían sido de = 5.7. De lo contrario, se ha decidido por el Consejo de Administración vender el negocio. ¿Qué consejo se puede ofrecer a la inmobiliaria?

Solución. Se debe determinar la probabilidad de cada nivel de ventas tal y como se muestra en la columna (3). Por ejemplo, en 3 de los 24 meses, se vendieron 5 casas: P (xi = 5) = 0.125. El valor esperado o media se calcula multiplicando las probabilidades por sus respectivos niveles de venta. Esto se muestra en la columna (4) como = 10.912 casas por mes. La variabilidad se mide por la varianza y se muestra en la última columna. La diferencia al cuadrado entre cada observación y la media de 10.912 se multiplica por las probabilidades apropiadas y se suman resultando 2 = 18.718 casas al cuadrado con = 4.236 casas.

Interpretación: No hay razón para vender la inmobiliaria ya que ha incrementado su promedio mensual de venta y ha reducido su variabilidad.

Hernández Ayón, H y Casillas Barajas, A 84

Page 96: Estadistica Descriptiva Programa 2010 (Libro)

EJERCICIOS

1. Dé varios ejemplos tanto de distribuciones discretas de probabilidad como de distribuciones continuas que pueden aparecer comúnmente en un negocio. ¿Cuál es la diferencia entre una distribución discreta de probabilidad y una continua?

2. Las siguientes variables aleatorias ¿son discretas o continuas? En cada caso explique el porqué de su respuesta.

a) Los carros vendidos en un lote de autos.b) Los ingresos obtenidos en un mes por un trabajador.c) Los tiempos de terminación de un trabajo en particular.d) Los empleados requeridos para terminar dichos trabajos.

3. Calcule e interprete el valor esperado, la varianza y la desviación estándar del experimento de lanzar una moneda tres veces y observe el número de caras.

4. El número de quejas de los empleados en una empresa grande oscila entre 0 a 6 cada día como se muestra en la siguiente tabla. Calcule e interprete el valor esperado, la varianza y la desviación estándar.

Quejas Número de días

Quejas Número de días

0123

3436

456

214

5. Para recolectar los datos de un proyecto de investigación, un estudiante de mercadotecnia la UAN, contó en 50 cursos de negocios el número de estudiantes

Hernández Ayón, H y Casillas Barajas, A 85

Page 97: Estadistica Descriptiva Programa 2010 (Libro)

que habían comprado recientemente discos compactos. En 12 clases no encontró estudiantes que hubieran hecho dicha compra, 3 estudiantes habían comprado en 8 clases, 4 habían comprado en 9 clases, 5 en 15 clases y 7 estudiantes de las seis clases restantes habían aumentado sus colecciones de música. El estudiante deseaba iniciar su investigación resumiendo sus datos. ¿Cómo podría usted ayudarle?

7.2. DISTRIBUCION BINOMIAL. Una distribución discreta de probabilidad.

Un gran número de decisiones empresariales depende de la distribución de probabilidad prevaleciente. Una de las más importantes es la distribución binomial.

El experimento de lanzar la moneda, analizado anteriormente, tiene sólo dos posibles resultados: (1) cara y (2) sello. La probabilidad de cada uno es conocida y constante de un intento (lanzamiento) al siguiente, y además el experimento puede repetirse muchas veces. Los experimentos de este tipo siguen una distribución binomial. Con base en el proceso de Bernoulli, llamado así por Jacob Bernoulli (1654 -1705), miembro de una familia de matemáticos suizos, una distribución normal presenta cuatro propiedades:

Sólo debe haber dos posibles resultados mutuamente excluyentes. Uno se identifica como éxito (p) y el otro como fracaso (q). Sin embargo es necesario aclarar que estos términos no tienen ninguna connotación de “bueno” o “malo”. Son completamente objetivos, y un “éxito” no implica necesariamente un resultado deseable o positivo.

La probabilidad de un éxito, p, es constante entre un ensayo y otro, al igual que lo hace la probabilidad del fracaso y q = (1 – p).

Hernández Ayón, H y Casillas Barajas, A 86

Page 98: Estadistica Descriptiva Programa 2010 (Libro)

La probabilidad de un éxito en un ensayo es totalmente independiente de cualquier otro ensayo.

El experimento puede repetirse varias veces.

Con las anteriores reglas, queda claro porqué el lanzamiento de una moneda cumple con los requisitos de una distribución binomial.

Pueden citarse otros ejemplos relacionados con los negocios. Los sindicatos de trabajadores con frecuencia desean saber cuántos trabajadores: (1) están interesados en unirse al sindicato, y (2) quienes no están interesados. Los banqueros pueden hacer encuestas a los expertos en economía sobre si las tasas de interés: (1) aumentarán o (2) no aumentarán. En mercadotecnia, se desea saber si los consumidores (1) prefieren determinado producto o (2) no lo prefieren. La aplicación de la distribución binomial al campo de los negocios es casi ilimitada.

Si se conoce la probabilidad de que un ensayo determinado producirá un éxito, es posible estimar cuántos éxitos habrá en un número determinado de ensayos. Por ejemplo, si se conoce la probabilidad de que un solo trabajador esté interesado en unirse al sindicato, entonces puede estimarse la probabilidad de que un número determinado de trabajadores estaría interesado en unirse.

Fórmula de la distribución

BinomialO, lo que es lo mismo,

Léase como la probabilidad de que X tome cualquier valor (x), dado que o conocida n (tamaño de muestra) y la probabilidad del hallazgo (p).

Consideremos la siguiente situación: un gerente de tarjetas de crédito ha descubierto que el 10% (p) de los usuarios no paga el monto completo de la deuda durante un determinado mes. Desea conocer la probabilidad de que en 20 (n) cuentas seleccionadas de manera aleatoria, 5 (x) cuentas no sean pagadas. Esto puede expresarse como P (x=5 n =20, p =0.10).

La probabilidad de que 5 cuentas de las 20 muestreadas sigan sin ser canceladas se puede calcular utilizando la fórmula, en donde n = 20, x = 5 y p =0.10, de donde:

Hernández Ayón, H y Casillas Barajas, A 87

Page 99: Estadistica Descriptiva Programa 2010 (Libro)

20 C5 (0.10)5 (0.90)20-5 = 0.0319

Si la probabilidad de que no se pague una cuenta cualquiera en su totalidad es p= 0.10, entonces existe un 3.19% de posibilidad de que exactamente 5 de 20 cuentas seleccionadas aleatoriamente tengan un saldo a favor.

Otro ejemplo de distribución binomial se tiene si se considera que el personal de ventas de una empresa hace una venta al 15% de los clientes que la visitan. Si una persona de este departamento llama a 15 clientes hoy ¿cuál es la probabilidad de que venda exactamente 2 aparatos? Dado p = 0.15, n = 15 y x = 2, se verifica que p (exactamente 2) = 0.2856.

Ejemplo. Una revista informativa de Educación Superior señala que el 40% de todos los estudiantes trabajan durante el verano para ganar dinero para su educación universitaria. Si 7 de ellos se seleccionan de manera aleatoria ¿cuál es la probabilidad de que (a) 5 tengan trabajo en verano, (b) ninguno trabaje y (c) todos trabajen?

Solución:

(a)Considere n= 7, p=0.40 y x= 5 y verifique que P (x) = 0.774. Es decir, que hay 7.74% de probabilidades de que 5 de 7 estudiantes hayan tomado trabajos de verano.

(b)Dado n = 7, p=0.40, la probabilidad de que ninguno de los estudiantes trabaje P (x= 0) es de 0.0280.

(c) La probabilidad de que todos los estudiantes trabajen P (X = 7), dado n = 7 y p=0.40 es de 0.0016

Interpretación: Es poco probable que ninguno de los estudiantes trabaje.

Media y varianza de una distribución binomial:

Si sólo hay dos resultados posibles, como en la distribución binomial la media y la varianza se calcula mediante

Media de una distribución

Binomial E (x) = = np

y

Varianza de una distribución 2= npq

Hernández Ayón, H y Casillas Barajas, A 88

Page 100: Estadistica Descriptiva Programa 2010 (Libro)

Binomial

7.2.1. Distribuciones binomiales acumuladas:

Dados los datos para los trabajos de verano de los estudiantes, suponga que se desea determinar la probabilidad de que 3 o menos estudiantes trabajaron. Este problema implica una distribución binomial acumulada debido a que se está interesado en un rango de valores de 0 a 3, en lugar de un solo número específico, es decir, P (x 3) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3)= 0.7102.

Si se desea determinar P (x 5) dado n =7 y p = 0.40, lo cual es equivalente a determinar P(x = 5)+ P(x = 6)+ P(x = 7), significa que la probabilidad de que, por lo menos 5 estudiantes tengan trabajo en verano, es de 9.63%.

Si llamáramos a P (x 5) evento A, entonces P( ) = P (4 o menos). Luego, P (x 5) = 1- P( ) = 1 - P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) P(x = 4) = 0.0963. Es decir, se llega al mismo resultado anterior utilizando otro procedimiento, lo cual no pocas veces es útil.

EJERCICIOS

1. ¿Cuáles son las cuatro características de la distribución binomial? 2. Determine los siguientes valores de probabilidad binomial

a) P(x=2|n=4, p=0.65)b) P(x=4|n=9, p=0.25)c) P(x=0|n=7, p=0.12)d) P(x 5|n=10, p=0.40)e) P( 3|n=5, p=0.40)f) P(4 x 6|n=8, p=0.56)

3. El 10% de los discos de computador producidos por un nuevo proceso salen defectuosos. Si hay 20 discos en una caja, a) ¿Cuántos esperaría usted que salieran defectuosos?b) ¿Cuál es la probabilidad de que el número de discos defectuosos sea igual al número esperado que usted determinó en su respuesta anterior?c) ¿Cuál es la probabilidad de que la mitad de discos este con defecto)

4. Del problema anterior, ¿cuál variación se encontraría en los discos defectuosos de una caja a otra?

5. Sólo 20% de los empleados que laboran en una empresa porta su identificación personal. Si llegan 10 empleados, cuál es la probabilidad de que encuentre:

a) ¿Ocho empleados con identificación?b) ¿Cuatro empleados con identificación?c) ¿Por lo menos 4 empleados con identificación?d) ¿A lo sumo 5 empleados con identificación?

Hernández Ayón, H y Casillas Barajas, A 89

Page 101: Estadistica Descriptiva Programa 2010 (Libro)

e) ¿Entre 4 y 7 empleados inclusive con identificación?

6. Responda la pregunta anterior si 60% de todos los empleados portan identificación.

7. Un estudiante debe obtener por lo menos el 60% en un examen de verdadero y falso con 18 preguntas por responder. Si el estudiante lanza una moneda para determinar la respuesta a cada pregunta ¿cuál es la probabilidad de que el estudiante pase?

7.3. DISTRIBUCION HIPERGEOMETRICA (variable aleatoria discreta)

Como se acaba de explicar, la distribución binomial es apropiada sólo si la probabilidad de un éxito permanece constante para cada intento. Esto ocurre si el muestreo se realiza con reemplazo o de una población finita (o muy grande). Sin embargo, si la población es pequeña y ocurre el muestreo sin reemplazo, la probabilidad de un éxito variará. Si la probabilidad de un éxito no es constante, la distribución hipergeométrica es de especial utilidad. La función de probabilidad para la distribución hipergeométrica es:

Distribución Hipergeométrica

En donde: N es el tamaño de la población.r es el número de éxitos en la población.n es el tamaño de la muestra.x es el número de éxitos en la muestra.

Distribución hipergeométrica

Si se selecciona una muestra sin reemplazo de una población finita conocida y contiene una proporción relativamente grande de la población, de manera que la probabilidad de éxito sea perceptiblemente alterada de una selección a la siguiente, debe utilizarse la distribución hipergeométrica.

Supóngase que en un establo de caballos de carreras hay N = 10 caballos y r = 4 de ellos tienen una enfermedad contagiosa. ¿Cuál es la probabilidad de que al seleccionar una muestra de tres caballos (n = 3), dos de ellos (x = 2) resulten enfermos?

Existe un 30% de que al seleccionar tres caballos de carreras, dos de ellos estén enfermos.

Hernández Ayón, H y Casillas Barajas, A 90

Page 102: Estadistica Descriptiva Programa 2010 (Libro)

Resuelva el siguiente ejemplo: La carrera de mercadotecnia está conformada por 16 docentes de los cuales 6 de ellos no recibieron capacitación didáctica. Cual es la probabilidad de que en una muestra de 9 docentes elegidos al azar, 4 de ellos no cuenten con la capacitación que se requiere.

En un caso reciente, en una ciudad de Estados Unidos (Kansas, City), tres mujeres entablaron una demanda contra una empresa de servicios por discriminación de sexos. De las nueve personas que eran elegibles para un ascenso, cuatro eran mujeres. Tres de las nueve personas recibieron en realidad el ascenso; pero sólo una de ellas era mujer. Las otras tres mujeres elegibles demandaron. Una consideración importante en el caso, unida con la probabilidad de que de las tres personas que recibieron ascenso sólo una mujer fuera seleccionada por casualidad. Es decir, si el género no era un factor, ¿cuál es la probabilidad de que no más que uno de los tres ascensos fuera asignado a una mujer?

Solución. Un consultor especializado en asuntos legales fue llamado para refutar el caso. El especialista calculó la probabilidad de que ante la ausencia de discriminación, sólo una de las mujeres sería ascendida en su cargo. Este cálculo se basó en que,

N= 9; el número de personas elegibles para ser ascendidas.r = 4; el número en la población identificado como éxito (mujeres).n = 3; tamaño de la muestra; quienes fueron seleccionados para el ascenso.x 1 es el número de éxitos en la muestra.

La probabilidad de que no más de una mujer fuera ascendida es P (X=0) + P (X=1)

Por tanto, P(x 1) = 0.4762 + 0.1190 = 0.5952

Interpretación. Había casi un 60% de probabilidad, sin considerar el género, que no más de una mujer fuera ascendida. Con base en tales hallazgos, como con otras pruebas presentadas en el caso, la corte dictaminó que no había suficiente evidencia de discriminación.

Hernández Ayón, H y Casillas Barajas, A 91

Page 103: Estadistica Descriptiva Programa 2010 (Libro)

Por otra parte, la media y varianza para la distribución hipergeométrica se calcula que para el caso de la binomial, como sigue.

E (x) = = np, mientras que 2= npq

7.4. DISTRIBUCION DE POISSON (variable aleatoria discreta)

Una variable discreta de probabilidad de gran utilidad en la medición de la frecuencia relativa de un evento sobre alguna unidad de tiempo o espacio es la distribución de Poisson. Con frecuencia se utiliza para describir el número de llegadas de clientes por hora, el número de accidentes industriales cada mes, el número de conexiones eléctricas defectuosas por kilómetro de cableado en un sistema eléctrico de una ciudad o el número de máquinas que se dañan y esperan ser reparadas. Fue ideada por el matemático francés Simeón Poisson (1781 – 1840).

Distribución de Poisson

Mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio.

Son necesarios dos supuestos para la aplicación de la distribución de Poisson:

La probabilidad de ocurrencia del evento es constante para dos intervalos cualesquiera de tiempo o espacio.

La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera.

Dados estos supuestos, la función de probabilidad de Poisson puede expresarse como

Función de probabilidad de Poisson

Donde: λ = Es el número promedio de ocurrencias por unidad de tiempo o espacio.e = Base del logaritmo natural. Es un valor constante que equivale a 2.71828…x = Número de veces que ocurre el evento.

Supóngase que se está interesado en la probabilidad de que exactamente 5 clientes lleguen durante la siguiente hora (o en cualquier hora dada). La observación simple de las últimas 80 horas ha demostrado que 800 clientes han entrado al negocio. Por tanto, λ = 10 por hora. Utilizando la fórmula

Hernández Ayón, H y Casillas Barajas, A 92

Page 104: Estadistica Descriptiva Programa 2010 (Libro)

Una compañía de pavimentación firmó contrato con el Ayuntamiento para hacer mantenimiento a las avenidas de la ciudad. Las avenidas recientemente pavimentadas por esta compañía demostraron un promedio de dos defectos por kilómetro después de haber sido utilizadas durante un año. Si el Ayuntamiento sigue con ésta compañía de pavimentación ¿cuál es la probabilidad de que se presenten 3 defectos en cualquier kilómetro de avenida después de haber tenido tráfico durante un año?

La media y varianza para la distribución de Poisson son iguales, es decir, µ = E(x) = y la varianza 2= , por lo que la desviación estándar es = .

Problemas resueltos:

1. Distribución binomial. A un fabricante le suministran un diseño tipo de una pieza de maquinaria que se producen en su empresa. Este producto, que es fabricado en lotes de n =12 sufre una tasa de defectos de 40%

a) Si no se desea un riesgo mayor del 10% en la probabilidad de que 5 de los 12 sean defectuosos ¿Debería comprarle a éste distribuidor?b) Si usted no desea enfrentar un riesgo mayor del 20% de probabilidad de que más de 5 piezas salgan defectuosas, ¿debería comprarle a este proveedor?

Solución:

a. Considerando P (x = 5 n = 12, p = 0.40) = 12 C5 * (0.40)5 * (1 – 0.40)12-5 = 0.2270

Comentario: Como 22.7% >10%, no debería comprarle a éste proveedor.

b. Dado: P (x > 5 n = 12, p = 0.40),

P (x = 0) = 12 C0 * (0.40)0* (1 – 0.40)12-0 = 0. 002176P (x = 1) = 12 C1 * (0.40)1* (1 – 0.40)12-1 = 0. 017441

Hernández Ayón, H y Casillas Barajas, A 93

Page 105: Estadistica Descriptiva Programa 2010 (Libro)

P (x = 2) = 12 C2 * (0.40)2* (1 – 0.40)12-2 = 0. 063852P (x = 3) = 12 C3 * (0.40)3* (1 – 0.40)12-3 = 0. 141893P (x = 4) = 12 C4 * (0.40)4* (1 – 0.40)12-4 = 0. 212840P (x = 5) = 12 C5 * (0.40)5 * (1 – 0.40)12-5 = 0. 227030

0. 665232

Por tanto, P (x > 5) = 1- 0.6652 = 0.3347, es decir, existe una probabilidad de 33.47% de que más de 5 piezas estén defectuosas.

Comentario: Como 33.47% >20%, no debería comprarle a éste proveedor.

2. Distribución Hipergeométrica. Una tienda de productos deportivos tiene en existencia N= 20 pares de calzado deportivo de los cuales r =8 presentan algún tipo de defecto. Si usted selecciona n= 3 pares de este tipo de calzado, ¿cuál es la probabilidad de que x =1 tenga algún tipo de defecto?

Solución: P (x = 1 N= 20, r = 8, n = 3, x = 1),

3. Distribución de Poisson. El cable utilizado para asegurar las estructuras de los puentes tienen un promedio de 3 defectos por cada 100 yardas (1 yarda = 0.9144 metros). Si se requieren cablear una distancia de 50 yardas ¿Cuál es la probabilidad de que haya una defectuosa?

Solución: Debido a que la media está dada en términos de 100 yardas, se debe determinar qué porcentaje de 100 yardas es 50. Por tanto, 50/100 = 0.50. Entonces, en número promedio de defectos por 50 yardas es (3)(0.50) = 1.5.

Dado, P (x = 1 = 1.5) y e = 2.71828

EJERCICIOS

1. A un conmutador de la oficina principal de la compañía llegan llamadas a un promedio de dos por minuto y se sabe que tienen distribución de Poisson. Si el

Hernández Ayón, H y Casillas Barajas, A 94

Page 106: Estadistica Descriptiva Programa 2010 (Libro)

operador está distraído por un minuto, cuál es la probabilidad de que el número de llamadas no respondida sea:

a) ¿Cero?b) ¿Por lo menos una?c) ¿Entre 3 y 5, inclusive?

2. ¿Cuáles serían las probabilidades del ejercicio anterior si el operador se distrae por 4 minutos?

3. Una empresa de muebles y mudanzas recibe en promedio 132 quejas por día por mal trato de muebles. Cual es la probabilidad de que en una hora cualquiera del día se reciban:

a) Dos quejas.b) Entre 2 y 6 quejasc) Menos de 2d) Ninguna queja

4. Usted compra partes para bicicleta de un proveedor que se sabe tiene una tasa de defectos en los productos que fabrica de 3 por cada 100 partes. Usted requiere comprar 150 partes pero no aceptará una probabilidad de más del 50% de que más de dos partes sean defectuosas. ¿Le compraría usted a dicho proveedor?

5. Los accidentes en un crucero de la ciudad de Tepic se han tipificado como 2 en promedio durante el inicio de semana y 6 el resto de la semana. Cual es la probabilidad de que en un determinado día ocurran en ese crucero,

a) Tres accidentesb) Más de 5c) Menos de 2d) Ninguno

6. Profeco recibe un promedio de 8640 llamadas por mes (de 30 días), por mal servicio de Teléfonos de México. Cual es la probabilidad de que en determinado minuto se reciban,

a) Dos llamadasb) Ningunac) Entre 3 y 5 inclusive para ambos

7.5 DISTRIBUCION EXPONENCIAL

La distribución exponencial es una distribución continua. Mide el paso del tiempo entre tales ocurrencias. Mientras que la distribución de Poisson describe las tasas de llegada (de personas, camiones, llamadas telefónicas, etc.) dentro de algún periodo dado, la distribución

Hernández Ayón, H y Casillas Barajas, A 95

Page 107: Estadistica Descriptiva Programa 2010 (Libro)

exponencial estima el lapso entre tales arribos. Si el número de ocurrencias tiene distribución de Poisson, el lapso entre las ocurrencias estará distribuido exponencialmente.

La probabilidad de que el lapso sea menor o igual a cierta cantidad x es

Distribución exponencial

P (X x) = 1- e- t

En donde:

t es el lapso de tiempo e es la base del logaritmo natural, 2.71828

es la tasa promedio de ocurrencia

La distribución de una variable aleatoria exponencial se muestra en la siguiente figura. La curva en continuo descenso muestra que con el paso del tiempo X aumenta y la probabilidad disminuye.

Distribución exponencial:

f (x)

P (X 30) P (X 40)

10 20 30 40 50 60 70 x

Se asume que la tasa promedio de llegada de los clientes es = 1.5 por hora y se desea saber la probabilidad de que no más de dos horas transcurran entre llegadas. De acuerdo con la fórmula, t = 2. Entonces P (X 2)=1- e- (1.5) (2) =1– e- 3 = 0.9502. Existe 95.02% de probabilidad de que el segundo cliente ingrese a las dos horas o menos, del primero si la tasa de llegadas es de 1.5 horas.

Los camiones llegan al punto de venta a una tasa de = 2 por hora. ¿Cuál es la probabilidad de que no más de 30 minutos transcurran entre llegadas?

Hernández Ayón, H y Casillas Barajas, A 96

Page 108: Estadistica Descriptiva Programa 2010 (Libro)

Para este ejemplo, se considera: 30 minutos = 1/2 hora). Entonces, P (X 30 minutos) = 1 – e - (2)(1/2)= 0.6321.

Ejemplo. Una estación de servicio de taxis programa sus unidades para que lleguen al aeropuerto en una distribución de Poisson con una tasa promedio de llegada de 12 por hora. Si usted acaba de llegar en el último vuelo y requiere estar en el centro de la ciudad lo más pronto posible para cerrar un importante negocio, ¿cuál es la probabilidad de que usted tenga que esperar máximo 5 minutos para conseguir su taxi? Si la probabilidad de que pase otro taxi dentro de 5 minutos es menor al 50%, usted alquilará un carro especial para el viaje al centro.

Solución. Asumiendo lo peor, que el último taxi acaba de irse, usted debe determinar P(X 5 minutos). Debido a que = 12/60 minutos, se debe determinar qué porcentaje son 5 minutos de 60: 5/60 = 1/12. Por lo tanto, t = 1/12 y P (X 5 minutos) = 1 – e – (12) (1/12)= 63.21%.

Interpretación. Hay una probabilidad de 63.21% (> 50%) de que llegue un taxi dentro de 5 minutos.

EJERCICIOS

1. Los aviones llegan a un pequeño aeropuerto en una proporción de dos por hora. Tomará una hora reparar una rampa utilizada para desembarcar pasajeros. ¿Cuál es la probabilidad de que un avión llegue mientras que la rampa está en reparación?

2. El computador principal de la universidad queda fuera de línea tres veces por semana. Los profesores deben entregar una información que les es requerida y que requiere además el uso del computador. ¿Cuál es la probabilidad de que el computador esté fuera de línea toda la semana?

3. Durante un día de trabajo típico de 8 horas, los computadores utilizados para vigilar la etapa de enfriamiento en la producción de neumáticos para autos señala que la temperatura no se mantiene de forma apropiada en 30 oportunidades. El director ejecutivo de la compañía está por hacer una

Hernández Ayón, H y Casillas Barajas, A 97

Page 109: Estadistica Descriptiva Programa 2010 (Libro)

inspección de la planta que durará 30 minutos. ¿Cuál es la probabilidad de que esté allí cuando se active la señal del computador?

8. DISTRIBUCIÓN NORMAL

De todas las distribuciones de probabilidad que se analizaron, la distribución normal es la más importante. La distribución normal es una distribución continua. Se utiliza para reflejar la distribución de variables tales como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente. Tales variables continuas generalmente son el resultado de la medida.

La fórmula de esta distribución fue publicada por primera vez por Abraham Demoivre (1667-1754) en 1733. Otros matemáticos que han hecho aportaciones en la historia inicial de la distribución normal son Pierre Simón, el Marqués de Laplace (1749-1827) y Carl Friedrich Gauss (1777-1855), en cuyo honor se denomina a veces distribución de Gauss.

Algunas características de la distribución normal son las siguientes:

Hernández Ayón, H y Casillas Barajas, A 98

Page 110: Estadistica Descriptiva Programa 2010 (Libro)

1. El área total comprendida bajo la curva y por encima del eje horizontal es igual a 1.

2. La distribución es simétrica al respecto de su media. Es decir, el 50% del área está comprendida a la derecha de la media y el 50% a la izquierda.

3. La media, la moda y la mediana son todas iguales.4. La distancia que hay desde el punto de inflexión de la curva hasta

una perpendicular levantada sobre la media es igual a la desviación estándar σ.

5. La distribución normal es una familia de distribuciones, puesto que existe una distribución diferente para cada μ y σ.

6. Los valores de la variable aleatoria se distribuye desde - (menos infinito) a + (mas infinito), pero su rango práctico se considera igual a 6 desviaciones estándar (3 por encima y 3 por debajo de la media)

7. Proporciona la base para la inferencia estadística clásica, por su relación con el “teorema de límite central”.

Consideremos el caso de un fabricante de ropa que desea estudiar la distribución en la estatura de las personas. El gerente de producción reconoció que el público estaba en constante cambio en su tamaño físico y en sus proporciones. En un esfuerzo por producir la ropa de mejor ajuste, la gerencia pensó que se necesitaba un análisis completo de las tendencias actuales en los tamaños de moda. Se supone que si la empresa fuera a medir las estaturas de todos sus clientes potenciales, encontrarían que las estaturas se distribuyen de manera normal (similar a la curva de Gauss) alrededor de una media de 1.70 metros. Es decir, el valor promedio de dicha serie de datos es de 1.70 (suma de todos los valores entre el total de datos), no obstante, existen estaturas por arriba y por debajo de este promedio.

Estas diferencias por encima y por debajo de la media (dispersión) podría medirse mediante la desviación estándar, la cual es de 5 centímetros para este caso (o 0.05 metros). Una gráfica de estas estaturas produciría una campana, como se muestra en la siguiente figura, colocando las observaciones individuales en el eje horizontal, y la frecuencia de estas observaciones en el eje vertical.

f(x) = 0.05 m.

Hernández Ayón, H y Casillas Barajas, A

Fre

cuen

cia

d

e ob

serv

ació

n

99

Page 111: Estadistica Descriptiva Programa 2010 (Libro)

50% 50%

= 1.70 x (metros)

Si los valores son todavía normales (distribuidos normalmente) entonces aparecerá la curva en forma de campana. Es importante recordar que el 50% de las observaciones están por encima de la media (a la derecha de la media) y el 50% restante por debajo de la media (a la izquierda de la media), ya que media y mediana tienen el mismo valor.

8.1 Distribución normal estándar

Puede existir un número infinito de distribuciones normales posibles, cada una con su propia media y su desviación estándar. Ya que no se puede analizar un número tan grande de posibilidades, es necesario convertir todas estas distribuciones normales a una forma estándar. Esto es, se trata de hacer una contrastación entre un modelo teórico y un modelo real. Para ello se utiliza una formula de conversión (o fórmula –Z), la cual permite transformar valores reales, que se supone que se distribuyen de manera normal o en forma de campana, en valores correspondientes a un modelo donde pueden leerse valores de probabilidad teóricamente posibles.

Fórmula de conversión

En donde Z es la distribución normal estandarizada y x es algún valor específico de la variable aleatoria. A partir de esta conversión, el valor de la media poblacional (µ) es igual a 0, y la desviación estándar poblacional () toma el valor de 1.0.

La distribución normal estándar es aquella cuya variable aleatoria Z siempre tiene una media µ=0 y una desviación estándar =1.

Por ser una variable aleatoria continua, siempre se obtendrán valores bajo la curva normal (véase tabla de la distribución normal estándar) entre dos puntos y no un solo punto específico. La curva normal permite entonces hacer cálculos de área bajo la curva entre dos valores de la variable aleatoria.

En el ejemplo de la fábrica de ropa, consideremos el hecho de que una persona mide 1.80 metros, su valor equivalente en Z’s es

Hernández Ayón, H y Casillas Barajas, A 100

Page 112: Estadistica Descriptiva Programa 2010 (Libro)

Es decir, 1.80 metros se encuentra ubicado en el punto 2 desviaciones estándar a la derecha de la media y, según la tabla de valores de la normal, es equivalente a 0.4772. Es decir, que la probabilidad de encontrar estaturas entre 1.70 y 1.80 metros, es del 47.72%. Esta información será de mucha utilidad para el fabricante de ropa.

Estandarizar una distribución normal permite determinar más fácilmente la probabilidad de que ocurra cierto evento. El personal de la fábrica de ropa puede hallar la probabilidad de que un haya clientes que tenga entre 1.75 y 1.70 metros de estatura, P (1.75 X 1.70), simplemente hallando el área que está bajo la curva, a partir de lo cual se podrá conocer la probabilidad correspondiente, con el apoyo de la tabla normal.

Considerando este ejemplo, el valor de Z está dado como Z = (1.75 – 1.70)/0.05 = 1.0 desviaciones estándar. En la tabla de la normal, se localiza el valor para Z = 1.0 = 0.3413, en donde se establece el 34.13% de todos los clientes de la fábrica de ropa, miden entre 1.75 y 1.70 metros. Por otra parte, si se desea saber que porcentaje de clientes miden más de 1.75, entonces tenemos que la mitad de la curva por encima de 1.70 es de 0.5000 o el 50%, de manera que la diferencia entre 0.5000 – 0.3413 = 0.1587 (Existe una probabilidad del 15.87% de que haya clientes que midan más de 1.75 metros).

(1.70 X 1.75) = P (0 Z 1) = 0.3413

Hernández Ayón, H y Casillas Barajas, A 101

Page 113: Estadistica Descriptiva Programa 2010 (Libro)

P (X > 1.75) = P (Z > 1.0) = 0.1587

Se requiere conocer la probabilidad de que una persona mida entre 1.64 y 1.78 metros.

Cálculos. Primeramente se procede a conocer el valor del área bajo la curva entre el rango 1.64 y 1.78 m.

1) P(x=1.64) = (1.64 – 1.70)/0.05 = -1.20. El signo indica que el área buscada se encuentra del lado izquierda de la media y, como es simétrica, puede ignorarse para realizar el cálculo de la probabilidad. Por lo tanto, de tablas se obtiene que la probabilidad cuando Z = 1.20 es P(Z = 1.20) = 0.3849 del lado izquierdo de la curva.

2) El otro valor del rango es de 1.78 metros, por lo que P(x = 1.78) = (1.78 – 1.70)/0.05 = 1.60, que se localiza del lado derecho de la curva. De tablas, la probabilidad cuando Z = 1.60 es P(Z = 1.60) = 0.4452.

La respuesta se completa al juntar (sumar) las dos probabilidades (la del lado izquierdo y la del lado derecho). Dado que se requiere conocer la probabilidad de encontrar estaturas entre 1.64 y 1.78 metros, la respuesta es 0.3849 + 0.4452 = 0.8301, es decir, existe el 83.01% de probabilidad de que haya clientes que midan entre 1.64 y 1.78 metros de estatura.

Hernández Ayón, H y Casillas Barajas, A 102

Page 114: Estadistica Descriptiva Programa 2010 (Libro)

P (- 1.2 Z 1.6) = 0.8301

Si se deseara saber la probabilidad de aquellas personas con estaturas menores que 1.64, entonces 0.5000 (equivalente a la mitad de la curva izquierda) – 0.3849 = 0.1151, es decir que existe un 11.51% de que haya clientes con estaturas menores a 1.64 metros.

Como ejemplo (1) calcule la probabilidad de encontrar clientes con las siguientes estaturas.

a) Entre 1.50 y 1.62 metrosb) Entre 1.80 y 1.86c) Entre 1.58 y 1.72d) Menores a 1. 60e) Menores a 1.90f) Mayores a 1.89g) Mayores a 1.68h) Entre 1.50 y 1.80

Ejemplo 2. Una compañía presta servicios de comunicación vía satélite a algunos negocios de la ciudad. Los funcionarios de la compañía han aprendido que la transmisión satélite promedio es de 150 segundos con una desviación estándar de 15 segundos. Los tiempos parecen estar distribuidos normalmente.

Para estimar de manera apropiada la demanda del cliente por sus servicios y establecer una estructura de tarifas que maximice las utilidades corporativas, la empresa debe determinar qué tan probable es que algunas llamadas se presenten. El director de servicios desea conocer los estimados de probabilidad de que una llamada dure:

a. Entre 125 y 150 segundosb. Menos de 125 segundosc. Entre 145 y 155 segundosd. Entre 160 y 165 segundos

Hernández Ayón, H y Casillas Barajas, A 103

Page 115: Estadistica Descriptiva Programa 2010 (Libro)

Solución:a.

Un valor Z de 1.67 da un área de 0.4525. Por tanto, la probabilidad de que una llamada dure entre 125 y 150 segundos es de 45.25%.

b. Si el 45.25% del área está entre 125 y 150, entonces la probabilidad de que cualquier transmisión seleccionada aleatoriamente requiera 125 segundos o menos es 0.5000 – 0.4525 = 0.0475 = 4.75%.

c. P (145 X 155)

Dado Z = - 0.33, el área que está entre 145 y 150 es 0.1293 por debajo de la media. Por otra parte, 155 es una distancia que está por encima de la media equivalente a la anterior, pero positiva, de manera que el área entre 150 y 155 también es 0.1293. Por tanto,

P (145 X 155) = 0.1293 + 0.1293 = 0.2586

Hernández Ayón, H y Casillas Barajas, A 104

Page 116: Estadistica Descriptiva Programa 2010 (Libro)

d. El valor para Z entre 160 y 150 es de Z = (160 – 150)/15 = 0.67

La probabilidad cuando Z = 0.67, es de 0.2486. Para determinar el área bajo la curva entre 165 y 150, se tiene que Z = (165 - 150)/15 = 1.0

El valor de probabilidad para Z = 1.0 es de 0.3413, por lo que la probabilidad entre 160 y 165 es una resta entre el área más grande y la más pequeña P (160 X 165) = 0.3413 - 0.2486 = 0.0927

Interpretación. Estos cálculos de probabilidad permiten a la empresa desarrollar un sentido de la demanda por sus servicios que le ayudará a establecer políticas respecto al uso de los servicios por parte de los clientes, así como una estructura de tarifas óptima que pueda cobrar.

Hernández Ayón, H y Casillas Barajas, A 105

Page 117: Estadistica Descriptiva Programa 2010 (Libro)

8.1.2. Aproximación de la distribución normal a la distribución binomial

La distribución binomial involucra una serie de n ensayos que pueden producir (1) un éxito o (2) un fracaso. La probabilidad de un éxito se indica como p. Las respuestas pueden hallarse a menudo en la tabla binomial o utilizando la fórmula binomial. Sin embargo si n es demasiado grande, puede exceder los confines de cualquier tabla y la fórmula puede ser excesivamente laboriosa. La solución puede hallarse con el uso de la distribución normal para aproximar la distribución binomial. Esta aproximación se considera lo suficientemente precisa si np 5 y n(1- p) 5 y si p está próximo a 0.50.

Supóngase que el 40% de los trabajadores de un sindicato están a favor de una huelga. Si se seleccionan 15 miembros de manera aleatoria, ¿cuál es la probabilidad de que 10 apoyen un paro? Utilizando la fórmula binomial P(x = 10n = 15, p= 0.40), se tiene que P (x = 10) = 0.0245.

Es posible aproximarse a la respuesta utilizando la distribución normal. Primero se debe encontrar la media y la desviación estándar de la distribución normal.

= np y =

En este caso, = (15)(0.40) = 6 y = = 1.897

Debido a que existe un número infinito de valores posibles en una distribución normal (o en cualquier distribución continua), la probabilidad de que la variable aleatoria sea exactamente igual a algún valor específico como 10, es cero. Cuando se utiliza una distribución continua para estimar una variable aleatoria discreta, es necesario un ajuste llamado factor de corrección por continuidad el cual requiere que se trate la probabilidad de exactamente 10 miembros como el intervalo entre 9.5 y 10.5. Esto se ilustra en la siguiente figura, la cual muestra las probabilidades para cada valor de la variable aleatoria (número de trabajadores).

Hernández Ayón, H y Casillas Barajas, A 106

Page 118: Estadistica Descriptiva Programa 2010 (Libro)

0.20 –

0.15 -

0.10 - 0.02 - 0.01 -

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Número de miembros

La probabilidad de que exactamente 10 miembros estén a favor de una huelga está representada por el área del rectángulo centrada en 10, donde la curva normal está superpuesta sobre los rectángulos. Vale la pena destacar que el rectángulo se extiende de 9.5 a 10.5.

Utilizando la distribución normal para hallar P (9.5 X 10.5), se tiene:

Equivalente a 0.4678 del área bajo la curva normal, y

Equivalente a un área de 0.4911. Entonces, P (9.5 X 10.5) = 0.4911 – 0.4678 = 0.0233, lo cual es una aproximación muy cercana al 0.0245 calculada mediante la distribución binomial.

Hernández Ayón, H y Casillas Barajas, A

Pro

babi

lida

d

107

Page 119: Estadistica Descriptiva Programa 2010 (Libro)

Problemas resueltos

1. Distribución exponencial. El gerente de un pequeño negocio dedicado a la venta de hamburguesas, observa que los clientes acuden a su establecimiento a razón de 8 por hora. ¿Cuál es la probabilidad de que pasen más de 15 minutos entre la llegada de dos clientes?

Solución. Aunque la razón media está dada originalmente como 8 por 60 minutos, se desea saber la probabilidad de que transcurran 15 minutos. Debe determinarse qué porcentaje de 60 minutos es 15, por lo que, 15/60 = 0.25. Así, t es igual a 0.25 y - t = - (8) (0.25) = -2. Para determinar P (x > 15), primero se debe hallar P (x 15) y restar de 1.0.

P (x 15) = 1 – e – 8(0.25) = 1 – 0.1353 = 0.8647.

P (x > 15) = 1 – 0.8647 = 0.1353.

2. Distribución normal. La Secretaría de Agricultura, en un estudio sobre cultivos, ha detectado que las precipitaciones diarias en ciertos lugares parecen estar distribuidas normalmente con una media de 2.2 pulgadas (5.588 centímetros) durante la estación lluviosa. Se determinó que la desviación estándar era de 0.8 pulgadas.

a. ¿Cuál es la probabilidad de que llueva más de 3.3 pulgadas en un día durante la estación lluviosa?

Un valor de Z de 1.38 da un área de 0.4162. Así pues, P (X > 3.3) = 0.5000 – 0.4162 = 0.0838.

2.2 Pulgadas 3.3

b. Halle la probabilidad de que llueva más de 1.3 pulgadas.

Hernández Ayón, H y Casillas Barajas, A 108

Page 120: Estadistica Descriptiva Programa 2010 (Libro)

El valor de Z de –1.13, equivalente a un área de 0.3708, por lo que P (x >1.3) = 0.5000 + 0.3708 = 0.8708. Habrá un 87.08% de que llueva más de 1.3 pulgadas.

c. ¿Cuál es la probabilidad de que las precipitaciones estén entre 2.7 y 3.0 pulgadas?

Correspondiente a un área de 0.3413 y,

Hernández Ayón, H y Casillas Barajas, A 109

Page 121: Estadistica Descriptiva Programa 2010 (Libro)

Para un área de 0.2357.

2.2 2.7 3.0

Por tanto, P (2.7 x 3.0) = 0.3413 – 0.2357 = 0.1056

3. Aproximación normal a la distribución binomial. El 45% de todos los empleados de un centro de capacitación gerencial tienen títulos universitarios. ¿Cuál es la probabilidad de que de los 150 empleados seleccionados aleatoriamente, 72 tengan título universitario?

La media y la desviación estándar son µ = p = (150)(0.45) = 67.5 Mientras que = , donde q = (1-p), por lo que

= 6.09.

Si P (71.5 x 72.5), entonces,

De tablas P(Z = 0.82) = 0.2939, y

De tablas P(Z = 0.66) = 0.2454.

Por lo que, P (71.5 x 72.5) = 0.2939 – 0.2454 = 0.0485

Hernández Ayón, H y Casillas Barajas, A 110

Page 122: Estadistica Descriptiva Programa 2010 (Libro)

71.5 72 72.5

EJERCICIOS

1. Los paquetes de cereal que produce una conocida marca vienen en cajas de 36 onzas que tienen una desviación estándar de 1.9 onzas. Se considera que los pesos de dichas cajas están distribuidos normalmente. Si se selecciona una caja aleatoriamente, cuál es la probabilidad de que la caja pese:

a) ¿Menos de 34.8 onzas?b) ¿Más de 34.8 onzas?c) ¿Entre 34.3 y 38.9 onzas?d) ¿Entre 39.5 y 41.1 onzas?

2. Como comerciante de materiales para la construcción, usted compra sacos de cemento que pesan en promedio 50 libras, con una desviación estándar de 5.2 libras. Por prescripción médica, un trabajador está imposibilitado para levantar pesos mayores a las 60 libras. ¿Podría cargar un saco de cemento sin riesgo de que éste exceda las 60 libras?

3. Se publica que los frenos de autos nuevos Nissan duran un promedio de 35,000 millas, con una desviación estándar de 1,114 millas. Un cliente acaba de comprar un auto de ésta marca, cuál es la probabilidad de que los frenos le duren

a) ¿Más de 35, 000 millas?b) ¿Menos de 33, 900 millas?c) ¿Menos de 37, 500 millas?d) ¿Entre 32, 500 y 36, 900 millas?

4. Los sobrecostos por actualización de computadoras en una empresa tiene en promedio $235,000, con una desviación estándar de $94,000. El director ejecutivo del área de Investigación no desea arriesgarse a más de 34% de probabilidad de sobrecosto a que una actualización propuesta recientemente exceda más de $250,000. ¿Usted recomendaría que se ejecute la actualización?

5. El promedio de los salarios de los empleados bancarios en una ciudad de Estados Unidos es de $22.87 dólares/hora, con una desviación estándar de $5.87 dólares/hora. Cuál debe ser su salario/hora si desea ganar:

a) ¿Más que el 80%?b) ¿Más que el 30%?

Hernández Ayón, H y Casillas Barajas, A 111

Page 123: Estadistica Descriptiva Programa 2010 (Libro)

c) ¿Menos que el 20%?d) ¿Más que el 50%?

6. Los empleados de una empresa trabajan en promedio 55.8 horas/semana con una desviación estándar de 9.8 horas. Los ascensos son más probables para los empleados que están dentro del 10% de los que pasan más tiempo trabajando. ¿Cuánto debe trabajar un empleado para mejorar sus oportunidades de ascenso?

7. Los registros muestran que el 45% de todos los automóviles producidos por Ford Motor Company contiene partes importadas de Japón. ¿Cuál es la probabilidad de que en los próximos 200 vehículos, 115 contengan partes japonesas?

8. Una empresa de transportes por carretera encuentra que el 30% de sus envíos llega tarde. Si se programan ocho envíos, cuál es la probabilidad de que:

a) ¿Tres lleguen tarde?b) ¿Tres o más lleguen tarde?c) ¿Tres o menos lleguen tarde?d) ¿Entre tres y cinco inclusive lleguen tarde?

9. Una encuesta revela que el 60% de los hogares prefiere cierta marca de ropa deportiva. Si se hizo la encuesta en 12 hogares, cual es la probabilidad de que esta ropa deportiva sea escogida por:

a) ¿Siete hogares?b) ¿Menos de seis hogares?c) ¿Diez o más hogares?d) ¿Más de dos hogares?

10. Una empresa transfiere 9 trabajadores a otra empresa que es filial de la primera. Sólo 6 de ellos están realmente calificados para realizar el trabajo para el cual pueden ser asignados. El departamento de Producción selecciona aleatoriamente 5 de los 9 empleados. Cuál es la probabilidad de que:

a) ¿Los cinco estén calificados?b) ¿Cuatro estén calificados?c) ¿Por lo menos tres estén calificados?

11. La junta directiva de la empresa ABC consta de 4 economistas, 3 contadores y 5 ingenieros. Si un comité de 7 miembros debe seleccionarse aleatoriamente, ¿cuál es la probabilidad de que dicho comité esté conformado por 2 economistas, 2 contadores y 3 ingenieros?

12. Los aviones llegan a un aeropuerto internacional a una razón promedio de 5.2 por minuto. Los controladores de tráfico aéreo pueden manejar de forma segura un máximo de 7 aviones por minuto. ¿Cuál es la probabilidad de que se arriesgue la seguridad del aeropuerto? Se cree que las llegadas tienen una distribución de Poisson.

13. Una encuesta reportó que el 80% de la población piensa que los salarios de los miembros del Congreso son demasiado altos. Si 15 personas se seleccionan para conformar un comité que decida por mayoría de votos si

Hernández Ayón, H y Casillas Barajas, A 112

Page 124: Estadistica Descriptiva Programa 2010 (Libro)

tales salarios deben aumentarse o no. ¿Cuál es la probabilidad de que el voto sea no aumentar tales salarios?

14. Los camiones llegan a cargar en razón de 9.3 por hora en promedio. El encargado del puerto sabe que si llegan 6 o menos camiones, sólo es necesario un puerto de carga. Si llegan más de 6, debe abrirse un segundo puerto. ¿Deberá abrirse el segundo puerto?

15. Una compañía que presenta un 10% de defectos en su producción vende su producto en lotes de 15 unidades. Ofrece un descuento $1,000 sí más de tres unidades salen defectuosas. ¿Cuánto descuento debería esperar la compañía por cada 50 envíos?

16. La administradora de una gran tienda de ropa de un centro comercial hace la nómina para 11 empleados, pero 7 contienen errores. La jefa del departamento no está conforme y selecciona 5 registros de nómina para revisarlos. Se encuentra que 3 contienen errores. La administradora se defiende diciendo que sólo tuvo tres errores en los 11 registros. ¿Es éste un buen argumento?

17. El tiempo promedio entre fallas de un nuevo foco para exteriores de General Electric es de 10 semanas. ¿Cuál es la probabilidad de que un nuevo foco falle dentro de 15 semanas?

18. Los clientes ingresan a un restaurante local a una razón de 10 por hora. ¿Cuál es la probabilidad de que transcurran 30 minutos entre las llegadas de 2 clientes cualesquiera?

19. Los pesos contenidos en las cajas de cereal están distribuidos de manera uniforme con una media de 35 onzas y un rango de 3.4 onzas.

a) ¿Cuál es el peso mínimo y máximo de las cajas?b) ¿Cuál es la probabilidad de que una sola caja contenga entre 32 y 33

onzas?

20. Durante los últimos 20 años un trabajador ha conducido todos los días para ir a su empleo. El menor tiempo empleado para hacerlo es de 63 minutos y el máximo tiempo que se ha demorado son 110 minutos. Si los tiempos de conducción están distribuidos uniformemente:

a) ¿Cuál es el tiempo promedio?b) ¿Cuál es la probabilidad de que le tome 1.5 horas?

21. Los reportes muestran que se cometen 5 homicidios cada hora en las ciudades más grandes del país, y que la distribución se ajusta a una distribución de Poisson. Si esto es cierto, ¿cuál es la probabilidad de que en los próximos 30 minutos asesinen a 3 personas?

22. Un proceso de manufactura produce 1.2 defectos por cada 100 unidades de producción, y sigue una distribución de Poisson. ¿Cuál es la probabilidad de que las siguientes 500 unidades presenten 3 defectos?

23. Normalmente se toman 2 semanas en entrenar a un trabajador para utilizar un taladro de banco. ¿Cuál es la probabilidad de que un trabajador pueda ser entrenado en 1.5 semanas?

Hernández Ayón, H y Casillas Barajas, A 113

Page 125: Estadistica Descriptiva Programa 2010 (Libro)

24. En un esfuerzo por reducir costos, un restaurante de comida rápida analizó la tendencia para que sus procesadores automáticos determinaran los pesos de la hamburguesa en la presentación de un cuarto de libra. Se encontró que los pesos oscilaban entre 3.2 y 4.9 onzas. Se asumió una distribución uniforme, ¿qué porcentaje de hamburguesas tiene más de un cuarto de libra? (Nota: 1 libra = 16 onzas = 453.6 gramos).

25. ¿La distribución normal es una distribución discreta o continua? Justifique su respuesta. Si dos conjuntos de datos que están distribuidos normalmente tienen la misma media pero diferentes desviaciones estándar ¿cómo se compararía el rango que comprende el 68.3% de todas las observaciones de un conjunto a otro? Haga las gráficas necesarias para ilustrar cómo puede aplicarse la regla empírica en ambas distribuciones.

26. Los costos de producción mensual de una imprenta son de $4,100 en promedio con una desviación estándar de $870. El administrador considera conveniente mantener los costos por debajo de los $3,000 este mes. ¿Si los costos están distribuidos normalmente puede creerse en el administrador?

27. Un despacho contable encuentra que el tiempo que se toma para realizar un proceso de auditoria está distribuido normalmente con un tiempo promedio de 17.2 días y una desviación estándar de 3.7 días. El despacho se comprometió a iniciar un proceso de auditoria dentro de 20 días pero debe terminar una que ya ha comenzado. ¿Qué tan probable es que cumpla su promesa?

28. Los corredores de un maratón local terminaron el trayecto en un tiempo promedio de 180.3 minutos con una desviación estándar de 25.7 minutos. ¿Qué tan rápido deben correr para terminar dentro del primer 10%?

29. Los conectores eléctricos duran un promedio de 18.2 meses con una desviación estándar de 1.7. El proveedor acepta reemplazar uno si éste falla dentro de los primeros 19 meses. De 500 unidades ¿cuántos se debe reemplazar en promedio?

30. Las ventas promedio de un agente de ventas son de $5,000 con una desviación estándar de $152. El agente de ventas tiene una comisión de $1,000 sólo si sus ventas exceden de $5,300. En promedio, ¿Cuál es la comisión por cada 25 ventas?

31. La producción diaria de una planta local tiene un promedio 7,300 toneladas con una desviación estándar de 125 toneladas. En un promedio de 100 días ¿cuántas veces excederá las 7,000 toneladas?

32. Las ventas diarias en un parque de diversiones son de $10,120 con una desviación estándar de $3,120. ¿Cuál es la probabilidad de que el día de hoy se reciba más de $10,000 peso de venta?

33. Se sabe que el grupo de profesionistas que se inscriben en una Prueba de Aptitud Gerencial obtienen 812 puntos en promedio, con una desviación estándar de 145 puntos. Sólo quienes están entre el 20% de los mejores pueden aplicar a una beca específica. Un profesionista obtuvo un puntaje de 900 en la prueba, ¿considera que puede aplicar para una beca?

Hernández Ayón, H y Casillas Barajas, A 114

Page 126: Estadistica Descriptiva Programa 2010 (Libro)

34. Las unidades de almacenamiento de una empresa tienen un promedio de 82.3 pies cuadrados (1 pié cuadrado = 929 cms2). ¿Cuántos pies cuadrados debe tener una unidad para que sea más grande que el 90% de todas las unidades?

35. De acuerdo con la National Geographic, el 32% de los australianos que viven en el interior del país beben una cierta clase de cerveza local. Si se seleccionan aleatoriamente 500 personas de la misma nacionalidad, ¿cuál es la probabilidad de que por lo menos 150 hayan bebido este tipo de cerveza?

36. Una encuesta realizada reveló que el 69% de los rusos estaban peor económicamente después de la revolución. Si se seleccionan aleatoriamente a 800 personas ¿Cuál es la probabilidad de que menos de 580 estén en estas condiciones?

37. Un periódico en Estados Unidos informó que el 56% de todos los niños de 7 años cree que la Cenicienta era una persona real. ¿Cuál es la probabilidad de que por lo menos el 50% de 120 niños de 7 años crea lo mismo?

38. En las cercanías de parques industriales mineros se detectó que 3 de cada 10 niños contienen plomo en la sangre en cantidades superiores a las permitidas por la Norma Oficial Mexicana. Cual es la probabilidad de que en un grupo escolar de 20 niños, padezcan el mismo problema,

a) Exactamente dos de ellosb) Entre 5 y 10c) Más de la mitad de ellosd) Menos de la cuarta partee) Todosf) Ninguno

39. El tiempo que tarda un empleado para ensamblar partes para automóvil al parecer se distribuye normalmente, con una media de 70 segundos y una desviación estándar de 8. Cual es la probabilidad que en una ensambladora similar los empleados tarden,

a) Entre 80 y 90 segundosb) Menos de 60 segundosc) Entre 60 y 70 segundosd) Más de 65 segundose) Que porcentaje de empleados tarda más de 70 segundos.

ANDERSON, David, Sweeney, Dennis y Williams, Thomas. Estadística para Administración y Economía. Cengage Learning .2008

BERENSON M, Mark L. y David M. Levine. Estadística Básica para administración. Edit. Prentice Hall.1992

HINES, William, Douglas C. Montgomery. Probabilidad y Estadística para Ingeniería y Administración. Edit. CECSA 1983.

KAZMIER, Leonard J, Estadística Aplicada a la Administración y a la Economía. Edit. McGraw-Hill 2006

Hernández Ayón, H y Casillas Barajas, A 115

Page 127: Estadistica Descriptiva Programa 2010 (Libro)

LEVIN, Richard, David S. Rubin, Estadística para Administradores. Edit. Prentice Hall 1996.

MASON/LIND/MARCHAL, Estadística para Administración y Economía. Edit. Alfaomega 1995.

PORTILLA C., E. Estadística –primer curso-. McGraw-Hill 1992.

SPIEGEL, Murray R., Estadística, Edit. McGraw-Hill. Interamericana 1990.

STEVENSON W. J. Estadística para administración y economía. Harla 1981

TARO, Yamane, Estadística. Edit. Harla 1973.

U.P.N. Introducción a los Métodos Estadísticos. México. SEP. 1989.

AREAS BAJO LA CURVA NORMAL TIPIFICADA DE 0 A Zz 0 1 2 3 4 5 6 7 8 9

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2793 0.2823 0.2652

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3364 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

Hernández Ayón, H y Casillas Barajas, A 116

Page 128: Estadistica Descriptiva Programa 2010 (Libro)

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4685 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4762 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4865 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4975 0.4975 0.4976 0.4977 0.4978 0.4978 0.4979 0.4980 0.4980 0.4981

2.9 0.4981 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993

3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995

3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997

3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998

3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998

3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.9 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

TABLA DISTRIBUCION BINOMIALn x 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.70 0.80 0.90

2 0 0.9025 0.8100 0.7225 0.6400 0.5625 0.4900 0.4225 0.3600 0.3025 0.2500 0.2025 0.1600 0.0900 0.0400 0.0100

  1 0.0950 0.1800 0.2550 0.3200 0.3750 0.4200 0.4550 0.4800 0.4950 0.5000 0.4950 0.4800 0.4200 0.3200 0.1800

  2 0.0025 0.0100 0.0225 0.0400 0.0625 0.0900 0.1225 0.1600 0.2025 0.2500 0.3025 0.3600 0.4900 0.6400 0.8100

3 0 0.8574 0.7290 0.6141 0.5120 0.4219 0.3430 0.2746 0.2160 0.1664 0.1250 0.0911 0.0640 0.0270 0.0080 0.0010

  1 0.1354 0.2430 0.3251 0.3840 0.4219 0.4410 0.4436 0.4320 0.4084 0.3750 0.3341 0.2880 0.1890 0.0960 0.0270

  2 0.0071 0.0270 0.0574 0.0960 0.1406 0.1890 0.2389 0.2880 0.3341 0.3750 0.4084 0.4320 0.4410 0.3840 0.2430

  3 0.0001 0.0010 0.0034 0.0080 0.0156 0.0270 0.0429 0.0640 0.0911 0.1250 0.1664 0.2160 0.3430 0.5120 0.7290

4 0 0.8145 0.6561 0.5220 0.4096 0.3164 0.2401 0.1785 0.1296 0.0915 0.0915 0.0410 0.0256 0.0081 0.0016 0.0001

  1 0.1715 0.2916 0.3685 0.4096 0.4219 0.4116 0.3845 0.3456 0.2995 0.2995 0.2005 0.1536 0.0756 0.0256 0.0036

  2 0.0135 0.0486 0.0975 0.1536 0.2109 0.2646 0.3105 0.3456 0.3675 0.3675 0.3675 0.3456 0.2646 0.1536 0.0486

  3 0.0005 0.0036 0.0115 0.0256 0.0469 0.0756 0.1115 0.1536 0.2005 0.2005 0.2995 0.3456 0.4116 0.4096 0.2916

  4 0.0000 0.0001 0.0005 0.0016 0.0039 0.0081 0.0150 0.0256 0.0410 0.0410 0.0915 0.1296 0.2401 0.4096 0.6561

5 0 0.7738 0.5905 0.4437 0.3277 0.2373 0.1681 0.1160 0.0778 0.0503 0.0313 0.0185 0.0102 0.0024 0.0003 0.0000

  1 0.2036 0.3281 0.3915 0.4096 0.3955 0.3602 0.3124 0.2592 0.2059 0.1563 0.1128 0.0768 0.0284 0.0064 0.0005

  2 0.0214 0.0729 0.1382 0.2048 0.2637 0.3087 0.3364 0.3456 0.3369 0.3125 0.2757 0.2304 0.1323 0.0512 0.0081

  3 0.0011 0.0081 0.0244 0.0512 0.0879 0.1323 0.1811 0.2304 0.2757 0.3125 0.3369 0.3456 0.3087 0.2048 0.0729

  4 0.0000 0.0005 0.0022 0.0064 0.0146 0.0284 0.0488 0.0768 0.1128 0.1563 0.2059 0.2592 0.3602 0.4096 0.3281

  5 0.0000 0.0000 0.0001 0.0003 0.0010 0.0024 0.0053 0.0102 0.0185 0.0313 0.0503 0.0778 0.1681 0.3277 0.5905

6 0 0.7351 0.5314 0.3771 0.2621 0.1780 0.1176 0.0754 0.0467 0.0277 0.0156 0.0083 0.0041 0.0007 0.0001 0.0000

Hernández Ayón, H y Casillas Barajas, A 117

Page 129: Estadistica Descriptiva Programa 2010 (Libro)

  1 0.2321 0.3543 0.3993 0.3932 0.3560 0.3025 0.2437 0.1866 0.1359 0.0938 0.0609 0.0369 0.0102 0.0015 0.0001

  2 0.0305 0.0984 0.1762 0.2458 0.2966 0.3241 0.3280 0.3110 0.2780 0.2344 0.1861 0.1382 0.0595 0.0154 0.0012

  3 0.0021 0.0146 0.0415 0.0819 0.1318 0.1852 0.2355 0.2765 0.3032 0.3125 0.3032 0.2765 0.1852 0.0819 0.0146

  4 0.0001 0.0012 0.0055 0.0154 0.0330 0.0595 0.0951 0.1382 0.1861 0.2344 0.2780 0.3110 0.3241 0.2458 0.0984

  5 0.0000 0.0001 0.0004 0.0015 0.0044 0.0102 0.0205 0.0369 0.0609 0.0938 0.1359 0.1866 0.3025 0.3932 0.3543

  6 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0018 0.0041 0.0083 0.0156 0.0277 0.0467 0.1176 0.2621 0.5314

7 0 0.6983 0.4783 0.3206 0.2097 0.1335 0.0824 0.0490 0.0280 0.0152 0.0078 0.0037 0.0016 0.0002 0.0000 0.0000

  1 0.2573 0.3720 0.3960 0.3670 0.3115 0.2471 0.1848 0.1306 0.0872 0.0547 0.0320 0.0172 0.0036 0.0004 0.0000

  2 0.0406 0.1240 0.2097 0.2753 0.3115 0.3177 0.2985 0.2613 0.2140 0.1641 0.1172 0.0774 0.0250 0.0043 0.0002

  3 0.0036 0.0230 0.0617 0.1147 0.1730 0.2269 0.2679 0.2903 0.2918 0.2734 0.2388 0.1935 0.0972 0.0287 0.0026

  4 0.0002 0.0026 0.0109 0.0287 0.0577 0.0972 0.1442 0.1935 0.2388 0.2734 0.2918 0.2903 0.2269 0.1147 0.0230

  5 0.0000 0.0002 0.0012 0.0043 0.0115 0.0250 0.0466 0.0774 0.1172 0.1641 0.2140 0.2613 0.3177 0.2753 0.1240

  6 0.0000 0.0000 0.0001 0.0004 0.0013 0.0036 0.0084 0.0172 0.0320 0.0547 0.0872 0.1306 0.2471 0.3670 0.3720

  7 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0006 0.0016 0.0037 0.0078 0.0152 0.0280 0.0824 0.2097 0.4783

8 0 0.6634 0.4305 0.2725 0.1678 0.1001 0.0576 0.0319 0.0168 0.0084 0.0039 0.0017 0.0007 0.0001 0.0000 0.0000

  1 0.2793 0.3826 0.3847 0.3355 0.2670 0.1977 0.1373 0.0896 0.0548 0.0313 0.0164 0.0079 0.0012 0.0001 0.0000

  2 0.0515 0.1488 0.2376 0.2936 0.3115 0.2965 0.2587 0.2090 0.1569 0.1094 0.0703 0.0413 0.0100 0.0011 0.0000

  3 0.0054 0.0331 0.0839 0.1468 0.2076 0.2541 0.2786 0.2787 0.2568 0.2188 0.1719 0.1239 0.0467 0.0092 0.0004

  4 0.0004 0.0046 0.0185 0.0459 0.0865 0.1361 0.1875 0.2322 0.2627 0.2734 0.2627 0.2322 0.1361 0.0459 0.0046

  5 0.0000 0.0004 0.0026 0.0092 0.0231 0.0467 0.0808 0.1239 0.1719 0.2188 0.2568 0.2787 0.2541 0.1468 0.0331

  6 0.0000 0.0000 0.0002 0.0011 0.0038 0.0100 0.0217 0.0413 0.0703 0.1094 0.1569 0.2090 0.2965 0.2936 0.1488

  7 0.0000 0.0000 0.0000 0.0001 0.0004 0.0012 0.0033 0.0079 0.0164 0.0313 0.0548 0.0896 0.1977 0.3355 0.3826

  8 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0007 0.0017 0.0039 0.0084 0.0168 0.0576 0.1678 0.4305

Hernández Ayón, H y Casillas Barajas, A 118

Page 130: Estadistica Descriptiva Programa 2010 (Libro)

TABLA DISTRIBUCION DE POISSONx 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 1.10 1.20 1.30 1.40 1.500 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 0.3679 0.3329 0.3012 0.2725 0.2466 0.2231

1 0.0905 0.1637 0.2222 0.2681 0.3033 0.3293 0.3476 0.3595 0.3659 0.3679 0.3662 0.3614 0.3543 0.3452 0.3347

2 0.0045 0.0164 0.0333 0.0536 0.0758 0.0988 0.1217 0.1438 0.1647 0.1839 0.2014 0.2169 0.2303 0.2417 0.2510

3 0.0002 0.0011 0.0033 0.0072 0.0126 0.0198 0.0284 0.0383 0.0494 0.0613 0.0738 0.0867 0.0998 0.1128 0.1255

4 0.0000 0.0001 0.0003 0.0007 0.0016 0.0030 0.0050 0.0077 0.0111 0.0153 0.0203 0.0260 0.0324 0.0395 0.0471

5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0020 0.0031 0.0045 0.0062 0.0084 0.0111 0.0141

6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 0.0005 0.0008 0.0012 0.0018 0.0026 0.0035

7 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0002 0.0003 0.0005 0.0008x 1.60 1.70 1.80 1.90 2.00 2.10 2.20 2.30 2.40 2.50 2.60 2.70 2.80 2.90 3.00

0 0.2019 0.1827 0.1653 0.1496 0.1353 0.1225 0.1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498

1 0.3230 0.3106 0.2975 0.2842 0.2707 0.2572 0.2438 0.2306 0.2177 0.2052 0.1931 0.1815 0.1703 0.1596 0.1494

2 0.2584 0.2640 0.2678 0.2700 0.2707 0.2700 0.2681 0.2652 0.2613 0.2565 0.2510 0.2450 0.2384 0.2314 0.2240

3 0.1378 0.1496 0.1607 0.1710 0.1804 0.1890 0.1966 0.2033 0.2090 0.2138 0.2176 0.2205 0.2225 0.2237 0.2240

4 0.0551 0.0636 0.0723 0.0812 0.0902 0.0992 0.1082 0.1169 0.1254 0.1336 0.1414 0.1488 0.1557 0.1622 0.1680

5 0.0176 0.0216 0.0260 0.0309 0.0361 0.0417 0.0476 0.0538 0.0602 0.0668 0.0735 0.0804 0.0872 0.0940 0.1008

6 0.0047 0.0061 0.0078 0.0098 0.0120 0.0146 0.0174 0.0206 0.0241 0.0278 0.0319 0.0362 0.0407 0.0455 0.0504

7 0.0011 0.0015 0.0020 0.0027 0.0034 0.0044 0.0055 0.0068 0.0083 0.0099 0.0118 0.0139 0.0163 0.0188 0.0216

8 0.0002 0.0003 0.0005 0.0006 0.0009 0.0011 0.0015 0.0019 0.0025 0.0031 0.0038 0.0047 0.0057 0.0068 0.0081

9 0.0000 0.0001 0.0001 0.0001 0.0002 0.0003 0.0004 0.0005 0.0007 0.0009 0.0011 0.0014 0.0018 0.0022 0.0027

10 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006 0.0008

11 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0002 0.0002x 3.10 3.20 3.30 3.40 3.50 3.60 3.70 3.80 3.90 4.00 4.10 4.20 4.30 4.40 4.50

0 0.0450 0.0408 0.0369 0.0334 0.0302 0.0273 0.0247 0.0224 0.0202 0.0183 0.0166 0.0150 0.0136 0.0123 0.0111

1 0.1397 0.1304 0.1217 0.1135 0.1057 0.0984 0.0915 0.0850 0.0789 0.0733 0.0679 0.0630 0.0583 0.0540 0.0500

2 0.2165 0.2087 0.2008 0.1929 0.1850 0.1771 0.1692 0.1615 0.1539 0.1465 0.1393 0.1323 0.1254 0.1188 0.1125

3 0.2237 0.2226 0.2209 0.2186 0.2158 0.2125 0.2087 0.2046 0.2001 0.1954 0.1904 0.1852 0.1798 0.1743 0.1687

4 0.1733 0.1781 0.1823 0.1858 0.1888 0.1912 0.1931 0.1944 0.1951 0.1954 0.1951 0.1944 0.1933 0.1917 0.1898

5 0.1075 0.1140 0.1203 0.1264 0.1322 0.1377 0.1429 0.1477 0.1522 0.1563 0.1600 0.1633 0.1662 0.1687 0.1708

6 0.0555 0.0608 0.0662 0.0716 0.0771 0.0826 0.0881 0.0936 0.0989 0.1042 0.1093 0.1143 0.1191 0.1237 0.1281

7 0.0246 0.0278 0.0312 0.0348 0.0385 0.0425 0.0466 0.0508 0.0551 0.0595 0.0640 0.0686 0.0732 0.0778 0.0824

8 0.0095 0.0111 0.0129 0.0148 0.0169 0.0191 0.0215 0.0241 0.0269 0.0298 0.0328 0.0360 0.0393 0.0428 0.0463

9 0.0033 0.0040 0.0047 0.0056 0.0066 0.0076 0.0089 0.0102 0.0116 0.0132 0.0150 0.0168 0.0188 0.0209 0.0232

10 0.0010 0.0013 0.0016 0.0019 0.0023 0.0028 0.0033 0.0039 0.0045 0.0053 0.0061 0.0071 0.0081 0.0092 0.0104

11 0.0003 0.0004 0.0005 0.0006 0.0007 0.0009 0.0011 0.0013 0.0016 0.0019 0.0023 0.0027 0.0032 0.0037 0.0043

12 0.0001 0.0001 0.0001 0.0002 0.0002 0.0003 0.0003 0.0004 0.0005 0.0006 0.0008 0.0009 0.0011 0.0013 0.0016

13 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0001 0.0002 0.0002 0.0002 0.0003 0.0004 0.0005 0.0006x 4.60 4.70 4.80 4.90 5.00 5.10 5.20 5.30 5.40 5.50 5.60 5.70 5.80 5.90 6.00

0 0.0101 0.0091 0.0082 0.0074 0.0067 0.0061 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025

1 0.0462 0.0427 0.0395 0.0365 0.0337 0.0311 0.0287 0.0265 0.0244 0.0225 0.0207 0.0191 0.0176 0.0162 0.0149

2 0.1063 0.1005 0.0948 0.0894 0.0842 0.0793 0.0746 0.0701 0.0659 0.0618 0.0580 0.0544 0.0509 0.0477 0.0446

3 0.1631 0.1574 0.1517 0.1460 0.1404 0.1348 0.1293 0.1239 0.1185 0.1133 0.1082 0.1033 0.0985 0.0938 0.0892

4 0.1875 0.1849 0.1820 0.1789 0.1755 0.1719 0.1681 0.1641 0.1600 0.1558 0.1515 0.1472 0.1428 0.1383 0.1339

5 0.1725 0.1738 0.1747 0.1753 0.1755 0.1753 0.1748 0.1740 0.1728 0.1714 0.1697 0.1678 0.1656 0.1632 0.1606

6 0.1323 0.1362 0.1398 0.1432 0.1462 0.1490 0.1515 0.1537 0.1555 0.1571 0.1584 0.1594 0.1601 0.1605 0.1606

7 0.0869 0.0914 0.0959 0.1002 0.1044 0.1086 0.1125 0.1163 0.1200 0.1234 0.1267 0.1298 0.1326 0.1353 0.1377

Hernández Ayón, H y Casillas Barajas, A 119

Page 131: Estadistica Descriptiva Programa 2010 (Libro)

PASOS DEL MÉTODO CIENTÍFICO:

1. Observación : Observar es aplicar atentamente los sentidos a un objeto o a un fenómeno, para estudiarlos tal como se presentan en realidad, puede ser ocasional o causalmente.

2. Inducción : La acción y efecto de extraer, a partir de determinadas observaciones o experiencias particulares, el principio particular de cada una de ellas.

3. Hipótesis : Planteamiento mediante la observación siguiendo las normas establecidas por el método científico.

4. Probar la hipótesis por experimentación. 5. Demostración o refutación (antítesis) de la hipótesis. 6. Tesis o teoría científica (conclusiones).

Hernández Ayón, H y Casillas Barajas, A 120

Page 132: Estadistica Descriptiva Programa 2010 (Libro)

Con la segunda formula quedaría: (DATOS NO AGRUPADOS)

N X X21 38 1,44

42 26 6763 13 1694 41 1,68

15 22 484

140

4,454

Para la muestra

Usando la segunda fórmula (DATOS AGRUPADOS)

Kilómetros recorridas

(clases)(f)

Kilómetros

PromedioMarca de

clase(X)

fX Fx2

0 y menos de 2

21 2 2

2 y menos de 4

53 15 45

4 y menos de 6

45 20 100

6 y menos de 8

87 56 392

8 y menos de 10

19 9 81

Sumatorias 20

102

620

Hernández Ayón, H y Casillas Barajas, A 121

Page 133: Estadistica Descriptiva Programa 2010 (Libro)

P(SELLO)0 1/

80.125

1 3/8

0.375

2 3/8

0.375

3 1/8

0.125

SUMA

1.000

ESPACIO MUESTRAL (POSIBLES RESULTADOS)23 = 8AAA AAS ASA SAASSS SSA SAS ASS

Únicamente se encuentra un resultado sin sello que es AAATres resultados con un selloTres resultados con dos sellosY un resultado con 3 sellos.

Hernández Ayón, H y Casillas Barajas, A 122