estadistica

93
INSTITUTO LATINOAMERICANO DE CIENCIA Y ARTES, A. C. ESCUELA DE CIENCIAS POLITICAS Y ADMINISTRACION PÚBLICA SISTEMA UNIVERSIDAD ABIERTA ESTADÍSTICA Guía de Estudio Cuarto Semestre Ciencias Políticas y Administración Pública 2007

Upload: jose-martin-pereira-ortega

Post on 29-Jun-2015

1.514 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Estadistica

INSTITUTO LATINOAMERICANO DE CIENCIA Y ARTES, A. C.

ESCUELA DE CIENCIAS POLITICAS Y ADMINISTRACION PÚBLICA SISTEMA UNIVERSIDAD ABIERTA

ESTADÍSTICA

Guía de Estudio Cuarto Semestre

Ciencias Políticas y Administración Pública

2007

Page 2: Estadistica

Datos curriculares de la asignatura

Asignatura: EstadísticaLicenciatura: Ciencias Políticas y Administración

Pública Semestre: Cuarto Área: Técnica-Instrumental Secuencia: Investigación de Operaciones Carácter: Obligatoria Créditos: 08 Clave: 0427

Page 3: Estadistica

PRESENTACIÓN

El Instituto Latinoamericano de Ciencia y Artes, A. C. inicia la implantación del Sistema Universidad Abierta en el año de 2007 como una opción educativa en la que el énfasis está en el aprendizaje más que en la enseñanza.

El Sistema Universidad Abierta forma parte de un amplio proceso

de adecuación académica y organizativa cuyo fin es responder con mayor calidad y eficacia tanto a las necesidades sociales y profesionales de la localidad como a la creciente demanda educativa, en general, y del ILCA en particular.

El propósito de esta opción educativa universitaria reside en que el estudiante se involucre en un proceso amplio y abierto de comunicación y de relación con su entorno -social, escolar/académico, laboral, familiar, cultural- aprendiendo a integrar el conocimiento relevante en ciertas materias, a combinar y adquirir capacidades, destrezas y hábitos de estudio, experiencias de aprendizaje permanente e independiente a fin de lograr una formación universitaria suficiente para el ejercicio profesional de la carrera que haya elegido.

Para esta nueva modalidad, nuestra Institución ha llevado a cabo diferentes acciones encaminadas a alcanzar una mayor calidad y eficacia del aprendizaje que demandan los estudiantes de los sistemas educativos abiertos.

Sabemos que la relación entre tutores-docentes, material didáctico y estudiantes es fundamental en esta opción abierta. Mientras mayor sea la calidad y rigor académico de los tutores-docentes y de los alumnos, y mientras más amplia sea la oferta de materiales educativos para promover el aprendizaje independiente, mayor será la posibilidad de formar estudiantes autodidactas, competentes y futuros profesionales universitarios.

Page 4: Estadistica

Con objeto de satisfacer lo anterior, se han organizado sesiones de trabajo con los tutores-profesores para la preparación de materiales didácticos escritos y audiovisuales; se ha diseñado e impartido un curso de actualización didáctica para los tutores/profesores y han participado en la planeación y preparación del curso de introducción a la metodología de estudio para los alumnos, acorde con opción educativa.

Por consiguiente, esta guía de estudio constituye un instrumento fundamental para el aprendizaje independiente en un sistema abierto. Cada uno de los componentes que integran esta guía tiene una correspondencia directa con los distintos momentos del proceso de aprendizaje; han sido integrados en una secuencia lógica con el fin de que el estudiante pueda avanzar y profundizar en el conocimiento, así como alcanzar los objetivos académicos de las asignaturas contando con la orientación, guía y estímulo experimentado del tutor/docente.

Los contenidos de la guía son perfectibles y deben ser revisados

periódicamente para su actualización y mayor efectividad. Las observaciones que resulten de las experiencias de los tutores/docentes y de los estudiantes nos permitirán, sin duda, enriquecer y mejorar esta herramienta didáctica que ahora está en sus manos. Las aportaciones que nos hagan llegar conducirán a seguir avanzando en fortalecer el sistema abierto de nuestra Institución de la que ahora forma parte.

Damos a usted la más cordial bienvenida y deseamos que realice

con empeño, responsabilidad y éxito sus estudios en el Sistema Universidad Abierta del Instituto Latinoamericano de Ciencia y Artes, A. C.

Sistema Universidad Abierta Escuela de Ciencias Políticas y Administración Pública

Page 5: Estadistica

SUGERENCIAS PARA LA UTILIZACIÓN DE LA GUÍA DE ESTUDIO

La presente guía de estudio ha sido elaborada con el propósito de que usted trabaje en forma independiente, es decir, sin la presencia continua del tutor. Ello significa, que durante el curso deberá responsabilizarse plenamente del estudio y el trabajo de los contenidos académicos según las indicaciones de esta guía. De este modo, estará en condiciones de solicitar y participar óptimamente en las sesiones de tutoría.

Con el objeto de lograr un mejor aprovechamiento de la guía de estudio, es importante que tenga conocimiento de lo siguiente:

La guía está organizada en unidades temáticas y presenta una serie de componentes didácticos que le permitirán orientar su aprendizaje: las introducciones de cada unidad lo relacionan con las temáticas centrales que integran el curso; los objetivos de la unidad indican los aspectos relevantes del conocimiento que usted tiene que lograr; con la lectura de la bibliografía básica obligatoria podrá conocer, analizar y comprender ampliamente los temas del curso; con la realización de las actividades de aprendizaje y las preguntas de evaluación sugeridas, usted podrá apropiarse de los conocimientos y valorar sus resultados en el aprendizaje.

La guía incluye, asimismo, una programación tentativa entre el número de unidades de aprendizaje y el número de sesiones de tutoría programadas por semestre, con la finalidad de que usted siga un ritmo adecuado en el estudio y en la realización de sus actividades, evitando retrasos o atiborramientos perjudiciales.

Por último, presenta un formato para registrar los criterios de evaluación y acreditación que normarán el curso. Esta actividad deberá realizarse junto con el tutor. El conocimiento inicial de estos criterios le será de gran utilidad para organizarse apropiadamente y llevar a buen término el curso.

Page 6: Estadistica

Algunas recomendaciones en el uso de esta guía son las siguientes:

o Trabaje las unidades de aprendizaje según el orden secuencial que presentan: no se salte ni adelante unidades. Inicie con la lectura de las introducciones y reflexione sobre los objetivos de aprendizaje que se le ponen.

o Lea los textos mencionados en la bibliografía básica en el orden en

que aparecen; después, realice las actividades de aprendizaje. No dude en ampliar y enriquecer su información consultando también la bibliografía complementaria.

o Al concluir el estudio de una unidad, conteste las preguntas de

evaluación, ello le permitirá valorar sus logros. Si encuentra que algún tema no le es suficientemente claro, revíselo nuevamente y consulte al tutor precisando con antelación sus dudas.

o Revise desde el inicio del curso los datos de la bibliografía básica y

complementaria de cada unidad y enliste los libros más solicitados. Es recomendable que los compre a fin de ir integrando su biblioteca personal. Al respecto puede pedir orientación al tutor.

o Realice siempre anotaciones a lo largo de las lecturas, escriba las

preguntas y dudas que vayan surgiendo: si estás no son contestadas al término de la lectura, busque ahondar en el tema auxiliándose de otros, discutiendo con sus compañeros o recurriendo a su tutor.

Recuerde que la modalidad educativa de estudios abiertos requiere un gran esfuerzo, compromiso y disciplina personal: haga una buena planeación de sus actividades personales y de su tiempo, ejercítese en el empleo de estrategias y técnicas de estudio, ponga en práctica hábitos pertinentes para el estudio y la investigación, no dude en pedir apoyo u orientación cuando lo requiera. Estamos seguros que con todo ello usted se convertirá en un estudiante exitoso; un estudiante SUA.

Sistema Universidad Abierta CPyAP

Page 7: Estadistica

ÍNDICE

Introducción general 11

Objetivos generales 13

Criterios de evaluación-acreditación 14

Cuadro programático de tutorías 15

Unidad 1. Datos y descripción (estadística descriptiva) 17

Unidad 2. Modelos de probabilidad (estadística inferencial) 27

Unidad 3. Dependencia probabilística 33

Unidad 4. Introducción al teorema del límite central y estimación 39

Anexo: Respuestas a las preguntas de autoevaluación 45

Bibliografía general 89

Page 8: Estadistica

Ciencias Políticas y Administración Pública

10

Page 9: Estadistica

Estadística

11

Introducción general

La Estadística es el conjunto de técnicas que se emplean para la recolección,

organización, análisis e interpretación de datos. Los datos pueden ser cuantitativos, con

valores expresados numéricamente o cualitativos, en cuyo caso se tabulan las características

de las observaciones. La estadística nos sirve para tomar mejores decisiones a partir de la

comprensión de las fuentes de variación y de la detección de patrones y relaciones en datos

económicos y administrativos.

La Estadística descriptiva está conformada por un conjunto de técnicas que se

utilizan para organizar y evaluar la información proveniente de una masa de datos. Con

estas técnicas es posible obtener distribuciones, gráficas y parámetros que permiten conocer

y cuantificar el comportamiento global.

La Estadística descriptiva intenta representar el comportamiento de una masa de

datos a través de parámetros que indiquen las tendencias más representativas de éstos. Es

importante reconocer que la información individual no tiene un significado estadístico, por

ello todos los parámetros estadísticos requieren al menos dos datos para evaluarse. Esta

consideración implica que siempre que se realice la evaluación u organización de la

información, se pierde el dato individual, éste pasa a formar parte del comportamiento

global representado a través de parámetros o gráficos.

Page 10: Estadistica

Ciencias Políticas y Administración Pública

12

La Estadística inferencial comprende las técnicas con las que, con base únicamente

en una muestra sometida a observación, se toman decisiones sobre una población o proceso

estadístico. Dado que estas decisiones se toman en condiciones de incertidumbre, suponen

el uso de conceptos de probabilidad.

Mientras que a las características medidas de una muestra se les llama estadísticas

muestrales, a las características medidas de una población estadística, o universo, se les

llama parámetros de la población. El procedimiento para la medición de las características

de todos los miembros de una población definida se llama censo. Cuando la inferencia

estadística se usa en el control de procesos, al muestreo le interesa en particular el

descubrimiento y control de las fuentes de variación en la calidad de la producción.

Page 11: Estadistica

Estadística

13

Objetivos generales

1. Seleccionar el método más apropiado para organizar la información.

2. Seleccionar el método gráfico más adecuado para representar la información

estadística.

3. Identificar y evaluar los distintos parámetros de la Estadística.

4. Comprender el manejo de los conceptos de la Estadística inferencial.

5. Aplicar las técnicas de la inferencia estadística.

Page 12: Estadistica

Ciencias Políticas y Administración Pública

14

Criterios de evaluación – acreditación

CRITERIO PORCENTAJE CONDICIONES

• El alumno deberá presentar tres exámenes parciales. Podrá reponer uno de ellos,

sólo en caso de haber aprobado por lo menos dos, con la finalidad de mejorar la

calificación del que no acreditó.

Page 13: Estadistica

Estadística

15

Cuadro programático de tutorías

Sesión Unidad de Aprendizaje

Temas

1

Presentación del programa. Introducción general al curso. Formas de trabajo. Criterios de evaluación.

2

Unidad 1. Datos y descripción (estadística descriptiva)

1. Organización y representación gráfica de la información

1.1 La información estadística 1.2 Variable 1.3 Organización de la información 1.4 Representación gráfica de la información

3

2. Evaluación de parámetros

2.1 Medidas de tendencia central 2.2 Medidas de posición 2.3 Medidas de dispersión 2.4 Medidas de concentración

4 Primer examen parcial

5

Unidad 2. Modelos de probabilidad (estadística inferencial)

1. Definición clásica y estadística de probabilidad 2. Probabilidad matemática

2.1 Experimentos aleatorios 2.2 Espacio de eventos

3. Elementos de la teoría de las probabilidades 3.1 Definición y axiomas 3.2 Propiedades 3.3 Sucesos mutuamente excluyentes y sucesos independientes 3.4 Regla de la adición 3.5 Regla de la multiplicación (probabilidad condicional) 3.6 Teorema de la probabilidad total 3.7 Teorema de Bayes 3.8 Análisis combinatorio 3.9 Permutaciones 3.10 Combinaciones

Page 14: Estadistica

Ciencias Políticas y Administración Pública

16

Sesión Unidad de Aprendizaje Temas

6

Unidad 3. Dependencia probabilística

1. Variable aleatoria 2. Distribución de probabilidad univariada, discreta y

continua 2.1 Función de distribución de probabilidad 2.2 Función de densidad de probabilidad 2.3 Propiedades y medidas de asociación de las distribuciones de probabilidad

3. Distribuciones discretas 3.1 Binomial 3.2 Hipergeométrico 3.3 Poisson

4. Distribuciones continuas 4.1 Normal

7

Segundo examen parcial

8

Unidad 4. Introducción al teorema del límite central y estimación

1. Teorema del límite central 2. Estimación

2.1 Estimación puntual 2.2 Estimador insesgado 2.3 Estimador consistente 2.4 Estimador eficiente 2.5 Estimador suficiente

9

3. Métodos de estimación

3.1 Estimación por intervalos 4. Cálculo del tamaño de la muestra

10

Tercer examen parcial, aclaración de calificaciones y reposición de alguno de los exámenes anteriores

Page 15: Estadistica

Estadística

17

Unidad 1. Datos y Descripción (estadística descriptiva) Introducción

En esta unidad, se presentan un conjunto de técnicas que comúnmente se utilizan

para organizar la información con fines estadísticos, así como para representarla

gráficamente con el propósito de visualizar el comportamiento global.

Este material tal vez no agote toda la gama de posibilidades para la organización y

representación gráfica, pero sí cubre los principales métodos utilizados en la Estadística

descriptiva y en la paquetería para PC.

Uno de los aspectos que forman parte de la Estadística descriptiva es el estudio de

las reglas y procedimientos para la recolección, organización y procesamiento de

información.

Los datos, que representan la materia prima para la Estadística, se obtienen a través

de encuestas, observaciones, experimentos o de información contenida en estudios previos.

La captación de información a través de encuestas se utiliza típicamente en el

levantamiento de censos o muestras.

Un censo es la indagación de las características de todos los elementos que

componen a la población en estudio, mientras que una muestra es una indagación

restringida a unos cuantos de los elementos que constituyen a la población en estudio.

Page 16: Estadistica

Ciencias Políticas y Administración Pública

18

Una encuesta es el instrumento mediante el cual se recopila la información que se

desea obtener de una población sin ejercer ningún control sobre las variables que se desean

estudiar. Por ejemplo:

a) El ingreso mensual de los alumnos del Instituto Latinoamericano de Ciencia y

Artes, A. C.

b) La inversión anual de las empresas que producen partes automotrices.

c) El Producto Interno Bruto.

A diferencia de la encuesta, en un experimento se controla el comportamiento de

alguna(s) variable(s), para analizar el cambio que sufre(n) otra(s), por ejemplo:

a) Estudiar la preferencia de los consumidores a distintos tipos de presentación de un

producto.

b) Estudiar la conductividad térmica de un sólido variando la temperatura.

c) Estudiar la respuesta de individuos a una nueva droga, variando la dosis

suministrada.

Las formas de obtener información son muy diversas, dependen del tipo de estudio

que se pretende llevar a cabo. Así, las técnicas a utilizar en cada caso son muy distintas, no

es igual realizar un muestreo que un censo o que un experimento.

La organización de la información y su representación gráfica son de gran utilidad

porque permiten apreciar de manera general el comportamiento del fenómeno en

consideración. Sin embargo, la organización por sí sola carece de objetividad sin la

evaluación de parámetros que cuantifiquen el comportamiento estadístico de la

información. Por esta razón, en esta unidad se aborda el tema de los parámetros

estadísticos, sin los cuales la gran masa de datos ordenados puede carecer de sentido al no

poderse interpretar, que es el objetivo principal de la Estadística descriptiva.

Page 17: Estadistica

Estadística

19

Temario

1. Organización y representación gráfica de la información

1.1 La información estadística

1.2 Variable

1.3 Organización de la información

1.3.1 Serie simple de datos

1.3.2 Distribución de clases y frecuencias

1.3.3 Distribución por intervalos de clases y frecuencias

1.4 Representación gráfica de la información

1.4.1 Diagramas de pastel

1.4.2 Histograma y polígono de frecuencias

1.4.3 Ojivas

2. Evaluación de parámetros

2.1 Medidas de tendencia central

2.1.1 Moda

2.1.2 Mediana

2.1.3 Media aritmética

2.1.4 Media geométrica

2.1.5 Media armónica

2.2 Medidas de posición

2.2.1 Cuantiles

2.3 Medidas de dispersión

2.3.1 Rango

2.3.2 Varianza y desviación típica

2.3.3 Coeficiente de variación

2.3.4 Coeficiente de asimetría

2.3.5 Coeficiente de curtosis

2.4 Medidas de concentración

2.4.1 Curva de Lorenz

2.4.2 Índice de Gini

Page 18: Estadistica

Ciencias Políticas y Administración Pública

20

Objetivos de la unidad

1. Identificar cuándo una variable es cuantitativa y cuándo cualitativa.

2. Diferenciar un valor observado de uno posible.

3. Organizar una serie simple de datos en una distribución de frecuencias.

4. Organizar una distribución de frecuencias en una de intervalos de clases y

frecuencias.

5. Construir diagramas de pastel, histogramas, polígonos de frecuencia y ojivas de

diversos tipos.

6. Establecer la diferencia entre una medida de:

• Tendencia Central

• Posición

• Dispersión

• Concentración

7. Conocer el procedimiento de cálculo y el significado de las siguientes medidas de,

para una serie simple de datos o para datos agrupado:

• Tendencia central (media, mediana, moda, media armónica y media

geométrica)

• Posición (cuantiles)

• Dispersión (rango, varianza y coeficiente de variación)

• Concentración (índice de Gini)

8. Calcular la asimetría y la curtosis de una serie simple de datos o de datos grupados.

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México, Siglo XXI, 1990. HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales. México, FCPyS-UNAM (Serie Estudios, núm. 13), 1970. SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

Page 19: Estadistica

Estadística

21

Actividades de aprendizaje

1. De la siguiente lista de variables indique con una letra Q si es cuantitativa y con una

C si es cualitativa.

a) La edad de un individuo

b) La religión de una persona

c) La temperatura

d) El clima

e) La humedad

f) La belleza

g) La escolaridad de una persona

h) El PIB

i) La nacionalidad

j) El estado civil

2. De la siguiente lista de variables indique con una D si es discreta o con una C si es

continua.

a) Salario de un individuo (en pesos).

b) Estatura de una persona (en mieras).

c) Producto Interno Bruto.

d) El índice de Precios al Consumidor

e) El número de automóviles que circulan por una carretera en un día

f) El número de personas atendidas en un hospital en un día

3. La inversión anual de un grupo de industrias textiles es la siguiente (en miles de pesos)

10, 12, 8, 40, 6, 8, 10, 30, 2, 8, 6, 14, 16, 20, 25, 28, 30, 26, 30, 4, 6, 10, 18, 17, 13, 17, 21, 7, 6, 8, 14, 7, 15, 19, 27, 22, 0, 14, 6, 8, 9, 11, 13, 15, 18, 20, 30, 60, 12, 6, 5, 5, 6, 8, 7, 12, 15, 36, 30, 52

a) Construya una distribución de clases y frecuencias (absolutas y relativas) con

ocho intervalos de 8 unidades de longitud.

b) Calcule las frecuencias acumuladas de cada clase.

c) Construya un histograma y un polígono con las frecuencias absolutas y las

relativas.

Page 20: Estadistica

Ciencias Políticas y Administración Pública

22

4. El número de accidentes de trabajo semanales por mil horas-hombre, de una fábrica

durante un año es:

Mes Accidentes Mes Accidentes Enero 3, 3.2, 3.7, 3.7 Julio 3, 2.9, 3.5, 3.1 Febrero 2.8, 3.7, 3.3, 4 Agosto 3.1, 2.7, 2.8, 3.4 Marzo 3.2, 3.9, 2.9, 3.8, 3.3 Septiembre 2.4, 3.3, 4.6, 3.3, 4.3 Abril 3.2, 1.8, 5.3, 2.6 Octubre 2.1,3.5,4,3.6 Mayo 4, 3.9, 4.4, 3.2 Noviembre 3.2, 2.5, 3.4, 3.4 Junio 3.8, 4.7, 2.3, 4.3, 4.2 Diciembre 3.5. 3.7, 3.6, 3.5, 2.6

a) Construye la distribución de clases y frecuencias (absolutas y relativas), con 8

intervalos de longitud 0.5.

b) Calcule las frecuencias acumuladas relativas y absolutas por clase.

c) Dibuje el histograma y el polígono con frecuencias relativas y absolutas.

5. De acuerdo con el censo nacional de población de 1970, la población

económicamente activa de 12 años y más por grupos quinquenales de edad fue:

GRUPO QUINQUENAL DE EDAD (AÑOS)

F (NO. DE INDIVIDUOS)

De 12 a 14 339,615 De 15 a 19 1,783,772 De 20 a 24 2,042,290 De 25 a 29 1,719,700 De 30 a 34 1,403,740 De 35 a 39 1,366,196 De 40 a 44 1,058,956 De 45 a 49 911,326 De 50 a 54 639,951 De 55 a 59 531,732 De 60 a 64 454,205 De 65 a 69 326,399 De 70 a 74 201,376 De 75 y más 178,799 Total 12,955,057

Encuentre:

a) Límite superior e inferior de cada clase.

b) Límite superior e inferior real de cada clase.

c) Punto medio por clase.

d) Rango de cada clase.

Page 21: Estadistica

Estadística

23

e) Frecuencias relativas por clase.

f) Frecuencias acumuladas por clase.

g) Frecuencias relativas y acumuladas por clase,

h) Frecuencias porcentuales por clase.

Grafique:

a) El histograma absoluto y el porcentual.

b) El polígono de frecuencias absoluto y el porcentual.

c) La ojiva P.M. vs far.

d) La ojiva más de...

e) La ojiva menos de...

De la ojiva del inciso c responda las siguientes preguntas:

a) Aproximadamente cuántos individuos son mayores de edad (más de 18 años).

b) Aproximadamente cuántos individuos tienen más de 43 años.

c) Aproximadamente cuántos individuos tienen menos de 30 años.

6. De acuerdo con el censo nacional de población de 1970, la población

económicamente activa de 12 años y más por grupos de ingreso mensual fue:

Grupo de ingreso mensual (pesos)

Total nacional (núm. de individuos)

Hasta 99 983,167 De 100 a 199 1’143,200 De 200 a 299 1'261,656 De 300 a 499 1'811,073 De 500 a 599 603,157 De 600 a 999 2'531,144 De 1,000 a 1,199 682,605 De 1,200 a 1,499 790,718 De 1,500 a 1,999 657,008 De 2,000 a 2,499 293,995 De 2,500 a 3,499 324,356 De 3,500 a 4,999 231,012 De 5,000 a 7,499 117,766 De 7,500 a 9,999 82,326 De 10,000 a 14,999 37,828 De 15,000 y más 69,458 Total 11'620,469

Page 22: Estadistica

Ciencias Políticas y Administración Pública

24

De acuerdo con el censo nacional de población de 1980, la población

económicamente activa por grupos de ingreso mensual fue:

Grupo de ingreso mensual (pesos)

Total Nacional (No. de individuos)

De 1 a 590 663,523 De 591 a 1,080 924,692 De 1,081 a 1,970 1'174,108 De 1,971 a 3,610 2'828,538 De 3,611 a 6,610 4,557,499 De 6,611 a 12,110 2'575,653 De 12,111 a 22,170 878,397 De 22,171 y más 451,217 Total 14'053,627

a) Con los datos anteriores construya una ojiva de P.M. vs fa, para cada uno de los

censos. Haga las comparaciones pertinentes.

b) De la ojiva para 1970 estime el porcentaje de la PEA cuyos ingresos son:

i. superiores a $300.

ii. inferiores a $1500.

iii. entre $400 y $1200.

c) Construya las tablas de cada censo utilizando salarios reales, en unidades

monetarias de la base del índice de Precios al Consumidor y haga algunas

comparaciones generales entre cada censo.

Preguntas de evaluación

1. Explique lo que entiende por:

• variable

• constante

• valor posible

• valor observado

2. ¿Cuándo se dice que una variable es cualitativa y cuándo cuantitativa?

3. ¿En qué consiste una serie simple de datos?

4. ¿En qué consiste una distribución de frecuencias?

Page 23: Estadistica

Estadística

25

5. ¿Cómo se obtiene una distribución de clases y frecuencias?

6. ¿Qué representa el punto medio?

7. ¿Cómo se construye un diagrama de pastel?

8. ¿Qué diferencia hay entre los histogramas para:

a) Una serie simple de datos.

b) Una distribución de frecuencias.

c) Una distribución de clases y frecuencias?

9. ¿Qué es una ojiva y cuántos tipos de ojivas se pueden construir?

10. ¿.Cuáles son las diferentes medidas de tendencia central?

11. ¿Cuáles son las diferentes medidas de Posición?

12. ¿Cuáles son las diferentes medidas de Dispersión?

13. ¿Cómo son los Coeficientes de Asimetría y de Curtosis?

14. ¿Qué es una medida de Concentración?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill, 1985. MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo Editorial Iberoamericano, 1990. SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

Page 24: Estadistica

Ciencias Políticas y Administración Pública

26

Page 25: Estadistica

Estadística

27

Unidad 2. Modelos de probabilidad (estadística inferencial)

Introducción

El comportamiento de ciertos fenómenos sociales no puede determinarse con

exactitud debido a su naturaleza aleatoria, por lo que para estudiarlos podemos utilizar

como herramienta la teoría de probabilidades, ya que ésta proporciona modelos

matemáticos que podemos adecuar para cada fenómeno en cuestión, es decir, el estudio de

la teoría de probabilidades nos mostrará las posibilidades que se tienen en función a

diferentes modelos (distribuciones de probabilidad), de elaborar el modelo matemático que

describa con bastante aproximación el comportamiento del fenómeno aleatorio.

En concreto, hemos dicho que dado un fenómeno aleatorio, podemos ajustar un

modelo matemático que describa su comportamiento en forma aproximada, para que de

esta manera, podamos determinar los parámetros que caractericen a nuestro fenómeno, a

través de los parámetros del modelo (media, varianza, desviación estándar, etc.). Este

proceso sólo es posible debido al estudio del comportamiento de ciertos fenómenos

aleatorios, determinando la ley de probabilidades que tienden a seguir, para, de esta forma,

establecer la confiabilidad en los resultados del fenómeno en estudio, determinar el número

de experimentos necesarios para obtener resultados confiables, probar los resultados bajo

ciertos supuestos, o bien, predecir su comportamiento en relación con los experimentos

realizados.

Page 26: Estadistica

Ciencias Políticas y Administración Pública

28

Es a partir del cálculo de probabilidades donde la Estadística ha adquirido un

amplio desarrollo, puesto que ha dado lugar a la Inferencia Estadística, es decir, la

estadística se convierte en una técnica inductiva, que por medio del estudio de una parte de

la población puede conocer, en forma aproximada, el comportamiento de la misma.

Page 27: Estadistica

Estadística

29

Temario

1. Definición clásica y estadística de probabilidad

2. Probabilidad matemática

Experimentos aleatorios

Espacio de eventos

3. Elementos de la teoría de las probabilidades

Definición y axiomas

Propiedades

Sucesos mutuamente excluyentes y sucesos independientes

Regla de la adición

Regla de la multiplicación (probabilidad condicional)

Teorema de la probabilidad total

Teorema de Bayes

Análisis combinatorio

Permutaciones

Combinaciones

Objetivos de la unidad

1. Señalar cuál es la diferencia existente entre la definición clásica y la estadística de

probabilidades.

2. Explicar, con sus propias palabras, el concepto de modelo matemático.

3. Diferenciar los diversos conceptos probabilísticos tratados en la presente unidad.

4. Manejar, dado algunos problemas específicos, correctamente las reglas de adición y

multiplicación.

5. Resolver un problema, utilizando el teorema de Bayes.

Page 28: Estadistica

Ciencias Políticas y Administración Pública

30

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México, Siglo XXI, 1990. HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales. México, FCPyS-UNAM (Serie Estudios, 13), 1970. SPIEGEL, Murray. Estadística. México, Mc Graw Hill (Serie Schaum's), 1970.

Actividades de aprendizaje

1. Explique la definición clásica de probabilidad.

2. Explique la definición estadística de probabilidad.

3. ¿Qué entiende por modelo matemático?

4. ¿Qué entiende por fenómeno aleatorio?

5. ¿Qué entiende por espacio de eventos?

6. Si denominamos a águila por A y sol por S en una moneda equilibrada, indique cuál

es el espacio de eventos del lanzamiento de 3 monedas.

7. Si el conjunto A está formado por los siguientes elementos:

A = 0, 3, 5, 7 y el B = 0, 1, 2, 4 encuentre:

A∩B, A∪B, Ac y Bc

8. Si el universo está formado por los números enteros U= {...., -2, -1, 0, 1, 2, ...,}

Encuentre la probabilidad de hallar al menos un 3 en 2 lanzamientos de un dado.

9. Si se lanzan simultáneamente 2 dados, ¿Cuál será la probabilidad de que los puntos

sumen 10?

10. Si se extraen 2 bolas al azar de una urna que contiene 10 bolas rojas, 30 bolas

blancas, 20 azules y 15 naranjas, halle la probabilidad de que: (para todos los casos

la selección se considerará con reemplazo y sin reemplazo)

a) Ambas sean blancas.

b) Una blanca y una roja.

c) Ninguna sea naranja.

d) Las 2 sean blancas o rojas o de ambos colores.

e) La segunda no sea azul.

Page 29: Estadistica

Estadística

31

f) La primera sea naranja.

g) Al menos una sea azul.

h) No más de una roja.

11. Dos dados son tirados n veces en forma sucesiva ¿cuál es la probabilidad de obtener

al menos una vez el evento (6, 6)?

12. Se extraen 4 cartas al azar de 52, se desea calcular la probabilidad de:

a) Extraer un as exactamente.

b) La probabilidad de al menos un as.

c) La probabilidad de ningún as.

13. Suponga que se tienen 2 fábricas. Sea A1 el suceso de fabricación de herramientas en

la fábrica 1, y sea A2 el suceso de fabricación de herramientas en la fábrica 2. Sea X

el suceso que representa una herramienta defectuosa. Si la probabilidad de

encontrar una herramienta defectuosa en la fábrica 1 es 3/5 y en la fábrica 2 es 2/3

¿Cuál es la probabilidad de encontrar una herramienta defectuosa?

14. Suponga que se tienen 2 urnas, la primera que contiene 10 bolas blancas y 5 bolas

rojas, y la segunda que contiene 3 blancas y 3 rojas. ¿Qué probabilidad existe de

que la bola blanca sea de la primera urna?

15. Muestre mediante un diagrama de árbol los ordenamientos que pueden hacerse de 4

libros tomados de 3 en 3, sin repetición. Suponiendo que A, B, C y D son los libros.

16. ¿Cuántos ordenamientos de 5 estudiantes (1, 2, 3, 4, 5) podemos hacer al colocarlos

de 2 en 2, sin repetirlos, y cuántos repitiéndolos?

17. ¿De cuántas maneras podemos elegir 4 personas de un total de 9, si nos interesa el

puesto que ocupan (Director, Subdirector, etc.)?

18. ¿De cuántas formas diferentes pueden ser colocadas en una fila de 5 lugares, 5

personas?

19. ¿De cuántas maneras pueden colocarse 8 torres en un tablero de ajedrez, de manera

que ninguna de las 8 torres se “coman”?

20. Con 5 estadísticos y 6 economistas quiere formarse un comité de 3 estadísticos y 2

economistas ¿cuántos comités diferentes pueden formarse? Si:

a) No se impone restricción alguna.

b) Dos estadísticos determinados deben estar en el comité.

c) Un economista determinado no debe estar en el comité.

Page 30: Estadistica

Ciencias Políticas y Administración Pública

32

21. ¿A qué denominamos un suceso mutuamente excluyente?

22. ¿A qué denominamos un suceso independiente?

Preguntas de evaluación

1. ¿Cuál es la definición clásica de probabilidad?

2. ¿Cuál es la definición estadística de probabilidad?

3. ¿Por qué utilizamos modelos matemáticos?

4. ¿En qué consiste el que un fenómeno sea aleatorio?

5. ¿Qué es un espacio de eventos?

6. ¿Cómo se define formalmente el concepto de probabilidad y cuáles son los axiomas

que fundamentan tal definición?

7. ¿Qué diferencia a un suceso mutuamente excluyente de un suceso independiente?

8. ¿Qué significado tiene la regla de adición?

9. ¿Qué significado tiene la regla de multiplicación?

10. ¿Cómo encontraría la probabilidad total de un suceso en un fenómeno dado?

11. ¿En qué consiste el teorema de Bayes?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill, 1985. MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo Editorial Iberoamericano, 1990. SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

Page 31: Estadistica

Estadística

33

Unidad 3. Dependencia probabilística

Introducción

En esta unidad, desarrollaremos los elementos teóricos generales de los modelos

probabilísticos, así como los modelos que comúnmente se utilizan, precisando las

características y parámetros que los determinan (media, desviación estándar, etc.). A estos

modelos se les conoce genéricamente con el nombre de distribuciones de probabilidad.

El comportamiento de los fenómenos aleatorios pueden ser discreto o continuo

dependiendo de los valores que asuma la variable aleatoria, las cuales son determinadas por

las características especiales de los eventos aleatorios del experimento. En consecuencia, la

distribución de probabilidad será discreta o continua dependiendo del comportamiento que

tenga la variable aleatoria. Por ejemplo, el número de personas que pertenecen a la

población económicamente activa en familias de 6 miembros describe una distribución de

probabilidad discreta; por otro lado, los tamaños de los tornillos producidos por una

máquina describen una distribución de probabilidad continua.

Page 32: Estadistica

Ciencias Políticas y Administración Pública

34

Temario

1. Variable aleatoria

2. Distribución de probabilidad univariada, discreta y continua

Función de distribución de probabilidad

Función de densidad de probabilidad

Propiedades y medidas de asociación de las distribuciones de probabilidad

3. Distribuciones discretas

Binomial

Hipergeométrica

Poisson

4. Distribuciones continuas

4.1 Normal

Objetivos de la unidad

1. Identificar cuándo una variable aleatoria tiene un comportamiento discreto o

continuo y determinar sus características.

2. Determinar, dado un problema, el tipo de función de densidad de probabilidad que

le corresponda de acuerdo con el comportamiento de la variable aleatoria.

3. Calcular los valores de los parámetros de la distribución de probabilidad ajustada.

4. Interpretar el significado de los valores que asumen los parámetros, de un problema

dado.

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México, Siglo XXI, 1990. HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales. México, FCPyS-UNAM (Serie Estudios, 13), 1970. SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

Page 33: Estadistica

Estadística

35

Actividades de aprendizaje

1. En la extracción de cartas de una baraja, deseamos conocer el número de corazones

rojos que pueden aparecer en una mano de 5 cartas. ¿Qué describe la variable

aleatoria? ¿Qué valores toma la variable aleatoria? ¿Qué características presenta?

2. El número de personas que llegan a una caja registradora en un supermercado es de

n por minuto. ¿Qué describe la variable aleatoria? ¿Qué valores toma la variable

aleatoria? ¿Qué características presenta?

3. En el ingreso a la escuela de Ciencias Políticas y Administración Pública, deseamos

conocer la edad a la que ingresan sus alumnos. ¿Qué describe la variable aleatoria?

¿Qué valores toma la variable aleatoria? ¿Qué características presenta?

4. Los salarios que perciben los obreros en cierta zona industrial son entre $250.00 y

$307.55 pesos diarios. ¿Qué describe la variable aleatoria? ¿Qué valores toma la

variable aleatoria? ¿Qué características presenta?

5. La probabilidad de que un equipo A gane es 1/2. A juega con B un torneo. El primer

equipo que gane 2 juegos seguidos o un total de 3 gana el torneo. Hallar el número

esperado de juegos en el torneo.

6. Una variable aleatoria puede tomar sólo los valores 1 y 3. Si la media es 8/3,

encontrar las probabilidades para estos 2 puntos y encontrar la varianza.

7. Si el número de accidentes en una jornada laboral, en cierta zona industrial sigue el

comportamiento:

X = No. de accidentes 0 1 2 3 P(X) = Probabilidad de accidentes 1/6 2/6 2/6 1/6

¿Cuál es el número esperado de accidentes por jornada? ¿Cuál es la desviación típica?

8. ¿Cuál es la función de densidad binomial y cuáles son los parámetros que la

determinan?

9. En la serie mundial de béisbol, la serie concluye cuando un equipo tiene ganados 4

partidos. Sea p la probabilidad de que el equipo A gane un juego y supongamos que

esta probabilidad permanece constante en la serie. Mostrar que las probabilidades de

que la serie termine en 4 ó 5 juegos son 0.125 y 0.25 respectivamente, cuando p=

1/2 y p= 2/3.

Page 34: Estadistica

Ciencias Políticas y Administración Pública

36

10. Supongamos que el tiempo registrado muestra que un promedio de 5 de los 30 días

de noviembre son días de lluvia, (a) Suponiendo una distribución binomial con cada

día como un evento independiente, encuentre la probabilidad de que el próximo

mes de noviembre tengamos cuando mucho tres días de lluvia, (b) Dar razones

fenomenológicas que justifiquen no usar la distribución binomial.

11. Sea X una variable aleatoria de una distribución binomial con E[X] = 2 y σ2 = 4/3.

Hallar la distribución de X.

12. ¿Cuál es la función de densidad hipergeométrica y cuáles los parámetros que la

determinan?

13. Una muestra de tamaño 3 es extraída de una caja de 12 artículos. Si 4 de los

artículos son defectuosos, ¿Cuál es la probabilidad de objetos no defectuosos en la

muestra?

14. Considérese el caso de 10 votantes de los cuales 7 son de cierto partido A y 3 de

otro distinto B. Se ha tomado una muestra de 5 de ellos. ¿Cuál es la probabilidad de

que en la muestra haya 3 del partido A?

15. ¿Cuál es la función de densidad de poisson y cuáles los parámetros que la

determinan?

16. Con los datos del problema 10 utilice la aproximación de poisson a la distribución

binomial y compare los resultados para ver que tan buena es la aproximación.

17. Supongamos que el número de artículos de cierta clase comprados en una tienda

durante una semana sigue una distribución de poisson con μ = 50. ¿De cuánto será

la existencia que el comerciante tiene para producir la probabilidad de 0.98 para que

sea capaz de satisfacer la demanda? Usar la aproximación a la normal.

18. Supongamos que en una tienda entran 60 personas por hora, (a) ¿Cuál es la

probabilidad que durante un intervalo de 5 minutos no entre alguno en la tienda?,

(b) ¿Cuál es el intervalo de tiempo en el cual la probabilidad es 1/2 para que no

entre alguna persona en este intervalo?

19. ¿Cuál es la función de densidad uniforme y cuáles los parámetros que la determinan?

20. ¿Cuál es la función de densidad normal y cuáles los parámetros que la determinan?

21. Tenemos una máquina automática que estampa piezas, si controlamos la longitud de

la pieza X que está distribuida normalmente con esperanza matemática igual a 50

mm. Y no mayor que 68 mm. Encontrar la probabilidad de que la longitud de una

Page 35: Estadistica

Estadística

37

pieza tomada al azar sea:

a) Mayor que 55 mm.

b) Menor que 40 mm.

22. Un fabricante sabe por experiencia que el 6% de sus productos es defectuoso. Si se

vende el producto en cajas de 100 unidades y garantiza que cuando mucho 10

unidades son defectuosas. ¿Cuál es la probabilidad de que en una caja falle la

garantía de calidad?

23. Supongamos que el número de llamadas telefónicas que llegan a un conmutador

siguen una distribución de poisson a razón de 10 llamadas por minuto. Si el

conmutador puede manejar cuando mucho 20 llamadas por minuto. ¿Cuál es la

probabilidad de que en un período de un minuto se sature? Usar aproximación

Normal.

24. Para n = 12 y p = 1/4. Dibujar en la misma gráfica:

a) El polígono binomial

b) El polígono poisson

c) La curva normal apropiada para ordenadas

d) Notar el alcance para el cual (b) y (c) se aproximan a (a).

25. Los errores aleatorios de la medición obedecen a una ley normal con desviación

cuadrática media σ = 20 mm. Y esperanza matemática μ = 0. Hallar la probabilidad

de que de tres mediciones independientes el error de por lo menos una de ellas no

sea mayor en valor absoluto de 4 mm.

Preguntas de evaluación 1. ¿Qué se entiende por variable aleatoria?

2. ¿Qué es una variable discreta?

3. ¿Qué es una variable continua?

4. ¿Qué es una distribución de probabilidad?

5. ¿Qué es la función de distribución de probabilidad?

6. ¿Qué es la función de densidad de probabilidad?

7. ¿Qué es la distribución Binomial?

8. ¿Qué es la distribución Hipergeométrica?

Page 36: Estadistica

Ciencias Políticas y Administración Pública

38

9. ¿Qué es la distribución de Poisson?

10. ¿Qué es la distribución Normal?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill, 1985. MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo Editorial Iberoamericano, 1990. SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

Page 37: Estadistica

Estadística

39

Unidad 4. Introducción al teorema del límite central y estimación

Introducción

En la tercera unidad de esta guía hemos estudiado las distribuciones teóricas de la

población con respecto a una cierta variable: edad, peso, ingreso, etcétera, la cual está

determinada por ciertos parámetros, como por ejemplo, la media aritmética u y la varianza

a2 para la distribución normal; la proporción P de casos favorables para la distribución

binomial, etcétera.

Hemos partido del supuesto de que el valor de dichos parámetros es conocido, lo

que no siempre es cierto, puesto que como sabemos se deben conocer todos los valores de

la variable para determinarlos. En múltiples ocasiones nos encontramos con que los valores

de los parámetros no se pueden conocer, es el caso del ingreso, del gasto, de las estaturas,

etc., sin embargo, es necesario tener una aproximación a su valor para poder inferir otros

valores de dicha población, con lo cual se hace necesario encontrar una estimación de estos

parámetros.

Page 38: Estadistica

Ciencias Políticas y Administración Pública

40

Así, por ejemplo, supongamos que se desea conocer el ingreso promedio de las

familias mexicanas; un procedimiento sería realizar un censo que abarcara a todas las

familias mexicanas, lo cual requiere de una cantidad estratosférica de recursos y de tiempo;

después de efectuado el censo, sería válido dudar de que se hubiera proporcionado con

veracidad la magnitud de su ingreso.

Debido a las dificultades señaladas, muchas veces se prefiere descartar al censo a

favor de un muestreo y con los datos obtenidos estimar el ingreso promedio.

Esta problemática es la que da lugar a la teoría de la estimación que desarrollaremos

en estas unidades, es decir, a partir de una muestra aleatoria extraída de una población se

estiman los parámetros de la misma; ahora bien estas aproximaciones o estimadores son

mejores entre más próximos se encuentren al valor verdadero de la población. Asimismo,

estudiaremos las propiedades que debe cumplir un buen estimador y los métodos de

obtención de estos estimadores a partir de los datos muestrales.

Page 39: Estadistica

Estadística

41

Temario

1. Teorema del límite central

2. Estimación

Estimación puntual

Estimador insesgado

Estimador consistente

Estimador eficiente

Estimador suficiente

3. Métodos de estimación

Estimación por intervalos

Estimación de medidas por intervalos de confianza

Estimación de proporciones por intervalos de confianza

4. Cálculo del tamaño de la muestra

Objetivos de la unidad

1. Explicar la diferencia entre estimación puntual y por intervalos.

2. Identificar las características de estimadores puntuales conocidas como

insesgamiento, consistencia, eficiencia y suficiencia.

3. Calcular un intervalo de confianza correspondiente a dos poblaciones.

4. Calcular, tomando como base los datos de dos poblaciones, el tamaño adecuado

para cada muestra satisfaciendo un nivel determinado de precisión.

Bibliografía básica

NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México, Siglo XXI, 1990. HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales. México, FCPyS-UNAM (Serie Estudios, 13), 1970. SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

Page 40: Estadistica

Ciencias Políticas y Administración Pública

42

Actividades de aprendizaje

1. Explique:

a) El concepto de estimador insesgado, consistente, eficiente y suficiente.

b) La diferencia entre estimación puntual y por intervalos.

2. ¿Qué utilidad aporta el cálculo de estimadores?

3. De una población de 450 se obtiene una muestra aleatoria simple de 81 unidades, la

media aritmética y desviación estándar de los ingresos mensuales en la muestra fue

de $1,200.00 y de $270.00 respectivamente:

a) ¿Podría decir cuáles son los parámetros de la población?

b) ¿Cuáles son los estadísticos?

c) ¿Cuál es la estimación de punto del ingreso medio mensual en la población?

d) ¿Cuál es la estimación de intervalo a un nivel de confianza del 99.73%

suponiendo que la desviación estándar de la población es σ = 270?

4. Determine los estimadores insesgados y eficientes de μ y σ2, tomando como base

los siguientes datos. Una muestra de cinco medidas del diámetro de una esfera se

registran como: 6.33, 6.37, 6.36, 6.32, 6.37 cm.

5. Se requiere encontrar el intervalo de confianza del 95% para el coeficiente

intelectual medio de los estudiantes de cierto colegio. Se ha tomado una muestra

aleatoria de 5 estudiantes y los resultados obtenidos son: 160, 170, 165, 175, 180.

¿Cuál es el intervalo buscado?

6. Dos grupos de cerdos fueron cebados con dietas diferentes. Se tomó una muestra

aleatoria de 9 cerdos de cada grupo y las medias muéstrales encontradas fueron X1

= 80Kg y X2 = 90 Kg, se admite que los pesos estaban distribuidos normalmente y

las desviaciones típicas eran σ1 = 9Kg y σ2 = 18Kg. Encuentre el intervalo de

confianza del 90% para la diferencia de medias.

7. En 1969 la especialidad de Relaciones Internacionales de la Facultad de Ciencias

Políticas y Sociales de la UNAM tenía un total de 356 egresados. Se diseñó una

muestra aleatoria simple con objeto de investigar la situación ocupacional de estos

egresados. La muestra se calculó para un nivel de confianza de 95%, precisión de

8% y estimado P= 0.7. ¿Cuántos egresados deberá contener la muestra?

Page 41: Estadistica

Estadística

43

8. Determine los tamaños de muestra requeridos para estimar el ingreso promedio de

una población de 1500 empleados, con los siguientes niveles de confianza: Z1 =

90%, Z2 = 95%, Z3 = 98% y con precisiones de ε1 =25, ε2 =50, ε3 =100. La

desviación estándar para dicha población es 250.

Preguntas de evaluación

1. ¿Cuál es el teorema del límite central?

2. ¿Qué es un estimador y qué es una estimación?

3. ¿Cuándo se dice que un estimador es insesgado?

4. ¿Cómo se define la consistencia?

5. ¿Cuándo se dice que un estimador es más eficiente que otro?

6. ¿Cuándo se dice que un estimador es suficiente?

7. ¿Cuál es la diferencia entre estimación puntual y por intervalos?

8. ¿A qué se llama confianza?

9. ¿Cómo se calculan los intervalos de confianza?

10. ¿Cómo se calcula el intervalo de confianza para estimar la media?

11. ¿Cómo se calcula el intervalo de confianza para estimar proporciones?

12. ¿Cómo se estima el tamaño de la muestra?

Bibliografía complementaria

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill, 1985. MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo Editorial Iberoamericano, 1990. SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975.

Page 42: Estadistica

Ciencias Políticas y Administración Pública

44

Page 43: Estadistica

Estadística

45

ANEXO: Respuestas a las preguntas de autoevaluación

Unidad 1. 

1. Cuando la característica asociada a individuos u objetos puede asumir diferentes

valores, se dice que dicha característica es una variable, en caso contrario se

denomina constante, por ejemplo:

i) El número de automóviles vendidos diariamente, es una característica que se

modifica cada día.

ii) La estatura de los individuos de una población es una característica que asume

un valor distinto para cada individuo,

iii) El ingreso de la PEA es una característica que varía de individuo a individuo.

Los valores observados de una variable son aquellos que se obtienen a través de una

muestra, un censo o un experimento. Mientras que, los valores posibles de una variable son

todos aquellos que puede asumir una variable, aún aquellos que no sean observados. Esto

es, los valores observados son un subconjunto de los valores posibles. Por ejemplo, la

estatura de una persona adulta normal puede estar en un intervalo de valores que van desde

un metro cuarenta centímetros, hasta dos metros y diez centímetros, este intervalo

representa los valores posibles de la variable, mientras que, los valores observados serán

aquellos que se obtengan al levantar una muestra o un censo.

2. Se dice que una variable es cuantitativa cuando su valor se puede expresar

numéricamente. Si una variable se expresa a través de categorías por sus atributos se

denomina cualitativa. Por ejemplo, la edad de una persona se expresa

numéricamente, sin embargo su estado civil se expresa a través de atributos.

Las variables cuantitativas se dividen en dos categorías: discretas y continuas. Las

discretas se definen como un conjunto finito o infinito de valores que es posible numerar u

ordenar. Mientras que, las continuas se definen como un conjunto infinito de valores que es

imposible numerar.

Page 44: Estadistica

Ciencias Políticas y Administración Pública

46

En una variable continua siempre existen uno o más valores entre dos puntos contiguos,

lo que imposibilita la numeración del conjunto. Por ejemplo, la estatura de un individuo se

mide, por cuestiones prácticas, hasta centímetros, sin embargo, esto no quiere decir que no

existan estaturas en milímetros, millonésimas de milímetro, etc.

Esto implica que en medio de dos valores muy próximos existen uno o más valores que

no se han numerado. Si se acordara que las estaturas sólo se expresaran hasta centímetros,

los valores que asume la variable sí se podrían numerar y en este caso la variable ya no

sería continua sino discreta. Suele ocurrir que una gran variedad de variables discretas son

ordenadas de acuerdo al orden que siguen los números naturales, sin embargo, esto es sólo

una coincidencia, porque muchas variables que impliquen conteo asumirán valores

naturales, por ejemplo, el número de automóviles que entran a un estacionamiento en una

hora.

3. La forma más elemental de organizar los valores de una variable se denomina Serie

Simple de Datos y consiste en ordenarlos en forma creciente. Ejemplo:

La cantidad de pares de zapatos vendidos diariamente durante un mes por una casa

comercial es como sigue:

Pares de zapatos vendidos diariamente por una casa comercial.

La variable, en este caso, representa el número de pares vendidos:

Organización de la información de acuerdo con la talla del par vendido.

4. La siguiente etapa en el ordenamiento de los datos consiste en la denominada

distribución de frecuencias, en esta etapa los datos cuyo valor numérico se repite

son agrupados en una misma categoría. De esta manera se cuenta el número de

veces que un valor de la variable se ha repetido, a lo que se denomina frecuencia

absoluta.

31, 35, 41, 48, 43, 52, 38, 41, 55, 37, 34, 43, 50, 40, 45 48, 48, 47, 56, 57, 45, 32, 45, 43, 45, 47, 53, 50, 38, 46

X = 31, 35, 41, 48, 43, 52, 38, 41, 55, 37, 34, 43, 50, 40, 45 48, 48, 47, 56, 57, 45, 32, 45, 43, 45, 47, 53, 50, 38, 46

Page 45: Estadistica

Estadística

47

5. Frecuentemente, la información estadística es muy abundante, como sucede en un

censo nacional, motivo por el cual resulta poco práctico agrupar la información

utilizando distribuciones de frecuencias. En estos casos se establecen diferentes

categorías de valores, en las cuales se clasifican los datos de acuerdo con su valor

numérico. Así, una masa de datos puede ser clasificada en varias categorías

numéricas.

La distribución por intervalos de clase es el mecanismo típico para el ordenamiento de

la información. Cuando el número de datos es reducido, no es recomendable utilizar este

procedimiento por las causas que a continuación se exponen.

En los intervalos de clase se agrupan los individuos u objetos cuyo valor numérico de la

variable se encuentra comprendido entre los límites de dicha clase. Si bien el censo no

especifica cuál es el ingreso de cada individuo, la masa de datos agrupada en el intervalo es

tan grande que seguramente la distribución de valores dentro del intervalo es homogénea o

uniforme. Sin embargo, cuando la información no es abundante es posible que algunos

valores se concentren hacia algún extremo del intervalo, lo que ocasiona que los límites del

intervalo no sean representativos. Esto es, al construir un intervalo de clase se debe

procurar que la información ahí agrupada se distribuya homogéneamente a lo largo del

intervalo.

6. Se denomina punto medio o marca de clase al valor medio del intervalo de clase, el

cual se obtiene de sumar los límites inferior y superior de cada clase y dividir entre

dos, esto es:

(Li+ Ls)/ 2

El punto medio representa el valor numérico que se le asigna en promedio a cada

individuo u objeto que pertenece a esta clase.

En la práctica no conviene construir muchos intervalos de clase porque se dificulta

el manejo de muchas clases, lo típico es manejar de 6 a 15 grupos o categorías. Existe una

regla empírica muy utilizada que depende del número total de observaciones y del número

de observaciones por intervalo, esta es:

No. de intervalos = No. total de observaciones/No. de observaciones por intervalo

Page 46: Estadistica

Cienci

requer

una m

que or

7.

La

compo

pueden

So

rubro

es pos

una re

clase.

ias Políticas

El número

rimientos de

El cálculo

masa de dato

rganiza la inf

Existe un

estadística

con más fr

otros.

a representa

ortamiento d

n hacer a pri

on diagramas

o categoría

sible represe

ebanada. En

Diagra

s y Administ

de observac

l que maneja

del número

s no es exac

formación.

sinnúmero

, dependiend

recuencia so

ción gráfica

de la inform

imera vista,

s circulares e

respecto a u

entarlas en fo

la figura sig

A ama de pastel do

tración Públ

ciones por in

a la informac

o de interval

cto y único,

o de forma

do de los fin

on los diagra

a es un ins

mación estad

antes de rea

en forma de

un total. Por

orma de un

uiente se mu

onde cada interva

lica

48

ntervalo es a

ción.

los y la long

más bien d

as de repre

nes y propós

amas de past

strumento út

dística. Muc

lizar una eva

e pastel, en lo

ejemplo, la

diagrama de

uestra la frac

alo de clase está

asignado de

gitud de los

depende del

esentar gráfi

itos que se t

tel, los histo

til en el es

chas observa

aluación cua

os cuales ca

s categorías

e pastel supo

cción de past

á representado p

acuerdo a la

mismos en

criterio y ne

ficamente la

tengan. Las q

ogramas y la

studio y com

aciones y co

antitativa.

ada rebanada

establecidas

oniendo que

tel que corre

B por una rebanada

a experiencia

que se orde

ecesidades d

a informaci

que se utiliz

as ojivas, ent

mprensión d

onclusiones

a representa

s para la PE

e cada clase

esponde a ca

a.

a y

ena

del

ón

zan

tre

del

se

un

EA,

es

ada

Page 47: Estadistica

Estadística

49

8. Los histogramas son diagramas en forma de barras consecutivas, en donde la altura

de cada barra corresponde a la frecuencia absoluta y el ancho de la base al rango de

cada clase, en distribuciones de clases y frecuencias. En distribuciones de

frecuencia el ancho de cada barra es sólo representativo, por lo cual sólo importa

que la barra esté centrada en el valor que representa.

Histograma de la distribución de intervalos de clase y frecuencias de la Población Económicamente Activa

por grupos de ingreso mensual en el estado de Aguascalientes, según el censo de 1990.

Histograma de la distribución de clases y frecuencias de la venta de pares de zapatos.

9. Generalmente las ojivas son gráficas acumulativas de las frecuencias, por esta razón

es creciente el comportamiento de esta función.

Existen varios tipos de ojivas, dependiendo de las necesidades y usos de la información

estadística, casi para todas es necesario acumular las frecuencias clase por clase, por esta

razón, es importante distinguir tres tipos de frecuencias: absoluta, acumulada y relativa.

La primera es la correspondiente al conteo de individuos u objetos que poseen un

mismo valor de la variable (datos agrupados por valor de la variable) o que pertenecen a

una misma categoría (datos agrupados por intervalo de clase). La segunda es el resultado de

Page 48: Estadistica

Ciencias Políticas y Administración Pública

50

sumar sucesivamente las frecuencias absolutas hasta llegar al total de la población. La

tercera se calcula dividiendo la frecuencia absoluta entre el total de datos, es posible

combinar los dos últimos procedimientos para calcular las frecuencias relativas-acumuladas

o acumuladas-relativas dependiendo del orden que se siga, esto es, dividir entre el total de

datos y luego acumular los resultados o acumular y después dividir entre el total,

respectivamente.

Dentro de los diversos tipos de ojivas que se pueden construir, existen dos de

particular interés, la ojiva “más de...” y la “menos de...”. La primera consiste en ir

desagregando los elementos de cada clase del total, empezando por la primera, luego la

segunda, etc., en este caso la gráfica es decreciente. Mientras que, en la ojiva “menos de”

las frecuencias se van agregando clase por clase, como en una ojiva convencional. En

ambos casos el encabezado de cada clase se comienza con la frase “más de...” o “menos

de...” y se establece un valor de la variable que esté comprendido en el intervalo en

cuestión.

Ojiva “mas de...”, utilizando las frecuencias “desacumuladas”.

Page 49: Estadistica

Estadística

51

Ojiva “menos de...”, utilizando las frecuencias acumuladas.

10. Estas medidas permiten evaluar la tendencia que tiene la gran masa de datos, esto

es, el valor de la variable alrededor del cual se aglomera la mayoría de las

observaciones. Las medidas que se estudiarán son la moda, la mediana, la media, la

media geométrica y la media armónica.

La Moda 

El valor de la variable que en una serie de observaciones se repite con mayor

frecuencia se denomina valor modal o moda. En algunos casos puede ocurrir que este valor

no exista o bien que no sea único.

Hasta aquí se ha evaluado la moda para una serie simple de datos, sin embargo, su

obtención se vuelve un poco más complicada para una distribución de clases y frecuencias.

En este caso, se puede demostrar de manera muy sencilla que la expresión es:

Mo = Linf + ∆∆    ∆

donde:

Linf, límite inferior de la clase modal

Δi-1, frecuencia de la clase modal menos frecuencia de la clase anterior a la modal

Δi+i, frecuencia de la clase modal menos frecuencia de la clase posterior a la modal

rMo, rango del intervalo de la clase modal

Page 50: Estadistica

Ciencias Políticas y Administración Pública

52

La Mediana 

Es el valor de la variable que le corresponde al elemento que se encuentra

exactamente a la mitad de todos los datos, una vez que éstos han sido ordenados de menor a

mayor. Así, para una serie simple de datos hay dos posibilidades, si el número de datos es

impar o par. En el primer caso, la mediana corresponde al valor del dato que divide en dos

partes iguales a la serie. En el segundo, el valor de la mediana se obtiene de promediar los

dos datos que se encuentran a la mitad de la serie, esto es, en este caso la mediana está

asociada a un dato ficticio.

La mecánica para calcular la mediana en el caso de datos agrupados se complica un

poco, pero el principio es el mismo, esto es, se trata de obtener el valor de la variable para

el dato que divide en dos partes iguales la masa de datos. En una distribución de clases y

frecuencias los datos se encuentran ordenados por categorías de acuerdo al valor de la

variable en estudio, por lo cual el dato intermedio se encuentra incluido en una de estas

categorías. Para saber en qué categoría se encuentra es necesario acumular las frecuencias

de cada una.

La expresión utilizada en el caso de datos agrupados es:

Md   Linf      

   

donde:

Linf, es el límite inferior de la clase en donde se localiza la mediana.

(i-1)Md, es la frecuencia acumulada hasta la clase anterior a la clase en que se localiza la

mediana.

rMd, es el rango de la clase en donde se localiza la mediana.

Md, es la frecuencia absoluta de la clase en que se localiza la mediana.

Page 51: Estadistica

La Me

anterio

datos,

dato fu

años, e

seria e

Como

sino d

una se

elemen

edia Aritmé

Es la med

ores, involuc

se calcula su

La media r

fuera una pes

empezando p

el punto en d

18

Si se const

se podrá ob

e la diferenc

La expresi

erie simple

ntos de cada

ética 

dida de ten

cra a todos

umando ésto

representa e

sa y fuera co

por la menor

donde se equ

19 20

truye un his

bservar, la lo

cia que hay e

ión de la me

de datos,

a valor o cate

ndencia cen

los datos en

os y dividién

X =

el punto de e

olocada una

r edad y term

uilibra dicha

21 2

21.33 a

stograma, se

ocalización d

entre ellos.

dia para dat

sólo es nec

egoría, esto e

X =

53

ntral más im

n su cálculo

ndolos por el

N

equilibrio de

en cada valo

minando con

regla si se so

22 23

años

puede local

de la media n

os agrupado

cesario agre

es:

N

mportante p

o. La media,

l número tot

e todos los d

or a lo largo

n la mayor. L

oporta en un

24 25

lizar el punt

no depende s

os es muy pa

egar la con

pues, a dife

para una se

al, esto es:

datos, por eje

o de una regl

La edad prom

na cuña.

5 26

to en donde

sólo del valo

arecida a la e

ntribución d

Estadísti

erencia de l

erie simple

emplo, si ca

la graduada

medio o med

27

está la med

or de los dato

expresión pa

el número

ica

las

de

ada

en

dia

dia.

os,

ara

de

Page 52: Estadistica

Cienci

Donde

r

N = ∑ i= r es el

i es e

xi es e

de aqu

que re

fracció

misma

de la c

M(a) =

M(a X

M(X+

donde

media

ias Políticas

e:

r

∑ i es el n1

número de c

el número de

l punto med

Esta expre

X =

uí se puede o

epresenta el

ón del total d

a. Por esta ra

cantidad de d

Algunas pr

= a

X) = a M(X)

Y) = M(X) +

a es una con

a y se cumple

s y Administ

número total

clases o cate

e datos por cl

dio de cada c

sión se pued

=

N

observar que

peso o fac

de datos (N)

azón, el valo

datos que est

ropiedades im

+ M(Y)

nstante. Esta

en para una s

tración Públ

l de datos

egorías.

lase.

lase.

de desglosar

=  

e cada punto

tor de pond

) con que co

or de la medi

tén agrupado

mportantes d

as expresion

serie simple

lica

54

por sumand

+     +

o medio está

deración de

ntribuye cad

ia no sólo de

os en la cate

de la media

nes se pueden

de datos o d

dos de la sigu

+   +…

á multiplicad

cada catego

da clase al v

epende del v

goría o clase

son las sigui

n demostrar

datos agrupa

uiente maner

…+  

do por un fac

oría. Este fa

alor del pun

valor del pun

e correspond

ientes:

utilizando la

ados.

ra:

ctor del tipo

actor indica

nto medio de

nto medio, si

diente.

a definición

la

la

ino

de

Page 53: Estadistica

La Me

tipo g

capital

geomé

adecua

expres

donde

i = 1 h

donde

caso e

elevad

siguien

luego

logarit

edia Geomé

Es una me

geométrico, c

l depositado

étrico, difíci

ado.

La media

sión:

significa la

hasta que i =

La media g

Xi es el pu

el cálculo de

do a la fi pue

nte artificio:

Primero se

M

se obtiene

tmos, es imp

étrica 

dida de tend

como es el

o a plazo fijo

ilmente la

geométrica

Mg

productoria

N.

geométrica p

Mg =

unto medio d

e la media g

ede sobrepas

:

e expresa la e

Mg =

el logaritm

portante reco

dencia centra

caso del cr

o, etc. Si la

media geom

para una s

g =   .

, es decir, sin

para datos ag

de la clase,

geométrica s

sar los límite

ecuación ant

mo de esta

ordar algunas

55

al para variab

recimiento d

variable en

métrica será

serie simple

 .   .… . =

ntetiza el pro

grupados se c

fi la frecuen

e complica

es de una cal

terior como:

= (

expresión.

s propiedade

bles que sigu

de la poblac

n estudio no

á un indica

e de datos s

= ∏

oducto de lo

calcula a tra

= ∏

ncia y r el n

con la fórm

lculadora, po

.  .  .

Sin embar

es de los mis

uen un comp

ión, el creci

sigue un co

ador de tend

se calcula a

os valores de

avés de la exp

número de cl

mula preceden

or ello conv

… . )1/N

rgo, antes d

smos.

Estadísti

portamiento

imiento de

omportamien

dencia centr

a través de

e Xi, desde qu

presión:

lases. En es

nte, porque

iene utilizar

de aplicar l

ica

de

un

nto

ral

la

ue

ste

Xi

r el

los

Page 54: Estadistica

Cienci

i)

ii)

iii)

Al

aplican

log

aplican

log Mg

antilog

ias Políticas

log(a b) =

log (a /b) =

) log a b = b

l aplicar las p

log M

ndo la propi

g Mg = log

ndo nuevam

g = ((log

Esta expre

Log Mg =

Para obte

garitmo de la

Para logari

Para logarit

s y Administ

log a + log b

= log a . log b

log a

propiedades

Mg = log(

edad del inc

g ( .  .

mente la prop

+ log +

sión se pued

( log +

ner la med

a expresión p

itmos base 1

Mg

tmos naturale

tración Públ

b

b

del inciso ii

.  .  .…

ciso i) queda

 .… . )

piedad del inc

+ log +…

de escribir en

+ log +

dia geométr

precedente,

0:

= anti log (l

s:

Mg = anti ln

lica

56

ii) a la expre

. )1/N =

:

= (log

ciso iii) a ca

…+ log )

log )

n forma abre

log +…+

rica y no

esto es:

log Mg) =

(ln Mg) =

esión anterio

log ( .

+ log +

ada sumando

= ( log

eviada como

+ log ) =

su logaritm

r, se tiene:

 .  .… .

log +…

o:

+ log +

:

= ∑

mo, se deb

)

+ log )

+ log +…

 

be obtener

…+

el

Page 55: Estadistica

La Me

propor

Por es

datos l

Para d

11

Los Cu

de la p

tres y

asume

tercero

en cin

total d

edia Armón

Esta media

rcional a la o

sta razón su

la media arm

datos agrupad

. Las medid

algún porc

que tiene l

uantiles 

Los cuanti

población. P

se denomin

e la variable

o para el tota

nco quintiles,

de la població

nica 

a es utilizad

otra, por ejem

utilidad se r

mónica se ex

dos la expre

das de posic

centaje de la

a variable, d

les proporci

Por ejemplo,

nan primero,

para el prim

al de la pobl

, en diez dec

ón por eso c

da en fenóm

mplo, la velo

restringe a lo

xpresa de la s

M a =

sión de la m

M a =

ción son par

a población.

de acuerdo al

onan el valo

si una pobla

segundo y t

mer tercio de

lación. Si la

ciles y en ci

oincide con

57

menos en los

ocidad y el t

os casos ante

siguiente ma

N

media armóni

N =

rámetros que

Se llaman d

l porcentaje

or que asume

ación es div

tercer tercile

e la població

población s

en percentile

el límite sup

s cuales una

tiempo, o la

es señalados

anera:

ica es:

e indican el

de posición p

de la poblac

e la variable

idida en tres

es. El prime

ón, el segund

se divide en

es. El último

perior de la ú

a variable es

productivida

s. Para una s

valor de la

porque se ub

ción seleccio

para una fra

s partes los c

ero nos indic

do para los d

cuatro se lla

o cuantil sie

última clase.

Estadísti

s inversamen

ad y el tiemp

serie simple

a variable pa

bican en val

onado.

acción del to

cuantiles ser

ca el valor q

dos tercios y

aman cuartile

mpre indica

.

ica

nte

po.

de

ara

lor

otal

rán

que

y el

es,

a el

Page 56: Estadistica

Ciencias Políticas y Administración Pública

58

Las medidas de posición tienen mayor importancia cuando se maneja una gran masa

de información, en una serie simple de datos resulta poco práctico ubicar los cuantiles si los

datos no han sido organizados en una distribución de clases y frecuencias, en cuyo caso los

cuartiles se encuentran a través de la siguiente expresión:

Cr = Lic +      

 

los quintiles a través de la expresión:

Qr = Liq +      

 

los deciles a través de la expresión:

Dr = Lid +      

 

los percentiles a través de la expresión:

Pr = Lip +      

 

12. Como se podrá apreciar, existe una gran variedad de parámetros para distintos

propósitos, en esta sección se tratarán los relacionados con la dispersión de la

información.

Rango 

La medida de dispersión más sencilla es el rango, que es la diferencia entre el dato

de mayor valor y el de menor valor en una serie simple de datos. Para distribuciones de

clases y frecuencias es la diferencia entre el límite superior de la última clase y el límite

inferior de la primera.

Page 57: Estadistica

máxim

Varia

la disp

datos s

cuadra

mientr

forma

varian

clase r

obtien

medio

los dat

El rango e

ma que podrí

anza y Desv

Es la medi

persión cuad

se escribe:

La importa

ado radica e

ras que las g

Para una d

:

Al igual qu

nza no sólo d

respecto a la

La varianz

ne la desviac

os y la media

tos.

s una medid

ía tener la va

viación Típi

ida de dispe

drática medi

ancia de que

en el hecho

grandes pesan

distribución

ue en la med

depende de

as demás.

za por sí so

ción típica o

a, esto es, en

da demasiado

ariable en cu

ica 

rsión más im

ia de los dat

S2 =

e la dispersió

o de que las

n cuadrática

de clases y

S2 =

dia, la disper

la magnitud

ola no dice

o estándar, q

ntre el centr

59

o burda, sin

uestión.

mportante, p

tos respecto

N

ón de los da

s dispersion

amente más.

frecuencias

N

rsión es pond

d de la dispe

mucho, per

que indica la

ro de cada c

embargo, d

pues es cons

a la media,

atos en torno

nes pequeña

la varianza

derada por l

ersión, sino d

ro si se obt

a distancia p

clase y el pu

da una idea d

istente y pon

, para una s

o a la media

s no contrib

se escribe e

os factores f

del “peso” q

iene su raíz

promedio en

unto de equil

Estadísti

de la variaci

nderada. Mi

erie simple

sea elevada

buyen much

en la siguien

fi/N, esto es,

que tenga ca

z cuadrada,

ntre los punt

librio de tod

ica

ión

ide

de

a al

ho,

nte

la

ada

se

tos

dos

Page 58: Estadistica

Ciencias Políticas y Administración Pública

60

Algunas propiedades importantes de la varianza son:

a) Var(a) = a

b) Var(aX) = a Var(X)

c) Var(a+X) = Var(X)

la demostración de estas propiedades se realiza aplicando la definición de la varianza.

Coeficiente de Variación 

La varianza es una medida de la variación absoluta. Cuando se desea comparar la

dispersión de dos o más grupos de datos conviene utilizar el concepto de coeficiente de

dispersión, que se define como el cociente entre la desviación típica y la media, esto es:

S

CV =

Por ejemplo, dos distribuciones poseen la misma varianza S2, sin embargo, una

tiene una media de 50 y otra de 450, esto quiere decir que la primera tiene un coeficiente de

dispersión mayor que la segunda, esto es, la dispersión relativa de los datos respecto al

punto de equilibrio de la distribución es menor en el segundo caso que en el primero, sin

embargo, la dispersión absoluta es la misma.

La Asimetría 

13. La asimetría es un parámetro estadístico que mide el grado de simetría respecto a la

media de una serie de datos agrupados. En general, las tres medidas de tendencia

central, media, mediana y moda no coinciden. Sin embargo, como la media es el

punto de equilibrio de una distribución, la condición para que una distribución sea

simétrica es que la moda y la mediana coincidan en valor numérico con la media,

esto es:

Page 59: Estadistica

Estadística

61

= Md = Mo

Por esta razón, una forma de medir la asimetría ha sido evaluar la distancia entre la

media y la moda, o la media y la mediana y estandarizarla dividiendo entre la desviación

típica. Particularmente, el primer y segundo coeficientes de asimetría de Pearson, están

basados en este principio:

3( – Mo) Asimetría = S

3( – Md) Asimetría = S

Otra forma de evaluar el grado de asimetría de una serie de datos agrupados consiste

en recurrir al tercer momento respecto a la media y dividirlo por la desviación típica al

cubo, esto es:

> 0 Asimetría positiva

a3 = m3/S3 = 0 Simétrica

< 0 Asimetría negativa

Asimetría positiva Simétrica Asimetría negativa Media - - - - - - - - Mediana …………… Moda ___________

Este coeficiente es adimensional y no depende de ninguna medida de tendencia

central, excepto de la media. Los términos del tercer momento (Xi-X)3 son positivos cuando

Xi >X y negativos cuando Xi < X, de manera que la suma de todos los términos resultará

positiva o negativa de acuerdo al peso de cada rama a la derecha o izquierda de la media. El

grado de asimetría tiene tres categorías.

Page 60: Estadistica

Ciencias Políticas y Administración Pública

62

La Curtosis 

La curtosis es una medida de la heterogeneidad u homogeneidad de una

distribución, geométricamente representa el grado de abultamiento (o agudez) de la

distribución. La curtosis se mide con ayuda del cuarto momento respecto a la media,

dividiendo éste por el cuadrado de la varianza, esto es:

> 3 Leptocúrtica

a4 = m4/S4 = = 3 Mesocúrtica

< 3 Platocúrtica

Platocúrtica Mesocúrtica Leptocúrtica

14. Una medida de concentración mide el ritmo de acumulación de una variable, en este

sentido, es muy similar a la técnica utilizada para obtener una ojiva. Esta medida de

la concentración para una serie de datos agrupados se denomina Índice de Gini, y

no es una medida promedio como las estudiadas con anterioridad, es una medida

que se obtiene de consideraciones geométricas sobre la curva de Lorenz.

Curva de Lorenz 

Como se recordará, las ojivas son gráficas acumulativas de los valores de la variable

y muestran gráficamente el ritmo de acumulación de una variable, por esta razón, la forma

gráfica de apreciar la concentración de una variable tiene que estar relacionada con las

ojivas. La curva de Lorenz es una ojiva invertida, esto es, las frecuencias acumuladas se

grafican en el eje X y el producto de f por X acumulado se gráfica en el eje Y.

Page 61: Estadistica

Estadística

63

Curva de Lorenz

Índice de Gini 

Este índice tiene su origen en la curva de Lorenz, pues es el resultado de encontrar

el área entre esta curva y la recta que une el inicio y el fin de la misma. Esta recta

corresponde al caso ideal en el que la concentración sea homogénea, esto es, que cada clase

o valor de la variable contribuya con la misma frecuencia (en valores o clases igualmente

espaciadas), línea AC. El caso opuesto lo representan las rectas AB y BC, en donde la

concentración de la variable está acumulada en un solo individuo u objeto.

La expresión para el índice de Gini es la siguiente:

XiYi+1 – Xi+1Yi IG = (100)2

donde:

Xi = ia%

Yi = ( iXi)a%

Page 62: Estadistica

Ciencias Políticas y Administración Pública

64

Curva de Lorenz

Unidad 2. 

1. La probabilidad de que se presente determinado suceso es igual al cociente del

número de casos que son favorables a este suceso por el número total de casos

posibles, con tal que todos estos casos sean mutuamente simétricos.

2. Si un total de c eventos mutuamente simétricos, de entre los cuales a nos son

favorables, y suponiendo que repetimos nuestro juego n veces, de las cuales f nos

son favorables porque aparecen algunos de los eventos, entonces n-f veces no serán

a nuestro favor, de donde podemos definir la razón frecuencial como f/n.

En el caso en que n → ∞ (sea n grande), esta razón (f/n) tenderá el valor a/c, puesto que

cada uno de los c casos posibles se presentará n/c veces, pero a de ellas son favorables, o

sea na/c, por lo que f ≡ na/c será el número de veces que ganemos.

3. La intención de la teoría de probabilidades en cualquiera de las disciplinas que la

utilicemos, consiste en proporcionar un modelo matemático adecuado a la

descripción del comportamiento (aleatorio) de nuestro fenómeno. A veces, el

comportamiento puede ser muy similar a los modelos más conocidos (Binomial,

Poisson, Normal, etc.), pero en otras, se deberá dar una descripción del

comportamiento de nuestro fenómeno en términos de modelos que nosotros

construyamos.

Page 63: Estadistica

Estadística

65

Un modelo matemático será aceptable en la medida en que éste se ajuste al

comportamiento del fenómeno estudiado. En general, el modelo puede resultar más sencillo

que el fenómeno, pero hay que tener en cuenta que por muy adecuado que sea nuestro

modelo, nunca lo podremos ajustar exactamente a nuestro fenómeno debido a su naturaleza

aleatoria, por lo que en este sentido representará una aproximación.

4. Que un fenómeno o suceso sea aleatorio, quiere decir que no podemos afirmar un

resultado a priori de su comportamiento. Por ejemplo, una moneda al ser arrojada,

tiene 2 posibilidades, que caiga sol, o bien águila, sin embargo, no podemos

predecir cuál de los 2 resultados será el que aparecerá. Ahora la pregunta adecuada

sería: ¿De dónde proviene la aleatoriedad de un fenómeno?

El que un fenómeno sea aleatorio proviene de la variabilidad de las condiciones en que

se lleva a cabo éste, es decir, cuando no hay posibilidades de fijar las condiciones en que se

produce nuestro fenómeno; por otra parte, si fijáramos todas las posibles fuentes de

variación de nuestro fenómeno, no tendríamos un fenómeno aleatorio, sino determinista,

puesto que conoceríamos a priori el resultado.

Hay que señalar que un fenómeno no es determinista o aleatorio, sino depende de las

condiciones en que se realice éste, para que sea lo uno o lo otro. Esto es, la arbitrariedad de

las condiciones es lo que nos permite fenómenos o eventos aleatorios.

5. Se denomina espacio de eventos aquel que contiene todos los eventos de un

experimento aleatorio.

6. La probabilidad es una idealización de la proporción de veces que ciertos resultados

ocurrirán en repetidos sucesos de un experimento, así, un modelo de probabilidad

para eventos, será uno para el cual la probabilidad de que un evento A ocurra, será

denotado por P(A), es igual a la proporción de veces que el evento A se espera que

ocurra en repetidos eventos de un experimento. Puesto que P(A) es una función

definida sobre conjuntos, tales como A, es decir, una función-conjunto.

Page 64: Estadistica

Ciencias Políticas y Administración Pública

66

De acuerdo con lo anterior, construimos 3 axiomas de la teoría de probabilidades:

a) o ≤ P(A) ≤ 1; para todo evento A

b) P(S) = 1

c) P (A1∪A2∪A3∪…) = P(A1) + P(A2) + …, para cualquier sucesión finita o infinita de

eventos A1, A2, A3, … mutuamente excluyentes.

7. SUCESOS MUTUAMENTE EXCLUYENTES Y NO MUTUAMENTE EXCLUYENTES.

Dos eventos A y B son mutuamente excluyentes si no pueden presentarse

simultáneamente, es decir, al ocurrir uno imposibilita la ocurrencia del otro; en caso

contrario se dirá que son no mutuamente excluyentes, o sea que la ocurrencia de uno no

imposibilita la ocurrencia del otro.

Para eventos mutuamente excluyentes tendremos:

A ∪ B = A ó B = A + B

Para eventos no mutuamente excluyentes tendremos:

A ∪ B = A + B - AB

SUCESOS INDEPENDIENTES Y SUCESOS DEPENDIENTES.

Se dice que dos sucesos A y B son independientes cuando la ausencia o presencia de A

es independiente de la presencia o ausencia de B. En caso contrario se dirá que son

dependientes.

De esta propiedad vemos que:

A ∩ B = (A) (B) para eventos independientes

A ∩ B = (A) (B/A) para eventos dependientes donde / significa dado.

Page 65: Estadistica

Estadística

67

8. Dados los eventos A y B los cuales tienen probabilidades P(A) y P(B)

respectivamente. La probabilidad del evento unión de A y de B para eventos no

mutuamente excluyentes será:

P(A ∪ B) = P(A + B) = P(A) + P(B) - P(A ∩ B ) = P(A) + P(B) - P(AB)

Y para eventos mutuamente excluyentes:

P(A ∪ B) = P(A) + P(B)

Puesto que A ∩ B = AB = 0 (ya que A y B son mutuamente excluyentes).

9. REGLA DEL PRODUCTO DE PROBABILIDADES (PROBABILIDAD

CONDICIONAL).

Sea A y B dos eventos, la probabilidad del evento intersección para eventos

independientes y dependientes será:

P(A ∩ B) = P(A) P(B) para eventos independientes

P(A ∩ B) = P(A) P(B/A) para eventos dependientes

Para mostrar de dónde proviene el inciso (b), es necesario suponer un espacio de

eventos S al cual pertenecen todos los eventos de B y al cual a su vez pertenecen los

eventos de A, donde B es posterior a la ocurrencia de A.

Si en m eventos simples se presentan los eventos de B la probabilidad de que ocurra el

evento A ∩ B, puesto que A es posterior a la ocurrencia de B en el espacio de eventos S,

será:

Número de veces que ocurra A∩B

Número de veces que ocurra B

Que representamos por P(A/B) y que recibe el nombre de probabilidad de A dado B. Si

X es el número de veces que se presenta el suceso A∩B, tendremos:

Page 66: Estadistica

Ciencias Políticas y Administración Pública

68

Número de veces (A∩B) X P(A/B) = =

Número de veces B m

De acuerdo con la definición clásica de probabilidad es:

Números de casos favorables de (A ∩ B) Número de casos posibles

P(A/B) = P(A∩B) = P (B) Números de casos favorables de B Número de casos posibles de B

Esta fórmula representa la probabilidad condicional, debido a que la aparición de los

sucesos A viene restringida a lo que haya sucedido previamente en B, por lo que queda:

P (A ∩ B) = P(B) x P(A/B)

Si ahora B está sujeto a lo que suceda en A, la expresión quedaría:

P (A ∩ B) = P(A) x P(B/A)

Puesto que A ∩ B = B ∩ A

O sea P(A) P(B/A) = P(B) P(A/B)

Lo anterior origina el teorema de las probabilidades compuestas:

TEOREMA: Si la verificación de un evento supone la ocurrencia de 2 eventos A y B,

su probabilidad es igual al producto de la probabilidad de ocurrencia de A, por la

probabilidad de que B ocurra cuando A se ha presentado.

10. Sean A1, A2,…, Ak eventos mutuamente excluyentes, tales que A1 ∪ A2, ∪,…, Ak =

S (espacio total de eventos). Por otra parte, sea X un evento arbitrario de S.

Entonces:

P(X) = P(A1) P(X/A1) + P(A2) P(X/A2) +… P(Ak) P(X/Ak)

Page 67: Estadistica

Estadística

69

11. Sea A1, A2, …, Ak un espacio completo de eventos, y sea X un evento cualquiera de

S, entonces:

P(Ai) P(X/Ai) P(Ai/X) =

P(Ai) P(X/Ai) +...+ P(Ak) P(X/Ak)

Unidad 3. 

1. El conjunto de todos los posibles eventos resultantes de la realización de un

experimento aleatorio nos produce el espacio completo de eventos, también llamado

espacio muestral. De esta forma, cada fenómeno aleatorio genera su espacio

completo de eventos, el cual puede estar constituido por un conjunto de eventos

infinito o bien finito, dependiendo del tipo de evento generado por la

experimentación.

Si el espacio completo de eventos S lo relacionamos con el sistema de números

reales de acuerdo a cierta regla de asociación, definiremos como variable aleatoria a este

proceso funcional, es decir, es el valor de la función asociado a cada evento del espacio

completo con un número real, del conjunto de los reales. Entonces la serie de números

reales asociados a los eventos aleatorios de un espacio muestral es lo que llamamos la

variable aleatoria. Desde luego, existe una condición especial del evento que define el valor

del número real asignado. Denotemos a la variable aleatoria por X(w).

La regla de asociación mencionada, es sencillamente la que nos da el fenómeno

aleatorio a estudiar, puesto que, este fenómeno produce su propio espacio de eventos.

Esta regla de asociación o función es uno a uno, es decir, le asocia a una variable

aleatoria solamente un valor real del conjunto de números reales (R).

Dependiendo del espacio completo de eventos, tendremos que la serie de números

reales puede ser finita o infinita, la cual llamaremos el intervalo de definición de la variable

aleatoria X(w). De tal forma que este intervalo de definición puede ser continuo o

discontinuo o de ambas formas en un cierto intervalo.

Page 68: Estadistica

Ciencias Políticas y Administración Pública

70

Entonces, la variable aleatoria describe en valores reales el comportamiento de los

eventos resultantes de un fenómeno aleatorio.

2. Una variable aleatoria es discreta cuando la función asocia un conjunto numerable

de valores tomados de la recta de los reales para asociarlos al espacio muestral, de

tal forma que entre uno y otro valor posible sucesivo no haya valores intermedios,

es decir, medie una cierta distancia.

La discreción de la variable aleatoria, proviene del fenómeno aleatorio a tratar, por lo

que dicha variable también puede ser infinita siempre y cuando sus valores sean

numerables.

3. En general todos los fenómenos que se presentan tanto en las ciencias sociales como

en las exactas son de carácter continuo, puesto que están relacionados con

mediciones del comportamiento intrínseco del fenómeno aleatorio, como por

ejemplo, la medición de las estaturas de los estudiantes; la medición del diámetro de

los anillos de un motor; el ingreso de la población económicamente activa; el precio

de cierto producto en el mercado.

Esto quiere decir que, tanto la continuidad como la discreción de la variable aleatoria,

están determinadas por el tipo de fenómeno aleatorio a estudiar, ya que depende del

conjunto de valores reales que le asignemos.

Así, la variable aleatoria continua se define como la función que asume un conjunto de

valores no numerables (infinito) del sistema de números reales, donde entre uno y otro

valor sucesivo que puede tomar la variable aleatoria hay un conjunto infinito de valores

intermedios, es decir, la distancia entre uno y otro valor sucesivo es tan pequeña que tiende

a cero.

4. La variable aleatoria asigna valores reales a los eventos de un fenómeno aleatorio, y

también, este fenómeno tiene asociado un espacio completo de eventos, es decir,

una distribución de eventos o bien una distribución de valores de la variable

aleatoria.

Page 69: Estadistica

¿P

Po

consec

variab

cuyo i

probab

la prob

los in

semice

variab

compo

evento

probab

tendre

contin

Por qué distri

orque existe

cuentemente

ble aleatoria

intervalo de

bilidad de oc

babilidad de

ntervalos de

errados y ten

Similarmen

Las distrib

bles aleatoria

ortamiento d

Así, si la v

o o conjunto

bilidades de

emos:

En forma

nua tome valo

ibución?

e un rango

e, las probab

o a un conju

definición e

currencia de

e no-ocurren

definición

nemos que:

P( Ω

nte para un e

buciones de

as tienen la

de la variable

variable alea

de eventos

e los evento

P(x)

parecida po

ores en un in

de valores

bilidades que

unto de ellas

es [0, 1], por

e cualquier e

ncia de cualq

de la vari

) = P(-∞ < X

evento falso

P(Ω) = P(-

e probabilid

característic

e aleatoria.

atoria tiene u

estará dada

os del conju

para la

demos enco

ntervalo [a, b

71

que puede

e se les pue

s, nos produ

rque la prob

evento de un

quier evento

iable aleator

X(w) < ∞) =

o vacío:

∞ > X(w) >

dad por est

ca de ser dis

un comportam

por la proba

unto, las cu

probabilidad

ontrar la pro

b]. Así, tene

e tomar, y

den asignar

ce una distri

babilidad está

n fenómeno

o de un fenó

ria pueden

P(-∞, ∞) =

> ∞) = 0

ar definidas

scretas o con

miento discr

abilidad de é

uales serán

d de un even

babilidad de

mos:

no solame

a cada valo

ibución de p

á normalizad

aleatorio es

ómeno aleato

ser cerrado

1

s precisame

ntinuas, de a

reto, la prob

ste, o bien, p

discretas, si

nto.

e que la var

Estadísti

ente un valo

or que tome

probabilidade

da, es decir,

1. Asimism

orio es 0. A

os, abiertos

ente sobre l

acuerdo con

babilidad de

por la suma

imbólicamen

riable aleator

ica

or,

la

es,

la

mo,

Así,

o

las

el

un

de

nte

ria

Page 70: Estadistica

Cienci

donde

5.

funció

donde

cualqu

desde

espaci

ias Políticas

f(x) es una

Como una

podemos e

la variable

de probabi

Es decir, si

Dada la e

ón de distribu

En una dis

(x) es la fu

La función

uier valor de

-∞ hasta el

io de eventos

s y Administ

función de d

a variable al

encontrar la p

e aleatoria, d

ilidad, para

imbólicamen

P(-∞, λ

xistencia de

ución de pro

P(x ≤ λ

tribución de

unción de de

n de distribu

e R, y de é

l valor λ inc

s.

tración Públ

P(a ≤

densidad de p

eatoria defin

probabilidad

denominarem

distinguirla

nte tenemos

λ) = P(-∞ <

e variables a

obabilidades

λ) = F(λ) =

e tipo continu

P(x ≤ λ)

ensidad de pr

ución es una

sta manera

clusive, es d

lica

72

x ≤ b) =

probabilidad

ne una distr

d de a lo má

mos a esta n

de otras, pu

:

< x(w) ≤ λ)

aleatorias di

para una dis

=

uo:

) = F(λ) =

robabilidad

a función ac

representará

decir, acumu

d.

ribución de p

s λ eventos,

nueva funció

uesto que es

) = P(x(w)

iscretas ó c

stribución di

de la variabl

cumulativa, p

á la probabi

ula la probab

probabilidad

donde λ es

ón, función d

una función

≤ λ)

continuas, te

iscreta es:

le aleatoria x

puesto que λ

lidad de cua

bilidad de lo

des, de la cu

algún valor

de distribuci

n acumulativ

enemos que

x(w).

λ puede tom

alquier even

os eventos d

ual

de

ión

va.

la

mar

nto

del

Page 71: Estadistica

a)

b)

c)

d)

6.

En el c

DE

f(x) =

En el c

una fu

a)

b)

c)

donde

Las propie

0 ≤ F(x) ≤ 1

F (-∞) = 0

F (∞) = 1

F(x) ≤ F(y)Si x ≤ y lim F(x) = Fy→ x+

La idea de

aleatoria t

significado

caso discreto

EFINICIÓN

P {X = x} e

caso continu

DEFINICI

unción f que

(x) 0

a y b son cu

edades que ti

1

F(x)

e función d

tiene asignad

o para variab

o la podemo

N: Sea x una

es denominad

uo se define:

IÓN: Una fu

posee las sig

ualquiera do

iene dicha fu

(propiedad de

(propiedad de

(propiedad de

(propiedad de

(continua por

de densidad

da una prob

bles aleatoria

s definir de

variable ale

da función d

unción de de

guientes pro

s valores de

73

unción son la

e normalizaci

e que no apar

e que aparezc

e ser función

r la derecha)

es aquella

babilidad de

as discretas o

la siguiente

atoria discre

de densidad d

ensidad para

piedades:

x que satisf

as siguientes

ión a la unida

rezca algún ev

can todos los

monótona cre

en la que c

e ocurrencia

o continuas.

manera:

eta. Entonce

discreta de x

a una variab

facen a < b.

s:

ad)

vento)

eventos)

eciente)

cada valor

a y tiene va

s la función

x.

ble aleatoria

Estadísti

de la variab

ariantes en

f definida p

continua x

ica

ble

su

por

es

Page 72: Estadistica

Cienci

propie

inciso

b)

c)

Para to

7.

En

de la d

Si

una po

presen

ias Políticas

En caso d

edades ya se

s b) y c):

oda a < b

La distrib

distribució

complemen

por el even

se podrá p

conocemos

probabilida

decir, 1 - p

puesto que

fenómeno

complemen

n los fenóme

dicotomía, y

tenemos n e

oblación “m

ntan, entonce

s y Administ

de variable

ñaladas para

ución Bino

ón cuyo e

ntarios, dond

nto fracaso:

presentar un

s la probabi

ad del even

p, que la de

e aquí se pre

aleatorio,

ntarias.

enos binomi

fracaso a la

eventos mue

muy grande”

es habrá

tración Públ

s aleatorias

a el caso con

omial es un

espacio de

de a uno de

lo cual imp

no u otro, p

lidad de que

nto fracaso e

enotaremos p

esenta una d

es decir,

ales se deno

ocurrencia d

estrados (nos

”) de los cua

formas de e

lica

74

s discretas

ntinuo, con

n miembro

eventos e

ellos lo desi

lica que en

pero no am

e ocurra el e

estará dada

por q. De es

dicotomía en

se present

omina éxito

del evento c

s referimos a

ales k prese

encontrar los

también se

las siguiente

de la fami

está compu

ignamos por

la realizació

mbos. Si por

evento éxito

por el com

sta forma: 1

n las alterna

tan únicam

a la ocurren

ontrario.

a una muestr

entan cierta

s k eventos e

deben cum

es modificac

ilia Bernoul

uesto por

r el evento é

ón de un sol

r otra parte

o y lo denota

mplemento a

- p = q; o b

ativas de rea

mente dos

ncia de uno

ra de tamaño

característic

entre los n m

mplir las tr

ciones para l

li (es aque

dos event

éxito, y el otr

o experimen

e, previamen

amos por P,

la unidad,

bien p + q =

lización de

característic

de los event

o n extraída

ca y n-k no

muestrados.

res

los

lla

tos

ro,

nto

nte

la

es

= l

un

cas

tos

de

la

Page 73: Estadistica

Lo

caracte

probab

elemen

probab

probab

P

donde

8.

Si

dicha

presen

sea A

A será

n de l

caracte

Lo

o que signif

erísticas, pu

bilidades p

ntos sin d

bilidad entre

bilidad de ob

x – k; n =

: x = 0, 1, 2,

Esta distrib

dicotomía

misma pro

reemplazar

ocurrencia

anterior, o

distribucio

tenemos N

característic

nte la caracte

(sin caracter

á: y de q

la población

erística A y

os casos favo

fica que si

uesto que c

se multiplic

icha caract

e los (n - k

btener k con

= (1

, 3,…, n

bución perte

o policotom

obabilidad de

r nuevamen

a del siguien

sea se trata

ones binomia

objetos, de

ca (A), vemo

erística A se

rística) será

que el segun

n de N y se

de que n - k

orables de se

pk es la pr

cada evento

carán. Y si

terística, sup

k) eventos;

cierta carac

1 – p)n-k =

enece a la fa

mía, excepto

e ocurrencia

nte el eleme

nte elemento

de eventos d

al o multinom

los cuales M

os que la pro

erá y la pr

=

ndo sea A ser

e desea cono

k no la tengan

eleccionar k

75

robabilidad

es indepen

(1 - p)n-k e

poniendo s

tendremos q

cterística es:

familia Berno

o que aquí n

a, es decir, a

ento muestre

en muestre

dependiente

mial, donde

M tienen cier

obabilidad d

robabilidad d

. La prob

rá:

ocer la prob

n, tendremos

objetos con

de obtener

ndiente de l

es la probab

similarmente

que de una

= !

oulli, porque

no se consid

al obtener un

eado. Por lo

ear se ve con

s, a diferenc

cada evento

rta caracterí

de ocurrenci

de ocurrenci

babilidad de

. Si extraem

babilidad de

s que:

característic

k elemento

los demás,

bilidad de ob

e independe

muestra de

! ! =

e aquí tamb

dera a cada

na muestra l

o que la pr

ndicionada a

cia de lo que

era indepen

stica A, N -

a de que el

ia de que el

que el segun

mos una mues

que k de e

ca A de un to

Estadísti

os con ciert

por tanto l

btener (n -

encia e igu

e tamaño n

bién existe u

evento con

la hacemos s

robabilidad

a la extracci

e ocurría en l

ndiente.

M no tendr

primer even

primer even

ndo evento s

stra de tama

ellos tengan

otal de M ser

ica

tas

las

k)

ual

la

una

la

sin

de

ión

las

rán

nto

nto

sea

año

la

rá:

Page 74: Estadistica

Cienci

y el re

de ello

Y los

serán:

A en u

donde

distrib

9.

Co

Si mul

ias Políticas

esto de la mu

Formas dif

os son de cla

casos posibl

De lo ante

una muestra

P

: x = 0, 1,

bución hiperg

La distribu

ocurrencia

ocurran, es

y con una m

onsideremos

F(x) =

ltiplicamos y

s y Administ

uestra (n-k),

ferentes. Así

ase A será:

les de selecc

rior, podemo

de n será, de

= (X = K)

2, …., k, …

geométrica.

ución de P

a de eventos

sto es, cuand

muestra de t

la función d

= ….

y dividimos

tración Públ

serán aquell

í los casos f

cionar una m

os decir que

e acuerdo a l

=  

…., M, que

Poisson es u

s poco proba

do p es un va

tamaño n gra

de densidad

     !

por nx la exp

lica

76

los de tipo Ā

favorables de

muestra de ta

e la probabil

la definición

= úú

es la funció

utilizada pa

ables o alte

alor cercano

ande (n>50).

binomial, qu

=

presión ante

Ā y podrán se

e seleccionar

amaño n de

lidad de sele

n clásica de p

        

ón de densid

ara determin

ernativament

a cero y q e

.

ue como sab

….!

rior queda:

er selecciona

r n objetos d

la población

eccionar k ob

probabilidad

 

dad de prob

nar las prob

te, que muy

es muy cerca

emos tiene l

ados de:

de los cuales

n de tamaño

bjetos de cla

d:

babilidad de

babilidades

y posiblemen

ano a la unid

la forma:

s k

N

ase

la

de

nte

dad

Page 75: Estadistica

de aqu

Por otr

Al enc

entonc

Ahora

uí reconocem

f x

 1  1

ro lado:

contrar el lím

ces si z = -p

a bien, el lím

F(x)

mos que en la

   

1‐ 1/n    1 ‐2

1 – p

mite de la suc

(1 + Z

tenemos:

mite cuando n

es:

) = …

a distribució

2/n  …..  1 –

n   

cesión:

Z)1/z cu

n → ∞ de la

 

77

….  !

ón binomial n

–  x – 1 /n  

   

uando z →0,

λ

expresión:

   ….

(1-p)qn-

np = μ = λ. E

λx / x!   1 

tenemos qu

 

  λ 

  

-x

Entonces:

n‐x 

– p n / 1 – p

 

e:

Estadísti

 

p x 

ica

Page 76: Estadistica

Ciencias Políticas y Administración Pública

78

por lo que cuando n → ∞, p → 0 y np permanece constante, tenemos:

f x    λ  λ!

   donde x = 0, 1, 2, ….

que es la función de densidad de la distribución de Poisson y se puede enunciar en el

siguiente teorema:

“Si la probabilidad de un suceso en un solo evento p tiende a cero, y además el

número de eventos n es infinito de manera tal que la media μ= np permanezca constante,

entonces la distribución binomial se acerca de la distribución Poisson con media λ”.

10. La distribución Normal o Gaussiana es una distribución importante en el sentido de

que matemáticamente es un modelo de comportamiento común, y que muy

frecuentemente se encuentra en los fenómenos sociales, económicos, físicos, etc. Lo

característico de este tipo de distribución es debida a que su función de densidad, es

una función simétrica, esto es, que la media, la mediana y la moda son iguales, es

decir, coinciden tomando el mismo valor.

La distribución normal de probabilidad es una distribución de probabilidad continua

tanto simétrica como mesocúrtica. La curva de probabilidad que representa a la distribución

normal de probabilidad tiene forma de campana.

La distribución normal de probabilidad es importante para la inferencia estadística por

tres razones:

Page 77: Estadistica

probab

de val

con di

Donde

μ

σ

x, hac

media

que el

• Se sab

distribu

• Las pro

de prob

• Las di

muestr

indepen

Como suc

bilidad de un

lores. La alt

istribución n

e:

es la media

la varianza

Podemos n

cia ambos la

a, ya sea a la

área bajo la

e que las m

ución.

obabilidades

babilidad, co

stribuciones

al tienen di

ndientement

ede en toda

na variable

tura de la fu

normal está d

a de la distri

a de la distrib

notar de la g

ados de la m

izquierda o

a curva es ca

medidas obte

s normales s

omo las distr

s de estadís

istribución n

te de la distri

as las distrib

aleatoria co

unción de de

dada por:

x    

bución

bución

gráfica que l

media μ, lo q

a la derecha

da vez meno

79

enidas en mu

suelen servi

ribuciones bi

sticas como

normal cuan

ibución de la

buciones con

ntinua sólo

ensidad, o cu

la curva se a

que signific

a, tienen poc

or.

uchos proce

ir para aprox

inomial y de

la media m

ndo el tamañ

a población

ntinuas de p

puede deter

urva de prob

 

aproxima asi

a que los va

ca probabilid

esos aleatorio

ximar otras

e Poisson.

muestral y

ño de mues

de origen.

probabilidad

rminarse par

babilidad, d

intóticament

alores muy

dad de realiz

Estadísti

os siguen es

distribucion

la proporci

stra es grand

d, un valor

ra un interva

e una variab

te al eje de l

alejados de

zarse, debido

ica

sta

nes

ión

de,

de

alo

ble

las

la

o a

Page 78: Estadistica

Cienci

inflexi

decir,

media

en que

objeto

se teng

Entonc

(Esta e

Unida

1.

tiene u

permit

consid

difiere

aproxi

forma

que se

ias Políticas

Además, l

ión de la cu

de la magn

a. En forma p

e se tenga un

o de tener un

ga una distri

ces:

es la distribu

ad 4. 

“Sea X un

aleatoria

una distribuc

Desde un p

te el uso de

derablemente

en de la nor

imación nor

de f(x) (fun

e distribuye X

s y Administ

a desviación

urva, lo que

nitud de des

práctica, par

na distribuci

na tabla com

ibución norm

ución normal

na variable

ción que se a

punto de vist

la curva no

e de la nor

rmal debido

rmal de X. E

nción de den

X para algun

tración Públ

n típica σ m

nos permit

viación de l

ra simplifica

ión normal, s

mún de valor

mal.

l de probabi

aleatoria co

Z aproxima a la

ta práctico, e

ormal cuando

rmal. Desde

o al tamaño

Experimento

nsidad de pr

na f(x).

lica

80

medida a am

te obtener u

los valores

ar el cálculo

se realiza un

es y que se

 

lidad con μ =

on media μ

a distribució

este teorema

o la variable

e luego, la

de n, el cu

os de muestr

robabilidad)

mbos lados d

una medida

de la variab

o de la proba

n cambio de

pueda aplica

 

= 0 y σ = l.

y varianza

 ón normal es

a es excesiva

e X tiene un

mayoría de

ual, cuando

reo han mos

) influye mu

de μ nos da

del ancho d

ble aleatoria

abilidad para

variable de

ar a cualquie

σ2, entonce

stándar cuand

amente impo

na distribuci

e las distrib

n es grand

strado que p

uy poco sobr

los puntos

de la curva,

en torno a

a cada ocasi

x por z con

er caso en q

es, la variab

do n → ∞”.

ortante, porq

ión que difie

uciones de

de garantiza

para n > 50

re la forma

de

es

la

ión

n el

que

ble

que

ere

X

la

la

en

Page 79: Estadistica

100 m

por f(x

10 no

denota

Pu

que la

2.

En la sigu

muestras de t

x) = 1 con X

es una mues

Si X1 = 1 ó

a el número t

uesto que, la

variable Z d

Generalme

conocidos

es decir, ob

valor verda

,...., xn de

regularmen

es la func

desconocid

medio de l

número qu

sobre qué t

uiente figura,

tamaño n =

X ε [0, 1]. La

stra grande.

ó 0 represen

total de suce

media y la v

del teorema d

Z   

ente estos p

o bien no pu

btener un va

adero del pa

valores extr

nte es desco

ción de dis

do θ. A este

la estimación

ue se aproxi

tan próximo

, por ejempl

10, donde X

a convergenc

nta la ocurren

esos en n eve

    X1

varianza de X

de límite cen

 μ √σ

parámetros

ueden ser co

alor o conjun

arámetro; est

raídos de di

onocida, pero

stribución d

e parámetro d

n. Hemos de

ima al parám

está el estim

81

lo, se muest

X tiene una

cia hacia la n

ncia de éxito

entos, entonc

1  …...  Xn

Xi son dadas

ntral es:

      

 

(valores es

onocidos, po

nto de valore

ta estimación

cha població

o nos podem

de probabili

desconocido

e tener claro

metro pobla

mador Ô de d

tra la distrib

distribución

normal es mu

o o fracaso e

ces:

n      

s por p y pq

 √   

stadísticos d

or lo que se

es que se ap

n se hace a p

ón, cuya dis

mos aproxim

idad teórica

o θ es al que

que cualqui

cional desco

dicho parám

bución empír

n uniforme q

uy rápida aq

en el i-ésimo

respectivam

      

de la pobla

hace necesa

proximen lo

partir de una

stribución de

mar a ella por

a con un p

e pretendemo

er estimador

onocido θ,

metro θ.

Estadísti

rica de pa

que viene da

quí, aunque n

o evento y si

mente, tenem

ación) no s

ario estimarlo

más posible

muestra x1,

e probabilid

r F(x ; θ), q

parámetro fi

os conocer p

r puntual es

sin decir na

ica

ara

ada

n =

X

mos

on

os,

al

x2

dad

que

fijo

por

un

ada

Page 80: Estadistica

Ciencias Políticas y Administración Pública

82

La estimación de parámetros de la población es un importante problema de la

inferencia estadística, en la que a partir de los estadísticos muéstrales (tales como la media,

varianza, proporción de la muestra) se estiman los correspondientes parámetros de la

población (es decir, media, varianza, proporción de la población, etc.). Entonces, tenemos

que la teoría de la estimación se divide en dos campos esenciales, la teoría de la estimación

de punto y la teoría de la estimación de intervalo.

Los valores muéstrales son utilizados para formar una relación funcional Ô =

f(x1,....,xn ) que no contiene ningún valor desconocido. Esta relación Ô es denominada

estimador de θ.

Como las xi son variables aleatorias que tienen la distribución F(x ; 0), el estimador

Ô es una variable aleatoria cuya distribución dependerá por lo general de θ. Observe que

para cada muestra de tamaño n que sea obtenida, puede calcularse un valor de Ô, este valor

se conoce como estimación de θ: dicho de otra forma, una estimación es un valor

observado de la variable aleatoria Ô = f(x1 ,....,xn).

Cabe señalar que el parámetro θ es estimado por una cantidad única, razón por la

cual este tipo de estimación es conocida como estimación puntual.

Algo deseable de cualquier estimador Ô es que con alta probabilidad sus

estimaciones sean muy cercanas al verdadero parámetro poblacional θ, para esto es

necesario que la distribución de Ô esté bastante concentrada alrededor de θ.

3. Se dice que el estimador Ô = f(x1,....,xn ) es insesgado si su promedio es igual a θ,

es decir, si cumple:

E(Ô) = θ

4. Una propiedad deseable de todo estimador, es que a medida que el tamaño de la

muestra aumente, la dispersión alrededor del parámetro θ disminuya, esto es, para

cualquier número ε arbitrariamente pequeño:

Page 81: Estadistica

Estadística

83

Lim p(| Ô – θ | < ε) = 1 N→∞

A todo estimador que cumpla con esta propiedad se le conoce como estimador

consistente. Así, un estimador Ô = f(x1 ,....,xn) es consistente si su varianza E(Ô - θ)2,

tiende a tomar el valor cero cuando el tamaño de la muestra n tiende a tomar valores muy

grandes, es decir, tiende a infinito.

5. Otra propiedad de los estimadores es la eficiencia, decimos que si tenemos dos

estimadores Ô1 y Ô2, donde ambos son insesgados, el seleccionar de entre ellos “al

mejor” sería escoger al estimador más eficiente, lo cual se determina si la varianza

de éste σ2 Ô1 es menor que la del otro σ2 Ô2. Por lo que tenemos que Ô1 es más

eficiente que Ô2 si:

E(Ô1-θ)2 < E(Ô2-θ)2

La eficiencia relativa de Ô1 con respecto a Ô2 se encuentra a partir de la razón:

E(Ô1 - θ)2 E(Ô2 - θ)2

Si esta razón es mayor que 1, entonces Ô2 es más eficiente que Ô1 y en caso

contrario (menor que uno), se dice que Ô1 es más eficiente que Ô2.

6. Debido a que cualquier información que sea recabada implica un costo, tanto

monetario como de tiempo, es importante no desperdiciar información, es por esto

que existen los estimadores que en su cálculo incluyen toda la información

disponible: los estimadores suficientes.

Ejemplo: La media es un estimador suficiente para la media poblacional μ, a diferencia

de la mediana y la moda en cuyo cálculo no interviene toda la información disponible.

Page 82: Estadistica

Ciencias Políticas y Administración Pública

84

7. Todo estimador puntual Ô no es más que una aproximación al parámetro

desconocido θ, debido a este desconocimiento no tenemos información precisa de

la proximidad entre ambos. Esta falta de información da lugar a la necesidad de que

una estimación se acompañe simultáneamente con un enunciado de la probabilidad

de esa estimación.

Un estimador de intervalo es aquel estimador Ô que toma un conjunto de valores

sucesivos entre dos puntos I y S, tal que el intervalo contiene al parámetro poblacional θ

con una probabilidad previamente determinada. Es decir, debido al desconocimiento de θ

nunca puede ser conocido el valor de la distancia | Ô - θ |, pero afortunadamente sí se puede

dar una medida en términos probabilísticos de la proximidad de Ô con respecto a θ.

8. En 1937 el profesor J. Neyman propuso un método de estimación, conocido como

intervalos de confianza, el cual permite dar aproximaciones de θ en la forma I < θ <

S junto con un valor de la probabilidad asociado a este intervalo, donde I y S se

obtienen a partir de una muestra.

Así, considérese una muestra aleatoria de tamaño n extraída de una población normal de

varianza σ2 y supóngase que el estadístico muestral es Ô. El problema consiste en estimar el

parámetro θ de la población utilizando un intervalo de valores de la variable aleatoria X.

Puesto que σ2 es la varianza de la población, tenemos que σ2Ô es la varianza de la

distribución muestral del estimador Ô. Aunque θ es un valor desconocido, se sabe por la

teoría del muestreo que Ô es una variable aleatoria con distribución de probabilidad cuya

media y varianza están dadas por μÔ y σ2 Ô.

9. Supongamos que Ô ≡ , aunque el valor de μ es desconocido sabemos que es una

variable aleatoria cuya distribución de probabilidad (distribución muestral de )

tendrá por media y varianza μ y σ2 .

Además, por el teorema central del límite, está distribuida normalmente con media μ

y varianza de tal forma que para encontrar el valor de a en la relación de probabilidad

p(-a < X < a) = β se estandariza, quedando:

Page 83: Estadistica

Estadística

85

p –   σ 

   σ 

   σ 

 

sustituyendo Z = σ 

resulta:

p(-Z <  σ 

< Z) = β

de donde:

p( – Z σ < μ < + Z σ ) = β

observa que el intervalo + Z σ cubre la media poblacional μ con probabilidad β, lo cual

puede ser interpretado de la siguiente forma: Al ser el intervalo mencionado una variable

aleatoria que cambia para cada muestra de tamaño n extraída de la población, entonces el β

% de dichos intervalos contiene a la media.

10. Supongamos que x1, x2,….., xn son los valores obtenidos de una muestra aleatoria

de tamaño n extraída de una población cuya media μ es desconocida pero cuya

varianza σ2 se supone conocida, se distinguirán dos casos:

a) La población está normalmente distribuida.

b) La muestra es grande (n ≥ 30) y la media puede considerarse normalmente

distribuida con media μ y varianza σ2 =

En ambos casos la probabilidad de que la dispersión de | - μ | sea menor o igual a zσ

será igual a 1 - α, que es el intervalo de confianza.

Si la varianza de la población no es conocida, comúnmente se estima calculando la

varianza S2 de la muestra, con lo cual los intervalos de confianza para la media μ pueden

expresarse:

Page 84: Estadistica

Cienci

11

poblac

si el m

para la

n >30

confia

ias Políticas

. Si el estim

una pobla

probabilida

donde p e

obtenidos d

son dados

Para el cas

ción finita, p

muestreo es s

Para calcu

a proporción

0. Un métod

anza determin

s y Administ

mador Ô es la

ación binom

ad de éxito)

es la proporc

de σp, se tie

por:

p

so de muestr

para muestra

p

sin reemplaz

ularse estos l

n poblaciona

do más exa

nado por z, e

Z =

tración Públ

- Z

a proporción

mial en la q

), los límites

ción de éxit

ne que los lí

z =

ras en una p

s de tamaño

p z

o de una pob

límites de co

al p, que gen

acto para ob

es transform

lica

86

 μ  

n de éxitos en

que p es la

s de confian

tos en la m

ímites de con

p z

población in

n >30, y po

= p z

blación finit

onfianza pue

neralmente d

btener estos

mar la propor

+ Z

n una muestr

a proporción

nza para p v

muestra de ta

nfianza para

nfinita, o con

r:

a de tamaño

ede utilizars

da una aprox

límites de

rción p a uni

ra de tamaño

n de éxitos

vienen dados

amaño n. Co

a la proporció

n reemplazam

N.

se el estimad

ximación sat

confianza a

dades tipific

o n extraída

(es decir,

s por p ± zσ

on los valor

ón poblacion

miento en u

dor muestral

tisfactoria pa

a un nivel

cadas.

de

la

σp,

res

nal

una

l p

ara

de

Page 85: Estadistica

Estadística

87

donde despejando p, queda:

p =        

 

Para poblaciones que tienen una distribución binomial se pueden encontrar

intervalos de confianza para la media de la población, o sea para la proporción de éxitos en

que no se conoce ésta por medio de utilizar la proporción de éxitos de una muestra p, así los

límites de confianza para la proporción p en la población se obtienen a partir de la relación:

p ± zασp

donde p es la proporción en la muestra extraída.

Como estamos utilizando la tabla normal de áreas, es decir, aproximando la

distribución binomial a la normal, en ambos casos se requiere de muestras “grandes”, o sea,

mayores de 25 observaciones.

Entonces, de manera general el intervalo para proporciones es:

p(p – zαp p p + zαp) = 1 - α

12. El concepto de intervalo de confianza se utiliza también para la determinación del

tamaño de la muestra. Por dos razones es importante estimar el tamaño de la

muestra n antes de hacer una investigación: la primera, consiste en que si se

selecciona una muestra muy pequeña, la precisión del intervalo puede ser muy baja

por lo tanto, éste carecerá de utilidad, implicando un aumento posterior de los

costos al aumentar la muestra; la segunda razón, es que si se trabaja con una

muestra grande se están desperdiciando recursos económicos y de tiempo.

Page 86: Estadistica

Ciencias Políticas y Administración Pública

88

Una pregunta frecuente que se plantea el estadígrafo es ¿cuántos casos necesito? La

respuesta depende, por supuesto, de lo que se pretenda hacer con los resultados de la

muestra. Por lo regular, lo que hemos de hacer es remontarnos hacia atrás, a partir de los

datos que esperamos obtener, para poder determinar el tamaño desconocido de la muestra.

Una vez que hemos decidido el intervalo de confianza deseado, podemos poner los valores

correspondientes en la fórmula y decidir la amplitud de dicho intervalo. Esto significa que

para poder resolver nuestra fórmula con respecto al tamaño de la muestra n, hemos de

conocer las demás cantidades de la fórmula, para que ésta se convierta en un sencillo

problema algebraico.

Antes de poder dar respuesta a la cuestión del tamaño de la muestra, necesitamos

obtener los siguientes elementos de información:

1) El nivel de confianza a utilizar

2) el grado de exactitud con que deseamos apreciar el parámetro y,

3) alguna estimación razonable de los valores de cualquiera de los parámetros que

puedan aparecer en la fórmula.

Estos elementos de información se requieren debido a que:

1) Es necesario establecer el grado de confianza de los valores puesto que inciden en el

tamaño de la muestra.

2) El grado de precisión de los resultados proporcionados por la muestra para

establecer más o menos cuánta aproximación se desea.

3) Se requiere conocer la tendencia de los estadísticos de acuerdo con el

comportamiento histórico de dichos parámetros.

Page 87: Estadistica

Estadística

89

Bibliografía general

CHAO, Lincon. Estadística para las ciencias administrativas. México, Mc Graw Hill, 1985. HOLGUÍN Quiñones, Fernando. Estadística descriptiva aplicada a las ciencias sociales. México, FCPyS-UNAM (Serie Estudios, 13), 1970. MENDENHALL, Reinmuth. Estadística para administración y economía. México, Grupo Editorial Iberoamericano, 1990. NÚÑEZ del Prado, Arturo y Benavente. Estadística básica para planificación. México, Siglo XXI, 1990. SANTALÓ, Luis. Probabilidad e inferencia estadísticas. Washington, OEA, 1975. SPIEGEL, Murray. Estadística. Mc Graw Hill (Serie Schaum's), 1970.

Page 88: Estadistica

APUNTES 

Page 89: Estadistica
Page 90: Estadistica
Page 91: Estadistica
Page 92: Estadistica

DATOS DEL TUTOR

NOMBRE 

CORREO ELECTRÓNICO

DIRECTORIO DEL GRUPO

NOMBRE CORREO ELECTRÓNICO 

 

Page 93: Estadistica

NOMBRE CORREO ELECTRÓNICO 

 

FECHAS DE TUTORÍA