estadistica aplicada

39
Material de Clases © German Pomachagua Perez 1-sep-11 Germán Elías Pomachagua Pérez [email protected] CLASE 01: Conceptos básicos

Upload: milagros-matias-vicente

Post on 25-Jul-2015

832 views

Category:

Documents


5 download

TRANSCRIPT

Page 1: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Germán Elías Pomachagua Pérez

[email protected]

CLASE 01: Conceptos básicos

Page 2: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Que deberían saber al terminar esta clase:

Que queremos significar por estadística Que entendemos por estadística descriptiva e inferencial. Que es una población y que una muestra. Que es una variable, el dato y los datos Cuando la información se refiere a un parámetro o un estimador Distinguir cuando una variable es cualitativa y cuando cuantitativa. Distinguir entre una variable discreta y continua. Distinguir las fuentes de datos

OBJETIVOS

Page 3: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

INTRODUCCIÓN

No se puede administrar lo que no se mide.

Las mediciones son la clave. Si usted no

puede medirlo, no puede controlarlo. Si no

puede controlarlo, no puede adminístralo. Si

no puede adminístralo, no puede mejorarlo. La

falta sistemática o ausencia estructural de

estadísticas en las organizaciones impide una

administración científica de las mismas.

Page 4: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

INTRODUCCIÓN

Dirigir sólo en base a datos financieros del pasado,

realizar predicciones basadas más en la intuición, y

tomar decisiones desconociendo las probabilidades de

éxito u ocurrencia, son sólo algunos de los problemas o

inconvenientes más comunes hallados en las empresas

Peter Drucker hace dos afirmaciones básicas.

Primero, afirma que pocos factores son tan

importantes para la actuación de la organización

como la medición. Segundo, lamenta el hecho de que

la medición sea el área más débil de la gestión en

muchas empresas.

Page 5: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Sin estadísticas una empresa carece de capacidad para

reconocer qué actividades o productos le generan

utilidades, y cuáles sólo pérdidas. No contar con datos

ni interpretarlos correctamente es para los

administradores como caminar en la oscuridad. Contar

con los datos les ilumina, les permite ver lo que está

aconteciendo y en consecuencia tomar las medidas más

apropiadas

INTRODUCCIÓN

Page 6: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

En un estudio de mercado, se toma una muestra de clientes y se pide la opinión de las personas acerca de las calidades de cierto producto

El comité ejecutivo de un hotel utiliza las estadísticas para medir la satisfacción del cliente.

Los análisis de control de calidad necesitan de la obtención de

información acerca de los productos que son fabricados.

APLICACIONES

En una industria, se hace inspección de los artículos comprados como materia prima. Se debe entonces hacer un muestreo para contar los artículos defectuosos en el lote comprado.

Page 7: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Es una ciencia que

comprende diversas

técnicas para : RECOLECTAR

ORGANIZAR

ANALIZAR

INTERPRETAR

DATOS

¿Qué es Estadística ?

Es una ciencia que constantemente

proporciona métodos y técnicas

para mejorar la calidad de las

observaciones científicas, y ayuda

a la toma de decisiones en

condiciones de incertidumbre.

Page 8: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Introducción a la toma de

decisiones

1-2

PROBLEMA ANÁLISIS DE

LA

INFORMACIÓN

TOMA DE

UNA

DECISIÓN

ACCCIÓN

Page 9: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

¿Quienes usan la estadística? Organismos oficiales.

Diarios y revistas.

Políticos.

Deportes.

Marketing.

Control de calidad.

Administradores.

Investigadores científicos.

Médicos

etc.

Page 10: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Es el valor de la variable.

Ejemplo :

Si un DATO es útil para tomar decisiones se convierte

en INFORMACIÓN.

1.3 ¿Qué son DATOS ?

Edad del paciente

Peso

Tiempo permanencia

Temperatura corporal

Profesión

27

70

5

37,5

Contador

años

Kg.

días

°C

---

Variable Datos Unidad de

medida

Page 11: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

DIVISION DE LA ESTADÍSTICA

Estadística

Descriptiva Inferencial

Page 12: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

ESTADÍSTICA DESCRIPTIVA: Método de recolectar, organizar, resumir, analizar e interpretar los datos. Tiene como objetivo presentar los datos obtenidos en forma resumida, clara y comprensible

Ejemplo 1: Los datos del Censo de población de 2006. Ejemplo 2: La cantidad de robos ocurridos el último mes en el distrito de Surco. Ejemplo 3: La nota promedio del curso de Estadística General de los alumnos del grupo 1.

DIVISION DE LA ESTADISTICA

Mencionamos algunos procedimientos: Tablas de distribuciones de frecuencia Gráficos de distribución de frecuencias Diagramas de cajas Diagramas de tallos y hojas Estadísticos de tendencia central, dispersión y de forma

Page 13: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

ESTADÍSTICA DESCRIPTIVA: Algunos procedimientos

<Xi-1 - Xi] fi hi Fi Hi

<38 - - 45] 3 0.14 3 0.14

<45 - - 52] 2 0.10 5 0.24

<52 - - 59] 7 0.33 12 0.57

<59 - - 66] 3 0.14 15 0.71

<66 - -73] 6 0.29 21 1.00

21 1.00

Gráficos de distribución de

frecuencias EDAD Stem-and-Leaf Plot

Frequency Stem & Leaf

1,00 3 . 9

3,00 4 . 029

8,00 5 . 14678889

5,00 6 . 34689

4,00 7 . 0012

Tabla de Frecuencias

2080N =

SEXO

MUJERHOMBRE

ED

AD

25

24

23

22

21

20

19

18

17

46

9428659343

62477141

52

Grafico de Cajas y Bigotes

Diagrama de Tallos y hojas

Page 14: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Estadística Inferencial

Muestra

Estimador

POBLACIÓN

Parámetro

DIVISION DE LA ESTADISTICA

Inferencia

Es un conjunto de métodos que permiten efectuar una estimación, predicción o generalización sobre una población, basado en el análisis de datos de una

muestra.

Ejemplo 1: Una encuesta desarrollada por IBOPE, en marzo 2011, dice que el rating de radio en la Gran Lima esta encabezado por RPP con un 10.5% seguido por RCN con 9.18%

Ejemplo 2: El INEI informó que la Encuesta Permanente de Hogares (EPH) del mes de marzo de 2011 reporto la tasa mas alta de desempleo que ascendió al 10.3% a nivel nacional

Page 15: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Page 16: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

DEFINICIONES BASICAS

Ejemplos: un alumno de la universidad, un turista nacional, un turista internacional, una ama de casa, un supermercado, una empresa de calzado, un mozo, un lugar turístico, un grifo, una persona, una familia etc.

Unidad Estadística: (Unidad de análisis) el elemento fundamental e indivisible de la población (persona, animal o cosa), sobre las cuales se va obtener datos, en otras palabras es el que proporciona el dato.

Page 17: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Población

Conjunto de todas las unidades elementales

(personas, procesos o cosas) perfectamente

definidos de los cuales se desea obtener

información

Población y Muestra

Ejemplos :

• Los trabajadores afiliados a una AFP

• Los alumnos de las universidades publicas.

• Las historias clínicas de un hospital.

Page 18: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

POBLACION

Parámetro: Es un valor numérico que resume los datos de una población; para determinar su valor es necesario utilizar toda la información de la población (censo). Sólo hay un parámetro en cada población. Generalmente es desconocido y por lo tanto debe ser estimado

π : Proporción poblacional

: Media poblacional (mu)

2 : Varianza poblacional (sigma cuadrado)

Los más usados son:

Censo: Estudio realizado a todos y a cada uno de los individuos que forman parte de la población

Page 19: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

MUESTRA: Parte o subconjunto representativo de

una población, sus elementos son seleccionados

aleatoriamente o no con el objeto de investigar las

características de la población de la cual proceden.

Muestreo: Es un procedimiento de selección de los

elementos a ser estudiados o encuestados

Page 20: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Muestreo Actividad por la cual se toman muestras de una

población de elementos de los cuales vamos a tomar ciertos criterios de decisión.

No Si

Page 21: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

p Proporción muestral

x Media muestral.

Ejemplo - De los 100 estudiantes entrevistados, el 70% apoya

la resolución sobre la vacancia del Director

Los más usados son:

Varianza muestral 2s

Estimador (estadígrafo): Es un valor numérico que resume los datos de una muestra.

Su valor es usado con propósitos de estimación de los parámetros de una población, de la cual se extrajo la muestra.

Page 22: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

RESUMEN

Población (N)

µ

σ2

π

MUESTRA (n)

MUESTREO x

2S

pINFERENCIA

Page 23: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Page 24: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Ejemplo 1: Se ha hecho un estudio en SJL para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferían esta marca.

a. ¿Qué constituye la muestra?

b. ¿Qué constituye la población?

c. ¿Cuál es la proporción, dentro de la muestra, de las amas de casa que prefieren la marca del detergente?

Solución:

a) El conjunto de respuestas que dieron las 50 amas de casa.

b) El conjunto formado por las posibles respuestas de las amas de casa de SJL

c) Es el estimador proporcional

300.6

50

xp

n

Page 25: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Ejemplo 2: Cierta universidad realizo un censo estudiantil

observándose que:

El ingreso familiar promedio mensual de los alumnos es de

S/.2,500, y el ingreso familiar promedio mensual de 100

alumnos escogidos al azar es de S/. 2,250

Hallar: La población, el parámetro, la muestra, el estimador.

La población : Es la totalidad de los alumnos de la

Universidad (N)

El parámetro: μ=S/2,500

La muestra: Los 100 alumnos elegidos al azar (n=100).

El estimador: la media muestral

/ 2,250x S

Page 26: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Ejemplo 3: Una compañía produce poleas que se supone tengan un diámetro promedio de 2.50 centímetros, según requerido por el comprador. Un equipo de ingenieros examina la producción rutinariamente para velar que se cumpla con las especificaciones. Si encuentran que las poleas no cumplen con las especificaciones establecidas, las máquinas que las producen son ajustadas. Ellos seleccionan una muestra de 100 poleas de un lote producido en la fábrica y encuentran con que el diámetro promedio es de 2.51 centímetros.

a) Indica cuál es el problema que debe ser resuelto.

b) En términos de este problema, indica explícitamente cuál es

La población

El parámetro

El estimador

La variable que se debe medir

La muestra

Page 27: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Pasos en un estudio estadístico

Plantear hipótesis sobre una población

Los fumadores tienen “más faltas” laborales que los

no fumadores

¿En qué sentido? ¿Mayor número? ¿Tiempo promedio?

Decidir qué datos recoger (diseño de experimentos)

Qué individuos pertenecerán al estudio (muestras)

Fumadores y no fumadores en edad laboral.

Criterios de exclusión ¿Cómo se eligen? ¿Descartamos

los que padecen enfermedades crónicas?

Qué datos recoger de los mismos (variables)

Número de faltas

Tiempo de duración de cada falta

¿Sexo? ¿Sector laboral? ¿Otros factores?

No tienes que

entenderlo (aún)

Page 28: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Pasos en un estudio estadístico

Recoger los datos (muestreo)

¿Estratificado? ¿Sistemáticamente?

Describir (resumir) los datos obtenidos

tiempo promedio de faltas en fumadores y no (estadísticos)

% de bajas por fumadores y sexo (frecuencias), gráficos,...

Realizar una inferencia sobre la población

Los fumadores faltan al menos 10 días/año más que los no fumadores.

Cuantificar la confianza en la inferencia

Nivel de confianza del 95%

Significación del contraste: p=2%

Page 29: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

VARIABLES

Variable

Cualitativa

Nominal Ordinal

Cuantitativa

Discreta Continua

Es una característica de los elementos que se va investigar y que toma diferentes valores o categorías.

Page 30: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Tipos de variables: Según su naturaleza

Cualitativas o Categóricas

Son aquellas características que se pueden clasificar, pero no medirse

Nominales: Si sus valores no se pueden ordenar

Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

Ordinales: Si sus valores se pueden ordenar

Calificaciones, Grado de satisfacción, Intensidad del dolor

Cuantitativas o Numéricas

Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con

ellos)

Discretas: Si toma valores enteros

Número de hijos, Número de cigarrillos, Numero de accidentes

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Altura, Presión intraocular, talla, peso

Page 31: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

TIPOS DE VARIABLES:

Según su relación

Independiente (X): Causal o determinante de los cambios en la v.

dependiente, es manipulada por el investigador.

Dependiente (Y): Efecto como resultado de la manipulación de

la v. independiente, llamada también como variable resultado.

Interviniente: Puede mediar en la relación entre las variables

independiente y dependiente

Ejemplo 1: ¿Cuál es la incidencia del nivel de cariño que reciben los

estudiantes de la ciudad de Lima en su rendimiento escolar?

Page 32: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Relación Variable Independiente “X”

Variable Dependiente “Y”

Causa /Efecto Precio Demanda

Antecedente/Consecuente Hábito de Fumar Cáncer Pulmonar

Estímulo /Respuesta Programa Educativo Nivel de Aprendizaje

Ejemplo2

Page 33: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Unidad de análisis / Variable

Unidad de análisis Variable (Característica)

- Persona

- Familia

- Empresa

- Casa

- Salario, cargo, ocupación, edad, sexo, estado civil.

- Ingreso familiar, consumo familiar, número de hijos.

- Consumo de energía, actividad económica, inversión anual, número de trabajadores, volumen de ventas.

- Propia/Alquilada, área techada, número de habitaciones, número de moradores, material usado en su construcción.

Page 34: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Abusos que se pueden cometer con la

Estadística

Conclusiones erróneas debido a que los datos son numéricamente insuficientes.

Representaciones gráficas engañosas (escalas).

Datos muestrales no representativos:

Muestra que no incluye a elementos de toda la población.

Ciertas categorías de personas no responden correctamente.

Respuestas voluntarias (sesgadas).

Page 35: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

EJERCICIO Clasificar las siguientes variables

Preferencias de cerveza. Velocidad en Km/h. El peso en Kg. Signo del zodiaco. Nivel educativo (primario secundario, superior). Años de estudios completados. Tipo de enseñanza (privada o pública). Número de empleados de una empresa. La temperatura de un enfermo en grados Celsius. La clase social (baja, media o alta). La presión de un neumático en Nw/cm2 Capacidad de un disco duro de un ordenador, en GB. Velocidad de transferencia de ficheros en una red, en bps. Resultado de un test que comprueba si un ordenador tiene virus o no. Tipos de impresoras. Velocidad de acceso a un disco duro, en milisegundos

Page 36: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

Clasificar cada una de las siguientes variables: a) Distancia diaria recorrida por cada estudiante para ir de su

casa a la universidad. b) Tiempo que requiere un estudiante para responder a un

examen. c) Llamadas que llegan a la central telefónica de la USB en un

día. d) Preferencia por cierta marca de refresco. e) Sexo de las estudiantes que toman el curso de estadística en

el semestre. f) Número de acciones vendidas en un día en la Bolsa de

Valores.

Page 37: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

HOJA DE COMPROBACIÓN

1. L a estadística es una ciencia que sólo analiza datos

2. Los datos se organizan para mejorar su comprensión

3 El muestreo permite disponer de los datos en menor tiempo,

reduciendo costos

4 .El parámetro representa a una población

Page 38: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

5. El muestreo permite disponer de los datos en menor tiempo,

reduciendo costos.

6. El parámetro representa a una población

7. .Existen tanto estimadores como muestras se extraigan de una

población

Page 39: ESTADISTICA APLICADA

Material de Clases © German Pomachagua Perez 1-sep-11

9.Los estimadores se representan por letras griegas

10.En la estadística descriptiva, el análisis se limita a un

conjunto de datos

11.Las técnicas que permiten estimar un parámetro a partir de

datos muestrales se denomina Estadística Inferencial

12.El error del muestreo consiste en la equivocación cuando

seleccionamos muestras

8.Diferentes muestras, extraídas de una misma población,

ocasionan diferente Valores del estimador