estadistica aplicada
Post on 25-Jul-2015
832 Views
Preview:
TRANSCRIPT
Material de Clases © German Pomachagua Perez 1-sep-11
Germán Elías Pomachagua Pérez
gpomachagua@hotmail.com
CLASE 01: Conceptos básicos
Material de Clases © German Pomachagua Perez 1-sep-11
Que deberían saber al terminar esta clase:
Que queremos significar por estadística Que entendemos por estadística descriptiva e inferencial. Que es una población y que una muestra. Que es una variable, el dato y los datos Cuando la información se refiere a un parámetro o un estimador Distinguir cuando una variable es cualitativa y cuando cuantitativa. Distinguir entre una variable discreta y continua. Distinguir las fuentes de datos
OBJETIVOS
Material de Clases © German Pomachagua Perez 1-sep-11
INTRODUCCIÓN
No se puede administrar lo que no se mide.
Las mediciones son la clave. Si usted no
puede medirlo, no puede controlarlo. Si no
puede controlarlo, no puede adminístralo. Si
no puede adminístralo, no puede mejorarlo. La
falta sistemática o ausencia estructural de
estadísticas en las organizaciones impide una
administración científica de las mismas.
Material de Clases © German Pomachagua Perez 1-sep-11
INTRODUCCIÓN
Dirigir sólo en base a datos financieros del pasado,
realizar predicciones basadas más en la intuición, y
tomar decisiones desconociendo las probabilidades de
éxito u ocurrencia, son sólo algunos de los problemas o
inconvenientes más comunes hallados en las empresas
Peter Drucker hace dos afirmaciones básicas.
Primero, afirma que pocos factores son tan
importantes para la actuación de la organización
como la medición. Segundo, lamenta el hecho de que
la medición sea el área más débil de la gestión en
muchas empresas.
Material de Clases © German Pomachagua Perez 1-sep-11
Sin estadísticas una empresa carece de capacidad para
reconocer qué actividades o productos le generan
utilidades, y cuáles sólo pérdidas. No contar con datos
ni interpretarlos correctamente es para los
administradores como caminar en la oscuridad. Contar
con los datos les ilumina, les permite ver lo que está
aconteciendo y en consecuencia tomar las medidas más
apropiadas
INTRODUCCIÓN
Material de Clases © German Pomachagua Perez 1-sep-11
En un estudio de mercado, se toma una muestra de clientes y se pide la opinión de las personas acerca de las calidades de cierto producto
El comité ejecutivo de un hotel utiliza las estadísticas para medir la satisfacción del cliente.
Los análisis de control de calidad necesitan de la obtención de
información acerca de los productos que son fabricados.
APLICACIONES
En una industria, se hace inspección de los artículos comprados como materia prima. Se debe entonces hacer un muestreo para contar los artículos defectuosos en el lote comprado.
Material de Clases © German Pomachagua Perez 1-sep-11
Es una ciencia que
comprende diversas
técnicas para : RECOLECTAR
ORGANIZAR
ANALIZAR
INTERPRETAR
DATOS
¿Qué es Estadística ?
Es una ciencia que constantemente
proporciona métodos y técnicas
para mejorar la calidad de las
observaciones científicas, y ayuda
a la toma de decisiones en
condiciones de incertidumbre.
Material de Clases © German Pomachagua Perez 1-sep-11
Introducción a la toma de
decisiones
1-2
PROBLEMA ANÁLISIS DE
LA
INFORMACIÓN
TOMA DE
UNA
DECISIÓN
ACCCIÓN
Material de Clases © German Pomachagua Perez 1-sep-11
¿Quienes usan la estadística? Organismos oficiales.
Diarios y revistas.
Políticos.
Deportes.
Marketing.
Control de calidad.
Administradores.
Investigadores científicos.
Médicos
etc.
Material de Clases © German Pomachagua Perez 1-sep-11
Es el valor de la variable.
Ejemplo :
Si un DATO es útil para tomar decisiones se convierte
en INFORMACIÓN.
1.3 ¿Qué son DATOS ?
Edad del paciente
Peso
Tiempo permanencia
Temperatura corporal
Profesión
27
70
5
37,5
Contador
años
Kg.
días
°C
---
Variable Datos Unidad de
medida
Material de Clases © German Pomachagua Perez 1-sep-11
DIVISION DE LA ESTADÍSTICA
Estadística
Descriptiva Inferencial
Material de Clases © German Pomachagua Perez 1-sep-11
ESTADÍSTICA DESCRIPTIVA: Método de recolectar, organizar, resumir, analizar e interpretar los datos. Tiene como objetivo presentar los datos obtenidos en forma resumida, clara y comprensible
Ejemplo 1: Los datos del Censo de población de 2006. Ejemplo 2: La cantidad de robos ocurridos el último mes en el distrito de Surco. Ejemplo 3: La nota promedio del curso de Estadística General de los alumnos del grupo 1.
DIVISION DE LA ESTADISTICA
Mencionamos algunos procedimientos: Tablas de distribuciones de frecuencia Gráficos de distribución de frecuencias Diagramas de cajas Diagramas de tallos y hojas Estadísticos de tendencia central, dispersión y de forma
Material de Clases © German Pomachagua Perez 1-sep-11
ESTADÍSTICA DESCRIPTIVA: Algunos procedimientos
<Xi-1 - Xi] fi hi Fi Hi
<38 - - 45] 3 0.14 3 0.14
<45 - - 52] 2 0.10 5 0.24
<52 - - 59] 7 0.33 12 0.57
<59 - - 66] 3 0.14 15 0.71
<66 - -73] 6 0.29 21 1.00
21 1.00
Gráficos de distribución de
frecuencias EDAD Stem-and-Leaf Plot
Frequency Stem & Leaf
1,00 3 . 9
3,00 4 . 029
8,00 5 . 14678889
5,00 6 . 34689
4,00 7 . 0012
Tabla de Frecuencias
2080N =
SEXO
MUJERHOMBRE
ED
AD
25
24
23
22
21
20
19
18
17
46
9428659343
62477141
52
Grafico de Cajas y Bigotes
Diagrama de Tallos y hojas
Material de Clases © German Pomachagua Perez 1-sep-11
Estadística Inferencial
Muestra
Estimador
POBLACIÓN
Parámetro
DIVISION DE LA ESTADISTICA
Inferencia
Es un conjunto de métodos que permiten efectuar una estimación, predicción o generalización sobre una población, basado en el análisis de datos de una
muestra.
Ejemplo 1: Una encuesta desarrollada por IBOPE, en marzo 2011, dice que el rating de radio en la Gran Lima esta encabezado por RPP con un 10.5% seguido por RCN con 9.18%
Ejemplo 2: El INEI informó que la Encuesta Permanente de Hogares (EPH) del mes de marzo de 2011 reporto la tasa mas alta de desempleo que ascendió al 10.3% a nivel nacional
Material de Clases © German Pomachagua Perez 1-sep-11
Material de Clases © German Pomachagua Perez 1-sep-11
DEFINICIONES BASICAS
Ejemplos: un alumno de la universidad, un turista nacional, un turista internacional, una ama de casa, un supermercado, una empresa de calzado, un mozo, un lugar turístico, un grifo, una persona, una familia etc.
Unidad Estadística: (Unidad de análisis) el elemento fundamental e indivisible de la población (persona, animal o cosa), sobre las cuales se va obtener datos, en otras palabras es el que proporciona el dato.
Material de Clases © German Pomachagua Perez 1-sep-11
Población
Conjunto de todas las unidades elementales
(personas, procesos o cosas) perfectamente
definidos de los cuales se desea obtener
información
Población y Muestra
Ejemplos :
• Los trabajadores afiliados a una AFP
• Los alumnos de las universidades publicas.
• Las historias clínicas de un hospital.
Material de Clases © German Pomachagua Perez 1-sep-11
POBLACION
Parámetro: Es un valor numérico que resume los datos de una población; para determinar su valor es necesario utilizar toda la información de la población (censo). Sólo hay un parámetro en cada población. Generalmente es desconocido y por lo tanto debe ser estimado
π : Proporción poblacional
: Media poblacional (mu)
2 : Varianza poblacional (sigma cuadrado)
Los más usados son:
Censo: Estudio realizado a todos y a cada uno de los individuos que forman parte de la población
Material de Clases © German Pomachagua Perez 1-sep-11
MUESTRA: Parte o subconjunto representativo de
una población, sus elementos son seleccionados
aleatoriamente o no con el objeto de investigar las
características de la población de la cual proceden.
Muestreo: Es un procedimiento de selección de los
elementos a ser estudiados o encuestados
Material de Clases © German Pomachagua Perez 1-sep-11
Muestreo Actividad por la cual se toman muestras de una
población de elementos de los cuales vamos a tomar ciertos criterios de decisión.
No Si
Material de Clases © German Pomachagua Perez 1-sep-11
p Proporción muestral
x Media muestral.
Ejemplo - De los 100 estudiantes entrevistados, el 70% apoya
la resolución sobre la vacancia del Director
Los más usados son:
Varianza muestral 2s
Estimador (estadígrafo): Es un valor numérico que resume los datos de una muestra.
Su valor es usado con propósitos de estimación de los parámetros de una población, de la cual se extrajo la muestra.
Material de Clases © German Pomachagua Perez 1-sep-11
RESUMEN
Población (N)
µ
σ2
π
MUESTRA (n)
MUESTREO x
2S
pINFERENCIA
Material de Clases © German Pomachagua Perez 1-sep-11
Material de Clases © German Pomachagua Perez 1-sep-11
Ejemplo 1: Se ha hecho un estudio en SJL para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferían esta marca.
a. ¿Qué constituye la muestra?
b. ¿Qué constituye la población?
c. ¿Cuál es la proporción, dentro de la muestra, de las amas de casa que prefieren la marca del detergente?
Solución:
a) El conjunto de respuestas que dieron las 50 amas de casa.
b) El conjunto formado por las posibles respuestas de las amas de casa de SJL
c) Es el estimador proporcional
300.6
50
xp
n
Material de Clases © German Pomachagua Perez 1-sep-11
Ejemplo 2: Cierta universidad realizo un censo estudiantil
observándose que:
El ingreso familiar promedio mensual de los alumnos es de
S/.2,500, y el ingreso familiar promedio mensual de 100
alumnos escogidos al azar es de S/. 2,250
Hallar: La población, el parámetro, la muestra, el estimador.
La población : Es la totalidad de los alumnos de la
Universidad (N)
El parámetro: μ=S/2,500
La muestra: Los 100 alumnos elegidos al azar (n=100).
El estimador: la media muestral
/ 2,250x S
Material de Clases © German Pomachagua Perez 1-sep-11
Ejemplo 3: Una compañía produce poleas que se supone tengan un diámetro promedio de 2.50 centímetros, según requerido por el comprador. Un equipo de ingenieros examina la producción rutinariamente para velar que se cumpla con las especificaciones. Si encuentran que las poleas no cumplen con las especificaciones establecidas, las máquinas que las producen son ajustadas. Ellos seleccionan una muestra de 100 poleas de un lote producido en la fábrica y encuentran con que el diámetro promedio es de 2.51 centímetros.
a) Indica cuál es el problema que debe ser resuelto.
b) En términos de este problema, indica explícitamente cuál es
La población
El parámetro
El estimador
La variable que se debe medir
La muestra
Material de Clases © German Pomachagua Perez 1-sep-11
Pasos en un estudio estadístico
Plantear hipótesis sobre una población
Los fumadores tienen “más faltas” laborales que los
no fumadores
¿En qué sentido? ¿Mayor número? ¿Tiempo promedio?
Decidir qué datos recoger (diseño de experimentos)
Qué individuos pertenecerán al estudio (muestras)
Fumadores y no fumadores en edad laboral.
Criterios de exclusión ¿Cómo se eligen? ¿Descartamos
los que padecen enfermedades crónicas?
Qué datos recoger de los mismos (variables)
Número de faltas
Tiempo de duración de cada falta
¿Sexo? ¿Sector laboral? ¿Otros factores?
No tienes que
entenderlo (aún)
Material de Clases © German Pomachagua Perez 1-sep-11
Pasos en un estudio estadístico
Recoger los datos (muestreo)
¿Estratificado? ¿Sistemáticamente?
Describir (resumir) los datos obtenidos
tiempo promedio de faltas en fumadores y no (estadísticos)
% de bajas por fumadores y sexo (frecuencias), gráficos,...
Realizar una inferencia sobre la población
Los fumadores faltan al menos 10 días/año más que los no fumadores.
Cuantificar la confianza en la inferencia
Nivel de confianza del 95%
Significación del contraste: p=2%
Material de Clases © German Pomachagua Perez 1-sep-11
VARIABLES
Variable
Cualitativa
Nominal Ordinal
Cuantitativa
Discreta Continua
Es una característica de los elementos que se va investigar y que toma diferentes valores o categorías.
Material de Clases © German Pomachagua Perez 1-sep-11
Tipos de variables: Según su naturaleza
Cualitativas o Categóricas
Son aquellas características que se pueden clasificar, pero no medirse
Nominales: Si sus valores no se pueden ordenar
Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
Ordinales: Si sus valores se pueden ordenar
Calificaciones, Grado de satisfacción, Intensidad del dolor
Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con
ellos)
Discretas: Si toma valores enteros
Número de hijos, Número de cigarrillos, Numero de accidentes
Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
Altura, Presión intraocular, talla, peso
Material de Clases © German Pomachagua Perez 1-sep-11
TIPOS DE VARIABLES:
Según su relación
Independiente (X): Causal o determinante de los cambios en la v.
dependiente, es manipulada por el investigador.
Dependiente (Y): Efecto como resultado de la manipulación de
la v. independiente, llamada también como variable resultado.
Interviniente: Puede mediar en la relación entre las variables
independiente y dependiente
Ejemplo 1: ¿Cuál es la incidencia del nivel de cariño que reciben los
estudiantes de la ciudad de Lima en su rendimiento escolar?
Material de Clases © German Pomachagua Perez 1-sep-11
Relación Variable Independiente “X”
Variable Dependiente “Y”
Causa /Efecto Precio Demanda
Antecedente/Consecuente Hábito de Fumar Cáncer Pulmonar
Estímulo /Respuesta Programa Educativo Nivel de Aprendizaje
Ejemplo2
Material de Clases © German Pomachagua Perez 1-sep-11
Unidad de análisis / Variable
Unidad de análisis Variable (Característica)
- Persona
- Familia
- Empresa
- Casa
- Salario, cargo, ocupación, edad, sexo, estado civil.
- Ingreso familiar, consumo familiar, número de hijos.
- Consumo de energía, actividad económica, inversión anual, número de trabajadores, volumen de ventas.
- Propia/Alquilada, área techada, número de habitaciones, número de moradores, material usado en su construcción.
Material de Clases © German Pomachagua Perez 1-sep-11
Abusos que se pueden cometer con la
Estadística
Conclusiones erróneas debido a que los datos son numéricamente insuficientes.
Representaciones gráficas engañosas (escalas).
Datos muestrales no representativos:
Muestra que no incluye a elementos de toda la población.
Ciertas categorías de personas no responden correctamente.
Respuestas voluntarias (sesgadas).
Material de Clases © German Pomachagua Perez 1-sep-11
EJERCICIO Clasificar las siguientes variables
Preferencias de cerveza. Velocidad en Km/h. El peso en Kg. Signo del zodiaco. Nivel educativo (primario secundario, superior). Años de estudios completados. Tipo de enseñanza (privada o pública). Número de empleados de una empresa. La temperatura de un enfermo en grados Celsius. La clase social (baja, media o alta). La presión de un neumático en Nw/cm2 Capacidad de un disco duro de un ordenador, en GB. Velocidad de transferencia de ficheros en una red, en bps. Resultado de un test que comprueba si un ordenador tiene virus o no. Tipos de impresoras. Velocidad de acceso a un disco duro, en milisegundos
Material de Clases © German Pomachagua Perez 1-sep-11
Clasificar cada una de las siguientes variables: a) Distancia diaria recorrida por cada estudiante para ir de su
casa a la universidad. b) Tiempo que requiere un estudiante para responder a un
examen. c) Llamadas que llegan a la central telefónica de la USB en un
día. d) Preferencia por cierta marca de refresco. e) Sexo de las estudiantes que toman el curso de estadística en
el semestre. f) Número de acciones vendidas en un día en la Bolsa de
Valores.
Material de Clases © German Pomachagua Perez 1-sep-11
HOJA DE COMPROBACIÓN
1. L a estadística es una ciencia que sólo analiza datos
2. Los datos se organizan para mejorar su comprensión
3 El muestreo permite disponer de los datos en menor tiempo,
reduciendo costos
4 .El parámetro representa a una población
Material de Clases © German Pomachagua Perez 1-sep-11
5. El muestreo permite disponer de los datos en menor tiempo,
reduciendo costos.
6. El parámetro representa a una población
7. .Existen tanto estimadores como muestras se extraigan de una
población
Material de Clases © German Pomachagua Perez 1-sep-11
9.Los estimadores se representan por letras griegas
10.En la estadística descriptiva, el análisis se limita a un
conjunto de datos
11.Las técnicas que permiten estimar un parámetro a partir de
datos muestrales se denomina Estadística Inferencial
12.El error del muestreo consiste en la equivocación cuando
seleccionamos muestras
8.Diferentes muestras, extraídas de una misma población,
ocasionan diferente Valores del estimador
top related