estadísticas pcq ip de chile 20091. estadística descriptiva: se encarga de recoger, ordenar y...

36
Estadísticas PCQ IP de Chile 2009 1

Upload: olegario-de-los-santos

Post on 29-Jan-2016

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 1

Page 2: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadística descriptiva:

Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para un análisis posterior.

1. Introducción a la Estadística

Estadística inductiva o inferencia estadística:

Se encarga de, obtener, a partir del estudio de una parte de una gran parte de un gran grupo de datos, conclusiones válidas sobre el grupo total e, incluso, calcula la probabilidad que dichas conclusiones sean realmente correctas.

Page 3: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 3

Page 4: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Información

Observación directa

Observación indirecta

Encuestas; recolección deresultados de una experiencia

Recolección de datos yaregistrados en ocasionesanteriores

La información necesaria sobre los datos a trabajar se obtiene por dos vías:

Page 5: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Cuando se tiene una serie de datos correspondientes a determinadas características de un grupo de objetos en estudio, resulta prácticamente imposible o poco realista observar la totalidad de los objetos individualmente, especialmente si son muy numerosos o de gran tamaño.

Por ello en vez de examinar todo el grupo, que se denomina población, lo que suele hacerse es examinar una pequeña parte del mismo, de menor tamaño, que se denomina muestra.

PoblaciónMuestra

N Tamaño de la población

n Tamaño de la muestra

Page 6: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Población Muestra

Parámetro EstadísticoLa medida usada para describir las características de una población.Para calcular un parámetro se emplea la información de toda la población, en consecuencia existe una certidumbre total sobre su aplicación.

La medida usada para describir las características de una muestra.Para calcular un estadístico se emplea la información de una muestra o de una parte de la población, en consecuencia existe un grado de incertidumbre sobre su aplicación

Page 7: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Variables o características estadísticasCorresponden a las propiedades que se pretenden estudiar y de que dispone cada uno de los objetos individuales de la población en particular.

Cualitativas (atributos)

Cuantitativas (datos)

No medibles numéricamente. Medibles numéricamente.Varían en forma discreta (como lo hacen los números enteros o en forma continua como los números reales.

Ejemplos: la variable sexo de un determinado curso. El atributo es masculino o femenino (variable dicotómica).La variable estado civil de los individuos: casado, soltero, divorciado o viudo.

Ejemplos: la cantidad de integrantes de una familia corresponde a una variable discreta, mientras que la estatura de los sujetos corresponde a una variable continua.

Page 8: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 8

CLASIFICACIÓN DE VARIABLES

  Los datos son valores o categorías especificas de las variables inherentes al problema.

Se presentarán dos criterios diferentes (no excluyentes y complementarios) para clasificar variables.

Page 9: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 9

Según Nivel de Medición

Variable Nominal

Esta es una variable cualitativa y sólo permite distinguir entre clases.

Ejemplo: Nacionalidad, Estado Civil, color de pelo, marca de las calculadoras, etc.

Page 10: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 10

Variable Ordinal: Esta es también una variable cualitativa, pero además existe una relación de orden en el recorrido de la variable.Ejemplo: Nivel Socioeconómico, Grado en la Fuerzas Armadas y de Orden, etc.

Variable Cuantitativa:Esta es una variable propiamente cuantitativa. TIENE SENTIDO Y ES POSIBLE efectuar operaciones aritméticas con el recorrido de estas variables

Ejemplo: Número de hijos, número de artefactos eléctricos que existen en el hogar, temperatura corporal, altura de los árboles, precio de las calculadoras, etc.

Según Nivel de Medición

Page 11: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 11

Según Tamaño de Recorrido:

Variable Discreta:

La variable tiene recorrido finito o a lo más numerable.

Ejemplos: Número de hijos, número de artefactos eléctricos que existen en el hogar, estado civil, nivel socioeconómico, sexo, etc.

 

Page 12: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 12

Variable Continua:

La variable tiene un recorrido infinito no numerable. Si una variable es continua, entre dos valores potencialmente observables siempre existe otro valor potencialmente observable.

Ejemplos: Temperatura corporal, altura de los árboles, precio de las calculadoras, etc.

Según Tamaño de Recorrido:

Page 13: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 13

Clasificación de las variables Clasificación de las variables estadísticasestadísticas

Nivel de Medición Tamaño de Recorrido

Cualitativa Nominal Ordinal

Cuantitativa Discreta Continua

Page 14: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 14

Variable Estadística

Cualitativa Cuantitativa

Nominal Ordinal Discreta Continua

Page 15: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 15

DISTRIBUCIÓN DE DISTRIBUCIÓN DE FRECUENCIASFRECUENCIAS

YY

TABLAS DE TABLAS DE FRECUENCIASFRECUENCIAS

2.2.

Page 16: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

¿Qué es una distribución de frecuencias ?¿Qué es una distribución de frecuencias ?

Es el conjunto formado por todos los valores que toma la variable estadística en estudio, junto a sus respectivas frecuencias.

La distribución de frecuencias se organiza en una tabla de frecuencias.

Estadísticas PCQ IP de Chile 2009 16

Page 17: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 17

¿Para qué se construyen las tablas de frecuencias ?

ORDENAR información

AGRUPAR información

RESUMIR información

Page 18: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 18

El formato general de una tabla estadística , llamada también TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE FRECUENCIAS es el siguiente:

Nombre de la variable Frecuencia

Categorías

o

Recorrido de la variable

Frecuencias

Observadas

TOTAL n

Page 19: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

En la siguiente tabla se presenta el motivo En la siguiente tabla se presenta el motivo de consulta en un centro médico, durante de consulta en un centro médico, durante una semana.una semana.

Motivo de la consulta Cantidad de pacientes

Bronquitis 19

Otitis 13

Heridas 7

Fracturas 18

Vacunas 20

Consultas Totales 77

Estadísticas PCQ IP de Chile 2009 19

Page 20: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 20

0

5

10

15

20

Histograma de frecuencias de consultas semanales

Bronquitis Otitis Heridas Fracturas Vacunas

Histograma de FrecuenciasHistograma de Frecuencias

Page 21: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Representaciones Estadísticas GráficasRepresentaciones Estadísticas Gráficas

Cuando se representa la distribución de frecuencias mediante una tabla de frecuencias, se consigue una lectura más fácil de la información, pero resulta aún más sencilla si se recurre a los gráficos estadísticos

Estadísticas PCQ IP de Chile 2009 21

Page 22: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Información en HistogramasInformación en Histogramas

0

2

4

6

8

10

12

14

0 1 2 3 4 5 6

Nº de Asignaturas No Aprobadas

Fre

cuen

cia

Abs

olut

a

Histograma de consultas semanales

VacunasBronquitis

Otitis

Fracturas

Fracturas

0

5

10

15

20

25

Frecuencias Porcentuales del Nº de Asignaturas No Aprobadas

15,0%

12,5%

30,0%

20,0%

7,5% 2,5% 12,5%

Estadísticas PCQ IP de Chile 2009 22

0,000

0,050

0,100

0,150

0,200

0,250

0,300

0,350

0,150 0,125 0,300 0,200 0,075 0,025 0,125

0 1 2 3 4 5 6

Frecuencia Relativa del Nº de Asignaturas No Aprobadas

Page 23: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Gráfico según la variable estadísticaGráfico según la variable estadísticaLa elección del gráfico más apropiado para representar algún tipo de variable, depende exclusivamente si ésta es cualitativa o cuantitativa. En general se pueden utilizar las siguientes:

Estadísticas PCQ IP de Chile 2009 23

Variable Tipo de Gráfico

Cualitativa •Circular•Gráfico de Barras

Cuantitativa Discreta •Circular•Polígono de Frecuencias

Cuantitativa Continua •Histograma•Polígono de Frecuencias

Page 24: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Frecuencia o Frecuencia Absoluta [ fi ]

Frecuencia Relativa [ hi ]

Es la cantidad de veces que se presenta un valor o categoría de una variable entre todos los datos agrupados observados en una población o en una muestra.La suma de todas las frecuencias de una tabla corresponde al tamaño de la muestra o de la población.

La cantidad de veces que aparece ese valor de la variable en relación al total de los datos de la población o muestra.La frecuencia relativa se puede expresar en términos de porcentaje o de proporción (tanto por uno).

Así, si hay n datos en total, una frecuencia fi representa una proporción hi del total, dada por:

Estadísticas PCQ IP de Chile 2009 24

1

1

para el caso de una muestra

para el caso de una población

p

ii

p

ii

f n

f N

Page 25: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

..

Estadísticas PCQ IP de Chile 2009 25

Frecuencia Absoluta Acumulada [ Fi ]

Frecuencia Relativa Acumulada [ Hi ]

En algunas ocasiones interesa conocer la cantidad de datos recolectados que se encuentra por encima o por debajo de un determinado valor de la variable en un conjunto de datos agrupados ordenados en forma creciente. La frecuencia absoluta acumulada corresponde a la suma de todas las frecuencias correspondientes a los datos menores o iguales al que se considera (el dato i )

Cuando interesa conocer la proporción de datos recolectados que se encuentra por encima o por debajo de un determinado valor de la variable, se define, hi , la frecuencia relativa acumulada de un valor de la variable a la razón entre la fi de ese valor y el tamaño de la muestra o población.

La frecuencia relativa acumulada puede ser expresada como fracción (tanto por uno) o en términos porcentuales H i (%)

1 1 11

con = i

i k i i ik

F f F F f F f

ii

FH

n

Page 26: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Clases de DistribucionesClases de Distribuciones

Distribuciones no Distribuciones no agrupadasagrupadas

Son aquellas en que los valores de la variable se exponen de forma individual. Este tipo de distribución sólo se utiliza con variables discretas y siempre que el tamaño de la muestra o población no sea excesivamente numeroso.

Distribuciones Distribuciones agrupadasagrupadas

Son aquellas en que los valores de la variable se exponen agrupadas en intervalos, llamados clases o intervalos de clases. Este tipo de distribución se utiliza siempre con variables continuas y a veces con variables discretas con gran cantidad de valores observados.

Estadísticas PCQ IP de Chile 2009 26

Page 27: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 27

Tabla de datos agrupadosTabla de datos agrupados

i Valores de la

variable X

iX

Frecuencia absoluta

if

1 1 x 1 f 2 2 x 2 f k kx kf p px pf

p

1i

nfi

Page 28: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

i iX if ih (%) ih

1 1 x 1 f n

fh 1

1 100(%) 11

n

fh

2 2 x 2 f n

fh 2

2 100(%) 22

n

fh

k kx kf n

fh k

k 100(%) n

fh k

k

p px pf n

fh p

p 100(%) n

fh p

p

p

1i

nfi

p

1i

p

1i

p

1i

11 i

ii f

nn

fh 001(%)

p

1i

ih

Estadísticas PCQ IP de Chile 2009 28

Page 29: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 29

i iX if iF iH

1 1 x 1 f 11 fF n

FH 1

1

2 2 x 2 f 21212 fffFF n

FH 2

2

k kx kf

k

iikkk ffFF

11 n

FH k

k

p px pf nfFfFFp

ii

p

iippp

111 1

n

n

n

FH p

p

p

1i

nfi

Page 30: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 30

i Xi (cm) fi hi hi(%) Fi Hi Hi (%)

1 160 4 0,29 29,0 4 0,29 29,0

2 163 1 0,07 7,0 5 0,36 36,0

3 165 2 0,14 14,0 7 0,50 50,0

4 170 1 0,07 7,0 8 0,57 57,0

5 173 3 0,21 21,0 11 0,79 79,0

6 176 1 0,07 7,0 12 0,86 86,0

7 178 2 0,14 14,0 14 1,00 100,0

Σ 14 1,00 100,0

Un ejemplo numérico de lo vistoUn ejemplo numérico de lo visto

Page 31: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 31

Tabla de datos agrupados por clasesTabla de datos agrupados por clases

Intervalos de clase

Marcas de

clase

Frecuencias

simples

1

1 f

2

2 f

k

kf

m

mf

1,i ix x

1 2,x x

2 3,x x

1,k kx x

1,m mx x

i `ix

` 1 21 2

x xx

` 2 32 2

x xx

` 1

2k k

k

x xx

` 1

2m m

m

x xx

1

m

ii

f n

if

Page 32: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Regla de SturgesRegla de Sturges

1 3,3log30

5,8745

5

m Ent

Ent

Es una regla empírica que permite calcular el número m de clases cuando se conoce el tamaño n de la muestra o población.

Ejemplo: para una muestra de tamaño 30 se pueden organizar los datos en 5 clases.

Estadísticas PCQ IP de Chile 2009 32

1 3,3logm Ent n

Page 33: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Un ejemplo numérico de lo vistoUn ejemplo numérico de lo visto

i [ Xi , Xi+1 [ Xi´ fi hi hi(%) Fi Hi

1 [ 160 , 180 [ 170 4 0,29 29,0 4 0,29

2 [ 180 , 200 [ 190 3 0,21 21,0 7 0,50

3 [ 200 , 220 [ 210 2 0,14 14,0 9 0,64

4 [ 220 , 240 [ 230 5 0,36 36,0 14 1,00

Σ 14 1,00 100,0

Estadísticas PCQ IP de Chile 2009 33

Page 34: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Estadísticas PCQ IP de Chile 2009 34

Diagramas de Tallos y Diagramas de Tallos y HojasHojas

3.3.

Page 35: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

Los Diagramas de Tallos y Hojas se usan generalmente, como una Los Diagramas de Tallos y Hojas se usan generalmente, como una forma más rápida de representar un conjunto de datos en forma gráfica.forma más rápida de representar un conjunto de datos en forma gráfica.Sirven generalmente para estudiar la dispersión de los valores de una Sirven generalmente para estudiar la dispersión de los valores de una muestra.muestra.El siguiente conjunto de datos correspondientes a los salarios medios El siguiente conjunto de datos correspondientes a los salarios medios mensuales en US$ de doce ejecutivos del banco Lehmann Brothers mensuales en US$ de doce ejecutivos del banco Lehmann Brothers durante el año 2008.durante el año 2008.

4.000 6.342 9.520 3.200 10.350 9.00014.000 14.789 3.286 4.275 3.500 9.834

3.200 3.286 3.500 4.000 4.275 6.3429.000 9.520 9.834 10.350 14.000 14.789

Estadísticas PCQ IP de Chile 2009 35

Page 36: Estadísticas PCQ IP de Chile 20091. Estadística descriptiva: Se encarga de recoger, ordenar y resumir los datos que se desean estudiar y prepararlos para

De este diagrama se puede obtener información como la siguiente:De este diagrama se puede obtener información como la siguiente:

Tallo Hojas

3 200 286 500

4 000 275

6 342

9 000 520 834

10 350

14 000 789

El ejecutivo que tiene el menor salario promedio mensual percibió US$ 3.200.

La mayoría de los ejecutivos percibió un salario promedio mensual que varía entre US$ 3.200 y US$ 9.834.

El ejecutivo que tiene el salario promedio mayor, percibió US$ 14.789.

Son 3 los ejecutivos que percibieron salarios promedios que van desde los US$ 9.000 hasta los US$ 9.834.

etc.

Estadísticas PCQ IP de Chile 2009 36