clase 2 4 medidas estadísticas - dispersión
TRANSCRIPT
![Page 1: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/1.jpg)
Estadística y probabilidad
Santiago de Chile 2013
Profesor Rubén Rodríguez A. Física y Matemáticas
![Page 2: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/2.jpg)
Repaso:
Tendencia central: punto medio de una distribución.
Dispersión: separación de los datos en una distribución.
Sesgo: Las curvas representan los datos puntuales de un conjunto de datos que pueden ser simétricas o sesgadas.
Curtosis: Cuando se mide la curtosis de una distribución, se mide qué tan puntiaguda es.
![Page 3: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/3.jpg)
Sueldos mensuales iniciales en una muestra de 12 recién egresados de la carrera de administración
Egresado Sueldo mensual inicial
Egresado Sueldo mensual inicial ($)
1 1690500 7 1710100
2 1739500 8 1827700
3 1788500 9 1734600
4 1705200 10 1923250
5 1643950 11 1724800
6 1621900 12 1705200
![Page 4: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/4.jpg)
𝑥 = 𝑥𝑖
𝑘𝑖=1
𝑛=𝑥1+𝑥2+⋯𝑥12
12=
1690500 +1739500 +⋯+1705200 12
=
1734600
Para la media poblacional es lo mismo excepto la notación:
𝜇 = 𝑥𝑖
𝑁
![Page 5: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/5.jpg)
En una empresa en la que hay 80 empleados, 60 ganan 4900 pesos chilenos por hora y 20 ganan 6370 por hora.
a) Determinar el sueldo medio por hora
𝑋 = 𝑓𝑋
𝑛=
60 4900 +(20)(6370)
60+20=
![Page 6: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/6.jpg)
Las desviaciones de los números dados respecto al 9 son -4, -1, 2, 0, 3, -3, 5 y 1. Calcule la media aritmética para datos agrupados.
𝑋 = 𝐴 + 𝑑
𝑁=9 +
3
8=
![Page 7: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/7.jpg)
Mediana para los sueldos… 1621900 1643950 1690500 1705200 1705200 1710100 1724800 1734600 1739500 1827700 1788500 1923250
Los valores de en medio
La mediana es el promedio de estos dos valores
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =1710100 + 1724800
2= 1717450
![Page 8: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/8.jpg)
A partir de los datos de la siguiente la mediana es un peso tal que la mitad del total de las frecuencias (40/2=20) quede por encima de él y la mitad del total de las frecuencias quede por debajo de él.
Peso (lb) Frecuencias
118-126 3
127-135 5
136-144 9
145-153 12
154-162 5
163-171 4
172-180 2
Total 40
![Page 9: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/9.jpg)
-- la suma de las tres primeras frecuencias de clases es 3+5+9=17. Por tanto, para dar la frecuencia 20, que es la buscada, se necesitan tres más de los 12 casos que pertenecen a la cuarta clase.
-- como el cuarto intervalo de clase, 145-153, en realidad corresponde a los pesos desde 144.5 hasta 153.5, la mediana debe encontrase a 3/12 entre 144.5 y 153.5.
![Page 10: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/10.jpg)
L1=frontera inferior de clase de la clase mediana =144.5
N=número de datos=40
𝑓1 = 3 + 5 + 9 suma de todas las frecuencias de todas las clases anteriores a la clase mediana.
𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =frecuencia de la clase mediana=12
C=amplitud del intervalo de la clase mediana=9
Mediana=𝐿1 + (𝑁
2 − 𝑓 1
𝑓𝑚𝑒𝑑𝑖𝑎𝑛𝑎)𝑐
![Page 11: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/11.jpg)
La moda en los sueldos es lámina 6 es:
El valor que se presenta con mayor frecuencia: 1705200
![Page 12: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/12.jpg)
Emplear la fórmula empírica media-moda=3(media-mediana) para hallar el salario modal de los 65 empleados de la empresa P&R sabiendo que la media es =131130.70 pesos chilenos y mediana =136710.66.
![Page 13: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/13.jpg)
Encontrar: a) la media geométrica y b) la media aritmética de los números 3,5,6,6,7,10 y 12. Se supone que los números son exactos.
![Page 14: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/14.jpg)
Cuartiles, deciles y percentiles
Aporta información acerca de la dispersión de los datos en el intervalo que va del menor al mayor valor de los datos.
![Page 15: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/15.jpg)
Por ejemplo la mediana divide en dos partes iguales a los datos.
-- Sean 𝑄1, 𝑄2 𝑦 𝑄3 el primer, segundo y tercer cuartil (dividen los datos en cuatro partes iguales); 𝑄2 coincide con la mediana.
-- Los deciles dividen al conjunto de datos en diez partes iguales 𝐷1,𝐷2, … , 𝐷𝑔.
-- Los valores que dividen al conjunto en 100 partes iguales son los percentiles 𝑃1, 𝑃2 , …, 𝑃𝑔𝑔
![Page 16: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/16.jpg)
Calculo de los cuartiles para datos no agrupados:
𝑘 𝑛 + 1
4, 𝑘 = 1,2,3 𝑦 4
Donde:
n= número de observaciones
K=cuartil
![Page 17: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/17.jpg)
Cálculo de cuartiles para datos agrupados
𝑄𝑘 = 𝐿𝑖 +𝐿𝑓 − 𝐿𝑖
4, 𝑐𝑜𝑛 𝐾 = 1,2,3 𝑦 4
Donde:
𝑄𝑘=cuartil k,
𝐿𝑖=límite inferior,
𝐿𝑓=límite superior.
![Page 18: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/18.jpg)
Ejercicio:
Considere las siguientes temperaturas (en grados Celcius) reportadas en un experimento:
25 28 25 26 28 28
35 32 31 31 32 27
25 29 26 28 27 28
30 30 31 31 30 31
![Page 19: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/19.jpg)
Calcular :
a) La posición del primer cuartil,
b) La posición del segundo cuartil,
c) La posición del tercer cuartil.
Nota: Puedes interpolar para encontrar el valor correcto a la posición de los cuartiles.
![Page 20: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/20.jpg)
Cálculo de Deciles
En primer lugar se busca donde se encuentra 𝑘𝑁
10, 𝑝𝑎𝑟𝑎 𝑘 = 1,2,3,4, … 9, en la tabla de
frecuencias acumuladas.
𝐷𝑘 = 𝐿𝑘 +
𝑘𝑁10
− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)
𝑓𝑖𝑐
Para datos no agrupados
![Page 21: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/21.jpg)
Donde:
𝐿𝑘=límite inferior de la clase del decil k
N= número de datos
𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)=Frecuencia acumulada de la
clase que antecede a la clase del decil k.
𝑓𝑘=frecuencia de la clase del decil k
c=longitud del intervalo de la clase del decil k.
![Page 22: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/22.jpg)
Ejercicio: Calcular los deciles de la distribución siguiente:
f
[50,60) 8
[60,70) 10
[70,80) 16
[80,90) 14
[90,100) 10
[100,110) 5
[110,120) 2
![Page 23: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/23.jpg)
Cálculo de percentiles
Para datos agrupados:
𝑃𝑘 = 𝐿𝑘 +𝑘
𝑛100
− 𝐹𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎(𝑘−1)
𝑓𝑘𝑐
Para datos no agrupados:
𝑘𝑛
100
![Page 24: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/24.jpg)
Ejercicio:
Determinar el primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla de salarios:
Salarios Número de empleados
200000-299000 85
300000-299000 90
400000-499000 120
500000-599000 70
600000-699000 62
700000-800000 36
![Page 25: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/25.jpg)
Desviación media 𝐷𝑚
Es la división de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media aritmética y el número de total de datos:
𝐷𝑚 = 𝑋𝑖 − 𝑋 𝑛
𝑖=1
𝑛
**Este indicador muestra que tan disperso se encuentran un
conjunto de datos a un punto de concentración.
![Page 26: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/26.jpg)
Ejercicio:
Halar la desviación media en la siguiente distribución de frecuencias:
Clases f
8-10 3
11-13 6
14-16 9
17-19 11
20-22 5
![Page 27: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/27.jpg)
Desviación Estándar 𝜎
La desviación estándar es la raíz cuadrada de los cuadrados de las desviaciones de los valores de la variable respecto a su media:
𝜎 = 𝑋𝑖−𝑋 2𝑛
𝑖=1
𝑛
**Mide la dispersión de un grupo o población (indica si la población esta muy dispersa respecto de la media) una desviación estándar pequeña indica que la población está muy compacta alrededor de la media.
![Page 28: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/28.jpg)
Varianza 𝜎2
Mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.
Se define como el cuadrado de la desviación estándar: v=𝜎2
![Page 29: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/29.jpg)
Ejercicio:
Hallar la desviación estándar y la varianza de la siguiente serie de datos: 10, 18, 15, 12, 3, 6, 5, 7.
![Page 30: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/30.jpg)
Ejercicio:
Hallar la desviación estándar y la varianza para la siguiente distribución de frecuencias.
clases f
10-15 2
16-21 8
22-27 13
28-33 10
34-39 6
![Page 31: Clase 2 4 medidas estadísticas - dispersión](https://reader030.vdocuments.mx/reader030/viewer/2022013115/55ad2d0c1a28ab025f8b475d/html5/thumbnails/31.jpg)
Próxima clase:
Contenidos:
-- Coeficiente de variación
-- Diagramas de dispersión
-- Covarianza
-- Correlación
-- Regresión lineal por covarianza
-- Regresión lineal por mínimos cuadrados
-- Sesgos, momentos y curtosis