estadística avanzada cfe distribución
TRANSCRIPT
Estadística Avanzada
CFE Distribución
2021
Presentación de los participantes
Temario
1. Conceptos básicos
1.1 Definición de estadística.
1.2 Clasificación de la estadística
1.3 Población o Universo
1.4 Muestra
1.5 Variable
2. Estadística Descriptiva
2.1 Distribuciones de frecuencia
2.2 Interpretación de tablas
2.3 Histograma, polígono de frecuencias y ojivas.
3. Correlación y Regresión lineal.
3.1 Correlación con coeficiente de
Pearson
3.2 Regresión lineal
3.3 Regresión por mínimos
cuadrados.
4. Estadística inferencial
4.1 Probabilidad
4.2 Distribución Normal
Participación y asistencia: 20% 1 por sesión
Evaluación teórica: 60%
Tareas: 20%
100%
Criterios de evaluación
Medidas de Seguridad
Objetivo General
Al finalizar el curso el participante desarrollará las
competencias y habilidades necesarias para realizar
análisis de datos que describan el comportamiento de los
eventos de su proceso (estadística descriptiva), así como
deducciones (estadística inferencial) a partir de los datos
que se generan en el mismo.
Evaluación Diagnóstica
Introducción
La estadística se refiere a un conjunto de métodos para manejar laobtención, presentación y análisis de observaciones numéricas.Sus objetivos son describir el conjunto de datos obtenidos ytomar decisiones o realizar generalizaciones acerca de lascaracterísticas de todas las posibles observaciones bajoconsideración. Los métodos estadísticos son ampliamenteutilizados en diferentes áreas del quehacer humano: el gobierno,los negocios, la educación, la psicología, la sociología, laantropología, las ciencias del comportamiento, la agricultura, lamedicina, la biología y la física, entre otras.
La estadística es la ciencia que trata de la recolección,organización, presentación, análisis e interpretación dedatos numéricos con el fin de realizar una toma dedecisión más efectiva.
Definición:
La estadística para su mejor estudio se ha dividido
en dos ramas las cuales son: estadística descriptiva
y estadística inferencial.
Estadística descriptiva: Consiste en lapresentación de datos en forma de tablas ygráficas. Esta comprende cualquier actividad pararesumir o describir los mismos factorespertinentes adicionales, esto se refiere a nointentar nada que vaya más allá de los datos.
Clasificación de la estadística:
Estadística Inferencial: Se deriva de las observacioneshechas solo a una parte de un conjunto numeroso deelementos; implicando así que su análisis requiera degeneralizaciones que van más allá de los datos, comoconsecuencia la característica más importante delcrecimiento de la estadística ha sido un cambio en elénfasis de los métodos que sirven para generalizarlas. Enotras palabras la estadística inferencial investiga y analizauna población partiendo de una muestra tomada.
Clasificación de la estadística:
Clasificación de la estadística:
Estadística
EstadísticaDescriptiva
Estadística Inferencial
Comprende las técnicas que se empleanpara resumir y describir datosnuméricos, el estudio de los datos serealiza con representaciones gráficas,tablas, medidas de posición y dispersión.
Ésta comprende técnicas que aplicadasen una muestra sometida a observaciónpermite generalizar el comportamientode la población que contiene a lamuestra.
Conceptos básicos
Fuente: SISST
Población o universo:
Es el conjunto de todos los elementos que
presentan una característica común determinada,
observable y medible. Por ejemplo, si el elemento
es una persona se pueden estudiar lascaracterísticas: edad, peso, estatura, etc.
Conceptos básicos
Muestra:Parte o subconjunto de una población. Subconjunto demedidas u observaciones tomadas a partir de unapoblación dada. Se utiliza una muestra por razonesprácticas, económicas o de tiempo que no permitenconsiderar a toda la población. Ejemplo: un centenar deadultos de 30 años.
contiene las característicasimportantes de ciertapoblación en las mismasproporciones en que seencuentran en ésta
Conceptos básicos
Variable:Se llama variable a una característica que se observa enuna población o muestra y a la cual se desea estudiar. Lavariable puede tomar diferentes valores dependiendo decada individuo. Una variable se puede clasificar de lasiguiente manera:
CuantitativaContinua
Discreta
Variable
CualitativaNominal
Ordinal
Conceptos básicos
Variable cuantitativa:
Es aquella que toma valores numéricos, dentro de
ella se subdivide en:
Continua: Son valores reales. Pueden tomar
cualquier valor dentro de un intervalo. Ejemplo:
peso, estatura, salario.
Discreta: Toma valores enteros. Ejemplo: número de
trabajadores, número de fallas, número de lecturas.
Conceptos básicos
Variable cualitativa:
Es aquella que describe cualidades. No son
numéricas y se subdividen en:
Nominal: Son cualidades sin orden. Ejemplo: estado
civil, preferencia por una marca, sexo, lugar de
residencia.
Ordinal: Son cualidades que representan un orden y
jerarquía. Ejemplo: nivel educacional, días de la
semana, calidad de la atención, nivel
socioeconómico.
Conceptos básicos
Ejemplos:
En una escuela se quiere saber cual es el deporte
más practicado por los alumnos. Se realiza una
encuesta a 5 alumnos de cada grupo.
Población: Todos los alumnos de la escuela.
Muestra: Cinco alumnos de cada grupo.
Variable: Cualitativa (deporte que practica).
Conceptos básicos
Para estudiar cuál es el candidato presidencial por el
cual votarán los Mexicanos en las próximas elecciones,
se toma una muestra de 3,500 personas de todo el
país. La pregunta es la siguiente, ¿por quién votará en
las próximas elecciones presidenciales? Determine
la población, muestra y tipo de Variable.
Población: sería la población electoral del país, es
decir, Mexicanos con derecho a voto.
Muestra: 3,500 Mexicanos (votantes)
Variable: Cuantitativa discreta (enteros)
Repaso
La estadística es:
a) La metodología que trata de la recolección, organización, presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva.
b) La ciencia que trata de la documentación, listado, presentación, análisis y representación de datos numéricos con el fin de realizar una toma de decisión más efectiva.
c) Es la ciencia que trata de la recolección, organización, presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva.
Repaso
Menciona las principales diferencias entre estadística descriptiva y estadística inferencial:
Estadística descriptiva Estadística inferencial
Comprende las técnicas quese emplean para resumir ydescribir datos numéricos.(Uso de tablas, gráficos eindicadores de tendencia)
Ésta comprende técnicas que aplicadas en una muestra sometida a observación permite generalizar el comportamiento de la población que contiene a la muestra.
Repaso
Es el conjunto de todos los elementos que presentan
una característica común determinada, observable y
medible.
a) Muestra
b) Población
c) Variable
Repaso
Es el conjunto de todos los elementos que presentan
una característica común determinada, observable y
medible.
a) Muestra
b) Población
c) Variable
Estadística Descriptiva
Los datos son colecciones de cualquier cantidad de
observaciones relacionadas, podemos recopilar las
calificaciones de un examen y podemos llamar datos
a estos resultados. Una colección de datos se conoce
como conjunto de datos, a una sola observación se le
conoce como dato puntual.
Para que los datos sean útiles, necesitamos organizar
nuestras observaciones de modo que podamos
distinguir patrones y llegar a conclusiones lógicas. A
continuación veremos las técnicas tabular y grafica
para organización de datos.
Estadística Descriptiva
Calificaciones del examen de estadística N=70
95 57 76 93 86 80 89
76 76 63 74 94 96 77
65 79 60 56 72 82 70
67 79 71 77 52 76 68
72 88 84 70 83 93 76
82 96 87 69 89 77 81
87 65 77 72 56 78 78
58 54 82 82 66 73 79
86 81 63 46 62 99 93
82 92 75 76 90 74 67
Una distribución de frecuencias presenta los valores
de los datos y la frecuencia con que se presentan.
Las siguientes tablas muestra las calificaciones del
examen de estadística agrupadas en dos
distribuciones de frecuencias, una en la que cada
intervalo tiene dos unidades de amplitud y otra con
intervalos de 19 unidades.
Estadística Descriptiva
Estadística Descriptiva
Intervalo de clase
Amplitud=2ƒ
Intervalo de clase
Amplitud=2ƒ
Intervalo de clase
Amplitud=2ƒ
98 - 99 1 80 - 81 3 62 - 63 3
96 - 97 2 78 - 79 5 60 - 61 1
94 - 95 2 76 - 77 10 58 - 59 1
92 - 93 4 74 - 75 3 56 - 57 3
90 - 91 1 72 - 73 4 54 - 55 1
88 - 89 3 70 - 71 3 52 - 53 1
86 - 87 4 68 - 69 2 50 - 51 0
84 - 85 1 66 - 67 3 48 - 49 0
82 - 83 6 64 - 65 2 46 - 47 1
Estadística Descriptiva
Intervalo de claseAmplitud=19 ƒ
95 - 113 4
76 - 94 38
57 - 75 23
38 - 56 5
Estadística Descriptiva
Elaboración de una distribución de frecuencias de datos agrupados
Los pasos para hacer una distribución de frecuencias para datos agrupados son los siguientes:
1. Encontrar el rango de los datos.2. Determinar la amplitud de cada intervalo de clase.3. Hacer una lista con los limites de cada intervalo de clase, colocando en la
parte inferior de la misma al intervalo que contenga el dato más pequeño (mínimo). Hacer una lista con los límites de cada intervalo de clase, colocando en la parte inferior de la misma al intervalo que contenga el dato más pequeño (mínimo).
4. Contar los datos contenidos en los intervalos de clase correspondientes.5. Sumar las cuentas de cada intervalo para obtener la frecuencia del
intervalo. Ejemplo 1 ExcelEjemplo 2 excelEjemplo 3 excel
Una distribución de frecuencias presenta los valores
de los datos y la frecuencia con que se presentan.
Frecuencia relativa: Es el valor de la frecuencia expresada como un porcentaje del número total de observaciones.
hi= f/N
Estadística Descriptiva
Ejercicio: Las edades de los 50 integrantes de un programa de servicio social del gobierno son:
Estadística Descriptiva
Ejemplo: Las edades de los 50 integrantes de un programa de servicio social del gobierno son:
83 51 66 61 82 65 54 56 92 60
65 87 68 64 51 70 75 66 74 68
44 55 78 69 98 67 82 77 79 62
38 88 76 99 84 47 60 42 66 74
91 71 83 80 68 65 51 56 73 55
Estadística Descriptiva
Ejemplo 4 en excel
Use estos datos para construir las distribuciones defrecuencia relativa con 7 y 13 intervalos iguales. La política de
estado para los programas de servicio social requiere que como máximo el 50% de los participantes tenga mas de 50 años.a) ¿Cumple el programa con la política?b) La distribución de frecuencias relativas de 13 intervalos ayuda
a responder el inciso a) mejor que la distribución de 7 intervalos
c) Suponga que el director de servicios sociales desea saber la proporción de participantes en el programa que tienen entre 45 y 50 años. ¿A partir de cual distribución de frecuencias relativas, de 7 o de 13 intervalos, puede estimar mejor la respuesta?
Estadística Descriptiva
Histograma: Un histograma consiste en una serie de rectángulos, cuyo ancho es proporcional al rango de los valores que se encuentran dentro de una clase. La altura de la barra correspondiente a cada clase representa el numero de observaciones de la clase.
Estadística Descriptiva
Polígonos de frecuencias: Para construir un polígono de frecuencias señalamos estas en el eje vertical y los valores de la variable que estamos midiendo en el eje horizontal, a continuación graficamos cada marca de clase trazando un punto sobre su punto medio y conectamos los puntos sucesivos con una línea recta para formar un polígono.
Estadística Descriptiva
Ojiva: Es la grafica de una distribución de frecuencias acumuladas.
Estadística Descriptiva
Ejercicio 1Ejercicio 2Ejercicio 3Ejercicio 4Ejercicio 5Ejercicio 6Ejercicio 7Ejercicio 8Ejercicio 9Ejercicio 10
Correlación y Regresión lineal
En la sección anterior nos enfocamos en las distribucionesindividuales y la mejor forma de presentarlas para una mejorinterpretación. Además de describir estas distribuciones,generalmente es necesario determinar si los datos de unadistribución se relacionan con los datos de otra, en este sentido,existe una utilidad práctica que implica el uso de una relación parahacer predicciones, ¿ Por qué podría interesarnos saber si dosvariables están relacionadas entre sí? Una razón importante de estoes que si las variables están relacionadas, es posible que una de ellassea la causa de otra.
La correlación determina la magnitud y la dirección de las relacionesentre los datos observados. A continuación analizaremos algunascaracterísticas generales.
Correlación y Regresión lineal
Relaciones lineales
Una relación lineal entre dos variables es la que puede representarse conmayor exactitud por medio de una línea recta.
0
500
1000
1500
2000
2500
0 500 1000 1500 2000 2500 3000 3500 4000 4500
Sala
rio
Merecancía vendida
VendedorMercancia
vendidaSalario
1 0 500
2 1000 900
3 2000 1300
4 3000 1700
5 4000 2100
Correlación y Regresión lineal
𝑌 = 𝑏𝑋 + 𝑎
La ecuación que corresponde a la línea que une todos los puntos esta dada en forma general por:
Donde 𝑎 = 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 𝑎𝑙 𝑜𝑟𝑖𝑔𝑒𝑛 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑌 𝑐𝑢𝑎𝑛𝑑𝑜 𝑋 = 0
𝑏 = 𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎
En este caso 𝑎 = 500
𝑏 =∆𝑌
∆𝑋=
𝑌2−𝑌1
X2−X1=
400
1000= 0.40
∴ 𝒀 = 𝟎. 𝟒𝟎𝒙 + 𝟓𝟎𝟎
Correlación y Regresión lineal
Un coeficiente de correlación nos proporciona la magnitud ydirección exactas de la correlación.
Correlación y Regresión lineal
La r de Pearson es una medida del grado en el cual las parejas dedatos ocupan posiciones iguales u opuestas dentro de sus propiasdistribuciones.
Ejemplo 5 en excel
Correlación y Regresión lineal
Ejemplo 5 en excel
Cuando varias personas miden lamisma cantidad, generalmente noobtienen los mismos resultados. Dehecho, si la misma persona mide lamisma cantidad varias veces, losresultados variarán. ¿Cuál es la mejorestimación para la verdaderamedición? El método de mínimoscuadrados proporciona una formade encontrar la mejor estimación,suponiendo que los errores (es decir,las diferencias con respecto al valorverdadero) sean aleatorias eimparciales.
Correlación y Regresión lineal
¿QUÉ SON LOS MÍNIMOS CUADRADOS?Es un procedimiento de análisis numérico en la que, dados unconjunto de datos (pares ordenados y familia de funciones), seintenta determinar la función continua que mejor se aproxime alos datos (línea de regresión o la línea de mejor ajuste),proporcionando una demostración visual de la relación entre lospuntos de los mismos. En su forma más simple, busca minimizar lasuma de cuadrados de las diferencias ordenadas (llamadasresiduos) entre los puntos generados por la función y loscorrespondientes datos.Este método se utiliza comúnmente para analizar una serie dedatos que se obtengan de algún estudio, con el fin de expresar sucomportamiento de manera lineal y así minimizar los errores delos datos tomados.
Correlación y Regresión lineal
Su expresión general se basa en la ecuación de una recta y = mx + b. Donde m es la pendiente y b el punto de corte, y vienen expresadas de la siguiente manera:
Σ es el símbolo sumatoria de todos los términos,
mientas (x, y) son los datos en estudio y n la cantidad de datos que existen.
Correlación y Regresión lineal
El método de mínimos cuadrados calcula a partir de
los N pares de datos experimentales (x, y), los valores
m y b que mejor ajustan los datos a una recta. Se
entiende por el mejor ajuste aquella recta que hace
mínimas las distancias d de los puntos medidos a la
recta.
Teniendo una serie de datos (x, y), mostrados en un
gráfico o gráfica, si al conectar punto a punto no se
describe una recta, debemos aplicar el método de
mínimos cuadrados, basándonos en su expresión
general:
Correlación y Regresión lineal
Cuando se haga uso del método de mínimos cuadrados se
debe buscar una línea de mejor ajuste que explique la posible
relación entre una variable independiente y una variable
dependiente. En el análisis de regresión, las variables
dependientes se designan en el eje y vertical y las variables
independientes se designan en el eje x horizontal. Estas
designaciones formarán la ecuación para la línea de mejor
ajuste, que se determina a partir del método de mínimoscuadrados.
Correlación y Regresión lineal
Ejercicio 1Ejercicio 2Ejercicio 3Ejercicio 4Ejercicio 5Ejercicio 6Ejercicio 7Ejercicio 8Ejercicio 9Ejercicio 10
Estadística inferencial
¿Qué es la estadística inferencial?Se llama estadística inferencial o inferencia estadística a la rama dela Estadística encargada de hacer deducciones, es decir, inferirpropiedades, conclusiones y tendencias, a partir de una muestra delconjunto. Su papel es interpretar, hacer proyeccionesy comparaciones.
La estadística inferencial emplea usualmente mecanismos que lepermiten llevar a cabo dichas deducciones, tales como pruebas deestimación puntual (o de intervalos de confianza), pruebasde hipótesis, pruebas paramétricas (como de media, de diferenciade medias, proporciones, etc.) y no paramétricas (como la pruebadel chi-cuadrado, etc.). También le son útiles los análisis decorrelación y de regresión, las series cronológicas, el análisis devarianza, entre otros.
Estadística inferencial
Por ende, la estadística inferencial es sumamente útil en elanálisis de poblaciones y tendencias, para hacerse unaidea posible de las acciones y reacciones de la misma decara a condiciones específicas. Esto no significa que se laspueda predecir fielmente, ni que estemos en presencia deuna ciencia exacta, pero sí de una aproximación posible alresultado final.
Estadística inferencial
Probabilidad: la probabilidad se puede estudiar desde dospuntos de vista:1. A priori o clásico2. A posteriori o empírico.
A priori significa aquello que se puede deducir usandosolo la razón, sin recurrir a la experiencia. Desde el puntode vista a priori o clásico, la probabilidad se define como:
𝑝 𝐴 =𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑐𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑏𝑙𝑒𝑠 𝑐𝑜𝑚𝑜 𝐴
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Estadística inferencial
A posteriori significa “después del hecho”, en el contextode la probabilidad, significa después de haber reunidoalgunos datos. Desde el punto de vista a posteriori oempírico, la probabilidad se define como:
𝑝 𝐴 =𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴 ℎ𝑎 𝑜𝑐𝑢𝑟𝑟𝑖𝑑𝑜
𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠
Ejemplos en excel
Estadística inferencial
Probabilidad y variables continuas con distribución normal
Estadística inferencial
Propiedades de la distribución normal estándar
• La distribución tiene la forma de una campana y la mayor parte del área de esta campana (Bell) se encuentra donde la media.
• El área debajo de la campana es de 1, y se divide por 0.5 a la izquierda y 0.5 a la derecha de la media.
• Es simétrica con respecto a la media.• La media, moda, y mediana coinciden.• Hay dos parámetros que determinan su forma: la
media y la desviación estándar.
Estadística inferencial
Tipificación o normalización de la variable
Para poder utilizar la tabla tenemos que transformar la variable X que sigue una distribución N(µ, σ) en otra variable Z que siga una distribución N(0,1). Por lo que la operación necesaria es la siguiente:
𝑍 =𝑥 − 𝜇
𝜎Donde:µ= mediaσ = Desviación estándar
Ejemplos excel
Estadística inferencial
Repaso final:
Descargar aplicación kahoot!