estadística avanzada cfe distribución

58
Estadística Avanzada CFE Distribución 2021

Upload: others

Post on 24-Jan-2022

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estadística Avanzada CFE Distribución

Estadística Avanzada

CFE Distribución

2021

Page 2: Estadística Avanzada CFE Distribución

Presentación de los participantes

Page 3: Estadística Avanzada CFE Distribución
Page 4: Estadística Avanzada CFE Distribución
Page 5: Estadística Avanzada CFE Distribución

Temario

1. Conceptos básicos

1.1 Definición de estadística.

1.2 Clasificación de la estadística

1.3 Población o Universo

1.4 Muestra

1.5 Variable

2. Estadística Descriptiva

2.1 Distribuciones de frecuencia

2.2 Interpretación de tablas

2.3 Histograma, polígono de frecuencias y ojivas.

3. Correlación y Regresión lineal.

3.1 Correlación con coeficiente de

Pearson

3.2 Regresión lineal

3.3 Regresión por mínimos

cuadrados.

4. Estadística inferencial

4.1 Probabilidad

4.2 Distribución Normal

Page 6: Estadística Avanzada CFE Distribución

Participación y asistencia: 20% 1 por sesión

Evaluación teórica: 60%

Tareas: 20%

100%

Criterios de evaluación

Page 7: Estadística Avanzada CFE Distribución

Medidas de Seguridad

Page 8: Estadística Avanzada CFE Distribución

Objetivo General

Al finalizar el curso el participante desarrollará las

competencias y habilidades necesarias para realizar

análisis de datos que describan el comportamiento de los

eventos de su proceso (estadística descriptiva), así como

deducciones (estadística inferencial) a partir de los datos

que se generan en el mismo.

Page 9: Estadística Avanzada CFE Distribución

Evaluación Diagnóstica

Page 10: Estadística Avanzada CFE Distribución

Introducción

La estadística se refiere a un conjunto de métodos para manejar laobtención, presentación y análisis de observaciones numéricas.Sus objetivos son describir el conjunto de datos obtenidos ytomar decisiones o realizar generalizaciones acerca de lascaracterísticas de todas las posibles observaciones bajoconsideración. Los métodos estadísticos son ampliamenteutilizados en diferentes áreas del quehacer humano: el gobierno,los negocios, la educación, la psicología, la sociología, laantropología, las ciencias del comportamiento, la agricultura, lamedicina, la biología y la física, entre otras.

Page 11: Estadística Avanzada CFE Distribución

La estadística es la ciencia que trata de la recolección,organización, presentación, análisis e interpretación dedatos numéricos con el fin de realizar una toma dedecisión más efectiva.

Definición:

Page 12: Estadística Avanzada CFE Distribución

La estadística para su mejor estudio se ha dividido

en dos ramas las cuales son: estadística descriptiva

y estadística inferencial.

Estadística descriptiva: Consiste en lapresentación de datos en forma de tablas ygráficas. Esta comprende cualquier actividad pararesumir o describir los mismos factorespertinentes adicionales, esto se refiere a nointentar nada que vaya más allá de los datos.

Clasificación de la estadística:

Page 13: Estadística Avanzada CFE Distribución

Estadística Inferencial: Se deriva de las observacioneshechas solo a una parte de un conjunto numeroso deelementos; implicando así que su análisis requiera degeneralizaciones que van más allá de los datos, comoconsecuencia la característica más importante delcrecimiento de la estadística ha sido un cambio en elénfasis de los métodos que sirven para generalizarlas. Enotras palabras la estadística inferencial investiga y analizauna población partiendo de una muestra tomada.

Clasificación de la estadística:

Page 14: Estadística Avanzada CFE Distribución

Clasificación de la estadística:

Estadística

EstadísticaDescriptiva

Estadística Inferencial

Comprende las técnicas que se empleanpara resumir y describir datosnuméricos, el estudio de los datos serealiza con representaciones gráficas,tablas, medidas de posición y dispersión.

Ésta comprende técnicas que aplicadasen una muestra sometida a observaciónpermite generalizar el comportamientode la población que contiene a lamuestra.

Page 15: Estadística Avanzada CFE Distribución

Conceptos básicos

Fuente: SISST

Población o universo:

Es el conjunto de todos los elementos que

presentan una característica común determinada,

observable y medible. Por ejemplo, si el elemento

es una persona se pueden estudiar lascaracterísticas: edad, peso, estatura, etc.

Page 16: Estadística Avanzada CFE Distribución

Conceptos básicos

Muestra:Parte o subconjunto de una población. Subconjunto demedidas u observaciones tomadas a partir de unapoblación dada. Se utiliza una muestra por razonesprácticas, económicas o de tiempo que no permitenconsiderar a toda la población. Ejemplo: un centenar deadultos de 30 años.

contiene las característicasimportantes de ciertapoblación en las mismasproporciones en que seencuentran en ésta

Page 17: Estadística Avanzada CFE Distribución

Conceptos básicos

Variable:Se llama variable a una característica que se observa enuna población o muestra y a la cual se desea estudiar. Lavariable puede tomar diferentes valores dependiendo decada individuo. Una variable se puede clasificar de lasiguiente manera:

CuantitativaContinua

Discreta

Variable

CualitativaNominal

Ordinal

Page 18: Estadística Avanzada CFE Distribución

Conceptos básicos

Variable cuantitativa:

Es aquella que toma valores numéricos, dentro de

ella se subdivide en:

Continua: Son valores reales. Pueden tomar

cualquier valor dentro de un intervalo. Ejemplo:

peso, estatura, salario.

Discreta: Toma valores enteros. Ejemplo: número de

trabajadores, número de fallas, número de lecturas.

Page 19: Estadística Avanzada CFE Distribución

Conceptos básicos

Variable cualitativa:

Es aquella que describe cualidades. No son

numéricas y se subdividen en:

Nominal: Son cualidades sin orden. Ejemplo: estado

civil, preferencia por una marca, sexo, lugar de

residencia.

Ordinal: Son cualidades que representan un orden y

jerarquía. Ejemplo: nivel educacional, días de la

semana, calidad de la atención, nivel

socioeconómico.

Page 20: Estadística Avanzada CFE Distribución

Conceptos básicos

Ejemplos:

En una escuela se quiere saber cual es el deporte

más practicado por los alumnos. Se realiza una

encuesta a 5 alumnos de cada grupo.

Población: Todos los alumnos de la escuela.

Muestra: Cinco alumnos de cada grupo.

Variable: Cualitativa (deporte que practica).

Page 21: Estadística Avanzada CFE Distribución

Conceptos básicos

Para estudiar cuál es el candidato presidencial por el

cual votarán los Mexicanos en las próximas elecciones,

se toma una muestra de 3,500 personas de todo el

país. La pregunta es la siguiente, ¿por quién votará en

las próximas elecciones presidenciales? Determine

la población, muestra y tipo de Variable.

Población: sería la población electoral del país, es

decir, Mexicanos con derecho a voto.

Muestra: 3,500 Mexicanos (votantes)

Variable: Cuantitativa discreta (enteros)

Page 22: Estadística Avanzada CFE Distribución

Repaso

La estadística es:

a) La metodología que trata de la recolección, organización, presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva.

b) La ciencia que trata de la documentación, listado, presentación, análisis y representación de datos numéricos con el fin de realizar una toma de decisión más efectiva.

c) Es la ciencia que trata de la recolección, organización, presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva.

Page 23: Estadística Avanzada CFE Distribución

Repaso

Menciona las principales diferencias entre estadística descriptiva y estadística inferencial:

Estadística descriptiva Estadística inferencial

Comprende las técnicas quese emplean para resumir ydescribir datos numéricos.(Uso de tablas, gráficos eindicadores de tendencia)

Ésta comprende técnicas que aplicadas en una muestra sometida a observación permite generalizar el comportamiento de la población que contiene a la muestra.

Page 24: Estadística Avanzada CFE Distribución

Repaso

Es el conjunto de todos los elementos que presentan

una característica común determinada, observable y

medible.

a) Muestra

b) Población

c) Variable

Page 25: Estadística Avanzada CFE Distribución

Repaso

Es el conjunto de todos los elementos que presentan

una característica común determinada, observable y

medible.

a) Muestra

b) Población

c) Variable

Page 26: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Los datos son colecciones de cualquier cantidad de

observaciones relacionadas, podemos recopilar las

calificaciones de un examen y podemos llamar datos

a estos resultados. Una colección de datos se conoce

como conjunto de datos, a una sola observación se le

conoce como dato puntual.

Para que los datos sean útiles, necesitamos organizar

nuestras observaciones de modo que podamos

distinguir patrones y llegar a conclusiones lógicas. A

continuación veremos las técnicas tabular y grafica

para organización de datos.

Page 27: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Calificaciones del examen de estadística N=70

95 57 76 93 86 80 89

76 76 63 74 94 96 77

65 79 60 56 72 82 70

67 79 71 77 52 76 68

72 88 84 70 83 93 76

82 96 87 69 89 77 81

87 65 77 72 56 78 78

58 54 82 82 66 73 79

86 81 63 46 62 99 93

82 92 75 76 90 74 67

Page 28: Estadística Avanzada CFE Distribución

Una distribución de frecuencias presenta los valores

de los datos y la frecuencia con que se presentan.

Las siguientes tablas muestra las calificaciones del

examen de estadística agrupadas en dos

distribuciones de frecuencias, una en la que cada

intervalo tiene dos unidades de amplitud y otra con

intervalos de 19 unidades.

Estadística Descriptiva

Page 29: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Intervalo de clase

Amplitud=2ƒ

Intervalo de clase

Amplitud=2ƒ

Intervalo de clase

Amplitud=2ƒ

98 - 99 1 80 - 81 3 62 - 63 3

96 - 97 2 78 - 79 5 60 - 61 1

94 - 95 2 76 - 77 10 58 - 59 1

92 - 93 4 74 - 75 3 56 - 57 3

90 - 91 1 72 - 73 4 54 - 55 1

88 - 89 3 70 - 71 3 52 - 53 1

86 - 87 4 68 - 69 2 50 - 51 0

84 - 85 1 66 - 67 3 48 - 49 0

82 - 83 6 64 - 65 2 46 - 47 1

Page 30: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Intervalo de claseAmplitud=19 ƒ

95 - 113 4

76 - 94 38

57 - 75 23

38 - 56 5

Page 31: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Elaboración de una distribución de frecuencias de datos agrupados

Los pasos para hacer una distribución de frecuencias para datos agrupados son los siguientes:

1. Encontrar el rango de los datos.2. Determinar la amplitud de cada intervalo de clase.3. Hacer una lista con los limites de cada intervalo de clase, colocando en la

parte inferior de la misma al intervalo que contenga el dato más pequeño (mínimo). Hacer una lista con los límites de cada intervalo de clase, colocando en la parte inferior de la misma al intervalo que contenga el dato más pequeño (mínimo).

4. Contar los datos contenidos en los intervalos de clase correspondientes.5. Sumar las cuentas de cada intervalo para obtener la frecuencia del

intervalo. Ejemplo 1 ExcelEjemplo 2 excelEjemplo 3 excel

Page 32: Estadística Avanzada CFE Distribución

Una distribución de frecuencias presenta los valores

de los datos y la frecuencia con que se presentan.

Frecuencia relativa: Es el valor de la frecuencia expresada como un porcentaje del número total de observaciones.

hi= f/N

Estadística Descriptiva

Ejercicio: Las edades de los 50 integrantes de un programa de servicio social del gobierno son:

Page 33: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Ejemplo: Las edades de los 50 integrantes de un programa de servicio social del gobierno son:

83 51 66 61 82 65 54 56 92 60

65 87 68 64 51 70 75 66 74 68

44 55 78 69 98 67 82 77 79 62

38 88 76 99 84 47 60 42 66 74

91 71 83 80 68 65 51 56 73 55

Page 34: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Ejemplo 4 en excel

Use estos datos para construir las distribuciones defrecuencia relativa con 7 y 13 intervalos iguales. La política de

estado para los programas de servicio social requiere que como máximo el 50% de los participantes tenga mas de 50 años.a) ¿Cumple el programa con la política?b) La distribución de frecuencias relativas de 13 intervalos ayuda

a responder el inciso a) mejor que la distribución de 7 intervalos

c) Suponga que el director de servicios sociales desea saber la proporción de participantes en el programa que tienen entre 45 y 50 años. ¿A partir de cual distribución de frecuencias relativas, de 7 o de 13 intervalos, puede estimar mejor la respuesta?

Page 35: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Histograma: Un histograma consiste en una serie de rectángulos, cuyo ancho es proporcional al rango de los valores que se encuentran dentro de una clase. La altura de la barra correspondiente a cada clase representa el numero de observaciones de la clase.

Page 36: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Polígonos de frecuencias: Para construir un polígono de frecuencias señalamos estas en el eje vertical y los valores de la variable que estamos midiendo en el eje horizontal, a continuación graficamos cada marca de clase trazando un punto sobre su punto medio y conectamos los puntos sucesivos con una línea recta para formar un polígono.

Page 37: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Ojiva: Es la grafica de una distribución de frecuencias acumuladas.

Page 38: Estadística Avanzada CFE Distribución

Estadística Descriptiva

Ejercicio 1Ejercicio 2Ejercicio 3Ejercicio 4Ejercicio 5Ejercicio 6Ejercicio 7Ejercicio 8Ejercicio 9Ejercicio 10

Page 39: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

En la sección anterior nos enfocamos en las distribucionesindividuales y la mejor forma de presentarlas para una mejorinterpretación. Además de describir estas distribuciones,generalmente es necesario determinar si los datos de unadistribución se relacionan con los datos de otra, en este sentido,existe una utilidad práctica que implica el uso de una relación parahacer predicciones, ¿ Por qué podría interesarnos saber si dosvariables están relacionadas entre sí? Una razón importante de estoes que si las variables están relacionadas, es posible que una de ellassea la causa de otra.

La correlación determina la magnitud y la dirección de las relacionesentre los datos observados. A continuación analizaremos algunascaracterísticas generales.

Page 40: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

Relaciones lineales

Una relación lineal entre dos variables es la que puede representarse conmayor exactitud por medio de una línea recta.

0

500

1000

1500

2000

2500

0 500 1000 1500 2000 2500 3000 3500 4000 4500

Sala

rio

Merecancía vendida

VendedorMercancia

vendidaSalario

1 0 500

2 1000 900

3 2000 1300

4 3000 1700

5 4000 2100

Page 41: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

𝑌 = 𝑏𝑋 + 𝑎

La ecuación que corresponde a la línea que une todos los puntos esta dada en forma general por:

Donde 𝑎 = 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎 𝑎𝑙 𝑜𝑟𝑖𝑔𝑒𝑛 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑌 𝑐𝑢𝑎𝑛𝑑𝑜 𝑋 = 0

𝑏 = 𝑃𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎

En este caso 𝑎 = 500

𝑏 =∆𝑌

∆𝑋=

𝑌2−𝑌1

X2−X1=

400

1000= 0.40

∴ 𝒀 = 𝟎. 𝟒𝟎𝒙 + 𝟓𝟎𝟎

Page 42: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

Un coeficiente de correlación nos proporciona la magnitud ydirección exactas de la correlación.

Page 43: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

La r de Pearson es una medida del grado en el cual las parejas dedatos ocupan posiciones iguales u opuestas dentro de sus propiasdistribuciones.

Ejemplo 5 en excel

Page 44: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

Ejemplo 5 en excel

Cuando varias personas miden lamisma cantidad, generalmente noobtienen los mismos resultados. Dehecho, si la misma persona mide lamisma cantidad varias veces, losresultados variarán. ¿Cuál es la mejorestimación para la verdaderamedición? El método de mínimoscuadrados proporciona una formade encontrar la mejor estimación,suponiendo que los errores (es decir,las diferencias con respecto al valorverdadero) sean aleatorias eimparciales.

Page 45: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

¿QUÉ SON LOS MÍNIMOS CUADRADOS?Es un procedimiento de análisis numérico en la que, dados unconjunto de datos (pares ordenados y familia de funciones), seintenta determinar la función continua que mejor se aproxime alos datos (línea de regresión o la línea de mejor ajuste),proporcionando una demostración visual de la relación entre lospuntos de los mismos. En su forma más simple, busca minimizar lasuma de cuadrados de las diferencias ordenadas (llamadasresiduos) entre los puntos generados por la función y loscorrespondientes datos.Este método se utiliza comúnmente para analizar una serie dedatos que se obtengan de algún estudio, con el fin de expresar sucomportamiento de manera lineal y así minimizar los errores delos datos tomados.

Page 46: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

Su expresión general se basa en la ecuación de una recta y = mx + b. Donde m es la pendiente y b el punto de corte, y vienen expresadas de la siguiente manera:

Σ es el símbolo sumatoria de todos los términos,

mientas (x, y) son los datos en estudio y n la cantidad de datos que existen.

Page 47: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

El método de mínimos cuadrados calcula a partir de

los N pares de datos experimentales (x, y), los valores

m y b que mejor ajustan los datos a una recta. Se

entiende por el mejor ajuste aquella recta que hace

mínimas las distancias d de los puntos medidos a la

recta.

Teniendo una serie de datos (x, y), mostrados en un

gráfico o gráfica, si al conectar punto a punto no se

describe una recta, debemos aplicar el método de

mínimos cuadrados, basándonos en su expresión

general:

Page 48: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

Cuando se haga uso del método de mínimos cuadrados se

debe buscar una línea de mejor ajuste que explique la posible

relación entre una variable independiente y una variable

dependiente. En el análisis de regresión, las variables

dependientes se designan en el eje y vertical y las variables

independientes se designan en el eje x horizontal. Estas

designaciones formarán la ecuación para la línea de mejor

ajuste, que se determina a partir del método de mínimoscuadrados.

Page 49: Estadística Avanzada CFE Distribución

Correlación y Regresión lineal

Ejercicio 1Ejercicio 2Ejercicio 3Ejercicio 4Ejercicio 5Ejercicio 6Ejercicio 7Ejercicio 8Ejercicio 9Ejercicio 10

Page 50: Estadística Avanzada CFE Distribución

Estadística inferencial

¿Qué es la estadística inferencial?Se llama estadística inferencial o inferencia estadística a la rama dela Estadística encargada de hacer deducciones, es decir, inferirpropiedades, conclusiones y tendencias, a partir de una muestra delconjunto. Su papel es interpretar, hacer proyeccionesy comparaciones.

La estadística inferencial emplea usualmente mecanismos que lepermiten llevar a cabo dichas deducciones, tales como pruebas deestimación puntual (o de intervalos de confianza), pruebasde hipótesis, pruebas paramétricas (como de media, de diferenciade medias, proporciones, etc.) y no paramétricas (como la pruebadel chi-cuadrado, etc.). También le son útiles los análisis decorrelación y de regresión, las series cronológicas, el análisis devarianza, entre otros.

Page 51: Estadística Avanzada CFE Distribución

Estadística inferencial

Por ende, la estadística inferencial es sumamente útil en elanálisis de poblaciones y tendencias, para hacerse unaidea posible de las acciones y reacciones de la misma decara a condiciones específicas. Esto no significa que se laspueda predecir fielmente, ni que estemos en presencia deuna ciencia exacta, pero sí de una aproximación posible alresultado final.

Page 52: Estadística Avanzada CFE Distribución

Estadística inferencial

Probabilidad: la probabilidad se puede estudiar desde dospuntos de vista:1. A priori o clásico2. A posteriori o empírico.

A priori significa aquello que se puede deducir usandosolo la razón, sin recurrir a la experiencia. Desde el puntode vista a priori o clásico, la probabilidad se define como:

𝑝 𝐴 =𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑐𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑏𝑙𝑒𝑠 𝑐𝑜𝑚𝑜 𝐴

𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Page 53: Estadística Avanzada CFE Distribución

Estadística inferencial

A posteriori significa “después del hecho”, en el contextode la probabilidad, significa después de haber reunidoalgunos datos. Desde el punto de vista a posteriori oempírico, la probabilidad se define como:

𝑝 𝐴 =𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝐴 ℎ𝑎 𝑜𝑐𝑢𝑟𝑟𝑖𝑑𝑜

𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠

Ejemplos en excel

Page 54: Estadística Avanzada CFE Distribución

Estadística inferencial

Probabilidad y variables continuas con distribución normal

Page 55: Estadística Avanzada CFE Distribución

Estadística inferencial

Propiedades de la distribución normal estándar

• La distribución tiene la forma de una campana y la mayor parte del área de esta campana (Bell) se encuentra donde la media.

• El área debajo de la campana es de 1, y se divide por 0.5 a la izquierda y 0.5 a la derecha de la media.

• Es simétrica con respecto a la media.• La media, moda, y mediana coinciden.• Hay dos parámetros que determinan su forma: la

media y la desviación estándar.

Page 56: Estadística Avanzada CFE Distribución

Estadística inferencial

Tipificación o normalización de la variable

Para poder utilizar la tabla tenemos que transformar la variable X que sigue una distribución N(µ, σ) en otra variable Z que siga una distribución N(0,1). Por lo que la operación necesaria es la siguiente:

𝑍 =𝑥 − 𝜇

𝜎Donde:µ= mediaσ = Desviación estándar

Ejemplos excel

Page 57: Estadística Avanzada CFE Distribución

Estadística inferencial

Repaso final:

Descargar aplicación kahoot!

Page 58: Estadística Avanzada CFE Distribución