conceptos basicos de la estadistica

30
Conceptos básicos. Variables estadísticas. UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIÓN FACULTAD DE INGENIERÍA ESCUELA DE FORMACIÓN PROFESIONAL DE INGENIERÍA AMBIENTAL CLASE N° O2: 1

Upload: josue-luis

Post on 21-Feb-2017

71 views

Category:

Education


1 download

TRANSCRIPT

Conceptos básicos.Variables estadísticas.

UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIÓNFACULTAD DE INGENIERÍA

ESCUELA DE FORMACIÓN PROFESIONAL DE INGENIERÍA AMBIENTAL

CLASE N° O2:

1

2

ALGUNAS OPINIONES INTERESANTES:

“El pensamiento estadístico será algún día tan necesario para el ciudadano competente como la habilidad de leer y escribir". (H.G. Wells)

“Para la mayoría de los estudiantes la estadística es un tema misterioso donde operamos con números por medio de fórmulas que no tienen sentido”. (Graham)

Estadisticas y Probabilidades. Ing. James Támara 3

Concepto de Estadística:

……la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas es la estadística.

La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos (Estadística Descriptiva), siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones (Estadística Inferencial).

Estadisticas y Probabilidades. Ing. James Támara 4

Pensamiento Estadístico:

Pensamiento “La estadística no solo es una colección de conceptos y técnicas. Sobre todo es una forma de razonar”.

Razonar en situaciones de variabilidad e incertidumbre para obtener información que guíe la toma de decisiones a partir de datos.

Nuestro conocimiento puede fallar, pero es actualmente la mejor herramienta para saber separar en situaciones aleatorias cotidianas, la variabilidad natural de los fenómenos causales.

Estadisticas y Probabilidades. Ing. James Támara 5

El pensamiento estadístico se caracteriza por:

Abordar la solución de problemas en base a datos no solo en intuiciones(Leer: Falacia del jugador https://es.wikipedia.org/wiki/Falacia_del_apostador) Importancia del proceso generador de datos (muestreo, experimentos, fuentes secundarias) Percibir de manera natural la omnipresencia de la variabilidad y la incertidumbre e incluirla en el proceso de modelización de la realidad Desarrollar la capacidad de abordar problemas faltos de estructura Valorar la utilidad de la estadística para estimar, para predecir, para valorar el impacto de un factor sobre la variabilidad de otros, para decidir entre diferentes opciones, etc. Uso del enfoque científico para resolver los problemas (inducción-deducción) Saber comunicar los resultados

Estadisticas y Probabilidades. Ing. James Támara 6

Relación entre Pensamiento Estadístico y Métodos Estadísticos                                

Estadisticas y Probabilidades. Ing. James Támara 7

Población o Universo:Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población o universo. Aquí el término población o universo tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas u objetos, actos, áreas geográficas e incluso al tiempo.

Las personas u objetos que forman parte de la población se denominan elementos.

A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color del Cabello, etc.

Luego por tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o caracteres.

Conceptos Básicos

Estadisticas y Probabilidades. Ing. James Támara 8

La población puede ser según su tamaño de dos tipos:

Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos de un centro de enseñanza, o de una sección.

Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre concentración de un metal en el suelo. El suelo es tan extenso y los iones metálicos varían su concentración, que esta población podría considerarse infinita.

La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado.

Conceptos Básicos

Estadisticas y Probabilidades. Ing. James Támara 9

Ejemplos de Población Estadística:

Conjunto de estudiantes de la UNDAC/FI/EFPIA inscritos para el periodo 2016-A. Conjunto formado por las notas finales que obtuvieron los alumnos de la UNDAC/FI/EFPIA durante el periodo 2016-A de todas las materias que cursaron.Las ventas mensuales en soles de la empresa “x”, desde su fundación hasta el mes pasado.

El tamaño de la población, que es el número de elementos que la conforman, se denota con la letra N (ene mayúscula)

Conceptos Básicos

Estadisticas y Probabilidades. Ing. James Támara 10

Muestra:Una muestra es un subconjunto de la población o universo. Una muestra, en un sentido amplio, no es más que eso, una parte del todo que se llama población o universo y que sirve para representarlo.

Toda aplicación de las estadísticas pasa por la decisión si usar la población o una muestra para llevar a cabo el estudio.

Algunos factores que determinan el uso de muestras: Costos (Presupuestos limitados) Población infinita o demasiado grande Población fuera de alcance (imposible) Medir la característica de interés implica la destrucción del elemento medido. Población suficientemente homogénea respecto a la característica estudiada. Las exigencias (objetivos) del estudio así lo requieren.

Conceptos Básicos

Estadisticas y Probabilidades. Ing. James Támara 11

La Teoría del Muestreo o Técnicas de Muestreo es un poderosa herramienta estadística que nos permite seleccionar muestras representativas de una población.

Conceptos Básicos

Tipo de

Muestra

Muestra Subjetiv

a

Muestras Probabilístic

aso

Aleatorias

Muestras No

Probabilísticas

Muestra por

Cuotas

Muestra por

Grupos Naturale

s

Muestra Aleatoria Simple

Muestra Sistemátic

a

Muestra Estratificad

a

Muestra Por Conglomerad

o

Estadisticas y Probabilidades. Ing. James Támara 12

Conceptos BásicosEjemplos de Población y Muestra:

Población: Conjunto de estudiantes de la UNDAC/FI inscritos para el periodo 2016-A.

Muestra (1): Estudiantes de Ingeniería Ambiental Muestra (2): Estudiantes de Geología.

Población: Conjunto formado por las notas finales que obtuvieron los alumnos de la UNDAC/FI/EFPIA durante el periodo 2015-B de todas las materias que cursaron

Muestra (1): Notas mayores o iguales a 10 puntos. Muestra (2): Notas de Estadísticas.

Población: Las ventas mensuales en soles de la empresa “X” desde su fundación hasta el mes pasado.

Muestra (1): Ventas de los últimos 12 meses.

Al tamaño de la muestra la denotamos con n (ene minúscula)

Estadisticas y Probabilidades. Ing. James Támara 13

Conceptos BásicosVariables:Son aspectos o características medibles de los elementos de la población o muestra. Pueden ser de muy diversos tipos, por lo que los podemos clasificar en dos grandes clases:

CuantitativasVariables

Cualitativas o Atributos

Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el Peso, Altura, Edad, Número de Suspensos…

A su vez este tipo de variables se puede dividir en dos subclases:

Variables Cuantitativas Discretas o Variables Discretas

Variables Cuantitativas Continuas o Variables Continuas

Estadisticas y Probabilidades. Ing. James Támara 14

Conceptos BásicosVariables DiscretasAquellas a las que se les puede asociar un número entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo número de hermanos, páginas de un libro, número de defectos en un producto, etc.

Variables ContinuasAquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo, costo, etc.

Los Atributos o Variables Cualitativas son aquellos caracteres que para su definición precisan de palabras, es decir, no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc.

Estadisticas y Probabilidades. Ing. James Támara 15

Conceptos BásicosLos Atributos o Variables Cualitativas a su vez las podemos clasificar en:

Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, el nivel de estudios, etc.

No Ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.

A las variables las denotamos con letras x, y, z,…. y a los distintos valores que toma una variable con su letra y subíndices x1, x2, x3,……., xk

Convenio: Las variables cuantitativas se mostrarán ordenadas de menor a mayor, es decir, si x denota una variable cuantitativa (discreta o continua) entonces siempre:x1 < x2 < x3 <…….< xk

Estadisticas y Probabilidades. Ing. James Támara 16

Conceptos BásicosPor ejemplo:

Población: Conjunto de estudiantes de la UNDAC/FI/EFPIA inscritos para el periodo 2016-A Muestra: Estudiantes matriculados en Estadística Sección A. B o C. Tipo de Muestreo: Aleatorio Simple Tamaño de la muestra (n): 12 Variables de Estudio: x = Edad

Definición: Edad cronológica del estudiante Tipo: Cuantitativa, continua Unidad de Medida: Años cumplidos Rango: 0,1, 2, 3,……..

y = Nota Aprobatoria de Calculo I. Definición: Nota con la cual aprobó Cal.I.Tipo: Cuantitativa, Discreta Unidad de Medida: Puntos Rango: 0,1,2,3,……20

z = Repitencia en Estadísticas y Probabilidades. Definición: Cantidad de veces que ha cursado Tipo = Cuantitativa Unidad de Medida: Cantidad Rango: 0,1,2,3,…..

w = Estado Civil Definición: Situación civil respecto al matrimonioTipo: Cualitativa/Atributo, No Ordenable Unidad de Medida: Ninguna Rango: Soltero (S), Casado (C), Divorciado (D), Viudo (V), Otro (O)

Estadisticas y Probabilidades. Ing. James Támara 17

Conceptos BásicosProceso de Recolección de datos:

Estudianteen la Muestra

Número Aleatori

oX

(Edad)

Y (Nota Ap. Cal.

I.)

Z (Repitencia)

W (Edo. Civil)

1er 4 20 10 0 S2do 12 21 10 0 S3er 1 19 11 0 S4to 16 22 14 0 S5to 33 25 13 1 S6to 21 26 15 1 S7mo 7 20 10 0 S8vo 2 22 10 2 S9no 40 25 11 1 S

10mo 37 18 12 2 S

Estadisticas y Probabilidades. Ing. James Támara 18

Conceptos BásicosEn esta muestra las variables toman los siguientes valores:x (Edad - Años):x1 = 18; x2 = 19; x3 = 20; x4= 21; x5 = 22; x6 = 25; x7 = 26; x8 = 27** Se cumple el orden ascendente de la variable por ser cuantitativa

y (Nota aprobatoria de Cal.I.- ptos):y1 = 10; y2 = 11; y3 = 12; y4= 13; y5 = 14; y6 = 15z (Repitencia de Est.):z1 = 0; z2 = 1; z3 = 2w (Estado Civil):w1 = S; w2 = C

Frecuencia Absoluto o FrecuenciaEl número de veces que se repite un determinado valor de una variable en una muestra o población de la misma es su frecuencia absoluta ó frecuencia (f):x1 = 18 años ; f1 = 1 alumno, por otra parte y1 = 10 ptos; f1 = 5 alumnos

Estadisticas y Probabilidades. Ing. James Támara 19

Conceptos Básicos

Se cumple que para una determinada variable que toma k distintos valores en la población o muestra:

nNffffK

iik ó .......

121

En nuestro ejemplo para la variable edad (x):1211221221.......

8

1821

iiffff

para la variable estado civil (w):1211121 ff

Estadisticas y Probabilidades. Ing. James Támara 20

Conceptos BásicosFrecuencia Relativa:

Es la proporción que ocupa un valor especifico de una variable en la población o muestra, es decir, es el cociente que resulta de dividir la frecuencia (fi) entre el tamaño de la muestra o población según sea el caso:

Nfhó

nfh i

ii

i

P.ej: si x1 = 18 años ; f1 = 1 alumno entonces la proporción de alumnos de 18 años en la muestra será:

0833,01211

1 nfh

Si multiplicamos por 100 a hi obtenemos la frecuencia relativa porcentual,100100%

nfhh i

ii en el ejemplo %hi = 8,33%

Estadisticas y Probabilidades. Ing. James Támara 21

Conceptos BásicosSe cumple que para una determinada muestra o población de una variable:

Frecuencia Absoluta Acumulada

Para un determinado valor de una variable cuantitativa (continua o discreta), su frecuencia absoluta acumulada o simplemente frecuencia acumulada (F) se define como la cantidad de valores de la variable que son menores o iguales al valor dado:

100%.....%%%%

y ;1.....

3211

3211

k

k

ii

k

k

ii

hhhhh

hhhhh

ii

i

jjii fFffffF

1

121 ......

Estadisticas y Probabilidades. Ing. James Támara 22

Conceptos BásicosP.ej:Para la variable x (edad):F1= 1 (cantidad de alumnos en la muestra con edad menor o igual a 18 años)

F2= 3 (cantidad de alumnos en la muestra con edad menor o igual a 19 años)

F3= 5 (cantidad de alumnos en la muestra con edad menor o igual a 20 años)Nótese que:F1= f1 = 1 F2= f1+ f2 = 1 + 2 = F1 + f2 = 3F3= f1+ f2 + f3 = 1 + 2 + 2= F2 + f3 = 5 ……………………F7=11F8= f1+ f2 + f3 +…….+ f8 = 1+2+2+1+2+2+1+1= 12=F7 + f8 = 11+ 1= 12 Si una variable toma k-distintos valores en una población o muestra, entonces se cumple que: F1= f1 y Fk= N ó Fk= n

Estadisticas y Probabilidades. Ing. James Támara 23

Conceptos BásicosFrecuencia Relativa Acumulada

Para un determinado valor de una variable cuantitativa (continua o discreta), su frecuencia relativa acumulada (H) se define como la proporción de valores de la variable que son menores o iguales al valor dado:

ii

i

jjii hHhhhhH

1

121 ......

Igualmente se puede determinar la frecuencia relativa acumulada porcentual (%H) que se define como el porcentaje de valores de la variable que son menores o iguales al valor dado:

ii

i

jjii hHhhhhH %%%%......%%% 1

121

Estadisticas y Probabilidades. Ing. James Támara 24

Conceptos BásicosSe cumple que:

100%

ó

ii

ii

ii

HHNFH

nFH

Igualmente , si una variable toma k-distintos valores en una población o muestra entonces:

H1= h1 y Hk= 1 y %H1= %h1 y %Hk= 100En nuestro ejemplo para la variable edad:H1= h1 = 0,0833H2= h1+ h2 = 0,0833 + 0,1667 = H1 + h2 = 0.25 entonces %H2 = 25%Lo que significa que el 25% de los alumnos en la muestra tienen una edad menor o igual a 19 años

Estadisticas y Probabilidades. Ing. James Támara 25

Conceptos Básicos

Parámetro PoblacionalLos parámetros poblacionales caracterizan y describen estadísticamente a las poblaciones. Por ejemplo, si después de un estudio poblacional (Censo) de los estudiantes de la EAC inscritos en el 2do periodo del 2008 se obtiene que la edad promedio es 23 años, entonces este promedio será un parámetro de dicha población.

Una vez definida la población sus parámetros estadísticos no varían.

Ejemplos de parámetros poblacionales:-Ingreso promedio de la población trabajadora de un país-Porcentajes de errores de facturación en que incurre CANTV

Por lo general los parámetros poblacionales se desconocen y para su determinación se requiere o bien efectuar un estudio poblacional (Censo) con el cual se logra se valor “real” o en todo caso realizar un estudio por muestras con lo cual se logra una “estimación” del valor real.

Estadisticas y Probabilidades. Ing. James Támara 26

Conceptos BásicosEstadístico MuestralSon resúmenes de la información contenida en la muestra, o sea son funciones de la información muestral, esto es, depende sola y exclusivamente de la muestra seleccionada. Caracterizan y describen estadísticamente a las muestras.Por ejemplo, la edad promedio de los 12 estudiantes seleccionados aleatoriamente fue de 22 años

Teóricamente de una población se pueden extraer infinitas o un numero muy grande de muestras del mismo tamaño, por lo tanto, un Estadístico Muestral es una variable ya que su valor depende de los elemento que componen la muestra.Una vez seleccionada la muestra de población los estadísticos muéstrales no varían son constantes

Estadisticas y Probabilidades. Ing. James Támara 27

Conceptos BásicosProceso de la Inferencia Estadística

Población de

Parámetros Desconocidos

Se selecciona, en la población, una muestra aleatoria

de n elementos

Con los datos de la muestra se calculan los estadísticos

muéstrales

Se usa el valor del estadístico muestral para estimar o hacer

Inferencia acerca delparámetro poblacional

Estadisticas y Probabilidades. Ing. James Támara 28

Conceptos Básicos

Estadisticas y Probabilidades. Ing. James Támara 29

Estadistica y Ética

“Hay tres clases de mentiras: la mentira, la maldita mentira y las estadísticas” (Mark Twain)"Las cifras no mienten, pero los mentirosos también usan cifras” (Anónimo)

Recomendación general para el manejo de cifras:• Dude de cualquier resultado numérico, provenga de donde provenga, y beneficie de la duda haciendo cuestionamientos:

Como se obtuvieron los resultado? Donde se obtuvieron? Cuando se obtuvieron? Quien o quienes lo obtuvieron? Bajo que condiciones se obtuvieron los resultados Etc, etc, …….

Estadisticas y Probabilidades. Ing. James Támara 30

Gracias por tu atención.

Fuente: Ucde V./FACES/Simmons, Leonardo.