clase 02.- conceptos basic.estad.descrip.inferencial.pdf

49
Estatistics and Probability Clase 02: Conceptos Básicos de Estadística Descriptiva e Inferencial Universidad Nacional de Huancavelica Facultad de Ciencias de Ingeniería Departamento Académico de Ciencias Básicas Escuela Académico Profesional de Ingeniería Ambiental Sanitaria Ing. Jorge Luis Huere Peña Master in Informátics and Computer Science e-mail : [email protected]

Upload: ivandiazfernandez

Post on 08-Sep-2015

22 views

Category:

Documents


3 download

DESCRIPTION

conceptos de la estadística descriptiva e inferencial

TRANSCRIPT

  • Estatistics and Probability

    Clase 02: Conceptos Bsicos de Estadstica Descriptiva e Inferencial

    Universidad Nacional de Huancavelica Facultad de Ciencias de Ingeniera

    Departamento Acadmico de Ciencias Bsicas

    Escuela Acadmico Profesional de Ingeniera Ambiental Sanitaria

    Ing. Jorge Luis Huere Pea Master in Informtics and Computer Science

    e-mail : [email protected]

  • 2

    "Statistical thinking will one day be as necessary

    for efficient citizenship as the ability to read and

    write."

    El pensamiento estadstico algn da ser tan necesario para la ciudadana como la capacidad

    de leer y escribir...

    Herbert George Wells

    100 years ago

  • 3

    Scientific Research La investigacin cientfica

    Qu es la investigacin cientfica?

    Es la bsqueda sistematizada y objetiva de nuevos conocimientos (new knowledge). Investigar es un proceso

    de buscar, indagar o pesquisar.

    El mtodo cientfico (The scientific method),

    comprende la realizacin de la investigacin en forma

    sistematizada y objetiva, organizada y coherente.

  • 4

    A.Planificacin: Elaboracin del proyecto. Abarca

    una descripcin detallada y fundamentada de cada

    una de las actividades a desarrollarse en la

    investigacin.

    B. Ejecucin: Es la etapa en la cual se lleva a

    cabo al investigacin. Recoleccin de datos,

    anlisis e interpretacin.

    C. Informe: Escrito donde se presentan los

    hallazgos encontrados.

    Phases of Scientific Research Etapas de la investigacin cientfica

  • 5

    Definicin de Estadstica

    La estadstica es una ciencia que crea,

    desarrolla, aplica mtodos y procedimientos para

    analizar informacin de manera confiable en

    condiciones de certidumbre e incertidumbre,

    brindando apoyo en la optimizacin de toma de

    decisiones.

  • 6

    Utilidad e Importancia de la Estadstica

    Se usa la descripcin de datos recolectados reducindolos a un pequeo nmero de caractersticas

    que concentra la parte ms importante y significativa

    de la informacin proporcionada por los datos.

    Estudio y conocimiento de la poblacin a travs de una muestra, lo que conlleva a hacerla factible, disminuir

    costos, tiempo y espacio.

    Conocimiento de eventos probabilsticos y pronsticos, para la ayuda en la toma de decisiones

    con gran posibilidad de aciertos.

  • 7

    La estadstica es la ciencia que proporciona un

    conjunto de mtodos que se utilizan para:

    Statistic Estadistica

    DECISION

    MAKING TOMA DE

    DECISIONES

    RECOLECTAR

    ORGANIZAR

    ANALIZAR

    INTERPRETAR

    DATA DATOS

    A esta secuencia se llama proceso

    estadistico.

    THE STATISTICAL PROCESS

    COLLECT

    ORGANIZE

    ANALYZE

    INTERPRET

  • 8

    Es el registro de caractersticas

    (medicin, observacin, conteo) a una

    unidad elemental (o de anlisis).

    Qu es la RECOLECCIN de datos ?

  • 9

    Proporcionan la evidencia imprescindible en un

    estudio de investigacin.

    Permiten medir el desempeo en el proceso de

    produccin de un bien o servicio.

    Ayudan a la formulacin de cursos alternativos

    de accin en un proceso de toma de

    decisiones.

    Satisfacen nuestra curiosidad innata.

    Por qu necesitamos recolectar datos?

  • 10

    Qu es la ORGANIZACIN de datos ?

    Es el ordenamiento para una mejor

    comprensin y facilitar sus anlisis.

    (tablas y/o grficos)

    Los datos sin organizar se llaman datos

    brutos, y son de poca utilidad.

  • 11

    Por ejemplo, los siguientes datos sobre las horas de permanencia de

    material orgnico en un sistema de refrigeracin no organizados

  • 12

    0

    2

    4

    6

    8

    10

    12

    30-34 35-39 40-44 45-49

    Diagrama Circular

    Diagrama de

    Barras

    Edad N Pacientes

    30 - 34

    35 - 39

    40 - 44

    45 - 49

    6

    12

    8

    2

    Tabla de Distribucin

    Ejemplo de datos organizados

  • 13

    Es el clculo de MEDIDAS

    REPRESENTATIVAS (o de resumen)

    tales como promedios, medidas de

    variabilidad y medidas de la forma de

    la distribucin, etc.

    Tambin se analizan datos cuando se

    establecen relaciones entre ellos

    (regresin y correlacin).

    Qu es el ANALISIS de datos ?

  • 14

  • 15

    Qu es la INTERPRETACIN de datos ?

    Es darle un sentido prctico o til a los

    resultados obtenidos en el anlisis.

  • 16

    ESTADISTICA DESCRIPTIVA

    Division of Statistics Divisin de la Estadstica

    ESTADISTICA INFERENCIAL

    PROBABILIDADES

    DESCRIPTIVE

    STATISTIC

    PROBABILITIES

    INFERENTIAL

    STATISTICS

  • 17

    Es el conjunto de mtodos que implican la

    recoleccin, organizacin, presentacin y resumir un

    conjunto de datos a fin de describir en forma

    apropiada las diversas caractersticas de estos. Es

    bastante usado en trabajos de tipo exploratorio..

    ESTADISTICA DESCRIPTIVA DESCRIPTIVE STATISTIC

  • 18

    Procesamiento

    SINTESIS

    FIN DEL

    PROCESO

    BUENA

    RECOLECCIN?

    NO

    NO

    SI

    MEJORAR O

    RECOLECCION

    NIVEL DE

    CRITICA

    MALO

    RE-CRITICA

    BUENO

    EN BASE A

    CARACTERISTICAS,

    TABLAS Y GRAFICOS

    Validacin yconsistencia

    Recolectardatos

    PROCESOS DE LA ESTADISTICA DESCRIPTIVA

    1. Coleccin de datos

    2. Crtica de datos

    3. Procesamiento.

    4. Anlisis.

  • 19

    Es el conjunto de mtodos o tcnicas por

    medio de las cuales se toman decisiones

    sobre una poblacin basadas en una

    muestra y en el juicio de los expertos.

    Debido a que esas decisiones se toman en condiciones

    de incertidumbre, se requiere el uso de conceptos de

    probabilidad. Es decir, un estudio estadstico se

    considera inferencial cuando se pretende llegar a

    conclusiones o generalizaciones que involucran a toda

    la poblacin en base a una informacin parcial

    ESTADISTICA INFERENCIAL INFERENTIAL STATISTICS

  • 20

    FLUJOGRAMA DE LA ESTADISTICA INFERENCIAL

  • 21

    Population and Sample Poblacin y muestra

    Poblacin (population) Es el conjunto de personas, animales o cosas que poseen

    caractersticas especiales, que pueden cuantificarse y sobre el que estamos interesados en obtener conclusiones (hacer inferencia).

    Normalmente es demasiado grande para poder abarcarlo.

    Debe delimitar espacio y tiempo,

    Muestra (sample) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)

    Debera ser representativo Esta formado por miembros seleccionados de la

    poblacin (individuos, unidades experimentales).

    Debe tener un tamao adecuado

  • 22

    Population POBLACION

    Sample MUESTRA

    Se obtienen datos

    representativos

    Conocemos

    la poblacin

    Muchos datos, difciles

    de poder conseguirlos,

    lleva mucho tiempo,

    adems que consume

    mucho presupuesto

  • 23

  • 24

    PARAMETER PARMETRO

    Es una medida de resumen que nos describe una

    o ms caractersticas de la poblacin. Se

    simboliza por letras griegas. Slo hay un parmetro

    en cada poblacin.

    : Proporcin poblacional (pi)

    2 : Varianza poblacional (sigma cuadrado)

    : Desviacin estndar poblacional (sigma)

    : Coeficiente de correlacin poblacional (rho)

    : Media poblacional (mu)

  • 25

    STADIGRAPH ESTADGRAFO - ESTIMADOR

    Es una medida de resumen que nos describe alguna

    caracterstica de inters y cuyo valor es calculado

    usando slo los valores de los elementos o unidades de

    una muestra. Se simboliza por letras latinas. Existen

    tantos estimadores como muestras se extraigan de una

    poblacin.

    p Proporcin muestral

    x Media muestral. 2s Varianza muestra.

    s Desviacin estndar muestral.

    r Coeficiente de correlacin muestral

  • 26

  • 27

    ANALYSIS UNIT UNIDAD DE ANLISIS

    Es el objeto o elemento indivisible que

    ser estudiado en una poblacin, sobre la cual se obtendrn los datos de inters

    para la investigacin.

    La unidad de anlisis no es el fenmeno investigado sino el que genera el fenmeno

  • 28

    DATA DATO

    El dato es el registro de una caracterstica o

    resultado de la recopilacin de informacin. Es el

    valor o respuesta que adquiere la variable en

    cada unidad de anlisis.

    Los datos son la materia prima de la

    estadstica

    Si un DATO es til para tomar decisiones se

    convierte en INFORMACIN.

  • 29

    Ejemplo :

    Edad del trabajador

    Peso del material

    Tiempo permanencia

    Temperatura corporal

    Profesin

    27

    3,750

    5

    37,5

    Topgrafo

    aos

    Kg.

    das

    C

    ---

    Caractersticas Datos Unidad de

    medida

  • 30

    QU TIPOS DE DATOS EXISTEN?

    Si el registro de la caracterstica toma un slo valor en

    todas las unidades elementales. Son muchos datos,

    pero iguales.

    Ejemplo:

    Sexo de las pacientes en el Servicio de Ginecologa

    Ttulo profesional de los miembros del Colegio Mdico

    del Per

    Las constantes no son inters en Estadstica, puesto

    que ella se ocupa del estudio de la variabilidad de los

    datos.

    CONSTANTE

  • 31

    VARIABLE VARIABLE

    Si el registro de la caracterstica toma diversos

    valores en las unidades elementales.

    Ejemplo:

    Edad, sexo y peso de los pacientes de una Clnica

    Una misma caracterstica puede generar

    constantes variables, depende del marco

    muestral.

  • 32

    Por ejemplo: si representamos con X la temperatura del

    Aire, veremos que en las estaciones tendremos en un da

    24 observaciones horarias tomadas de una variable

    continua, y cada una de ellas puede tener valores

    diferentes, por eso decimos que X es una variable

  • 33

    VARIABLES TYPES TIPOS DE VARIABLES

    Qualitative variables

    Variables Cualitativas Quantitative variables

    Variables Cuantitativas

  • 34

    VARIABLES CUALITATIVAS

    NOMINAL

    Variables cuyas categoras no pueden ser ordenas

    sea en forma ascendente o descendente.

    ORDINAL

    Variables cuyas categoras pueden ser ordenas sea

    en forma ascendente o descendente.

    VARIABLES CUANTITATIVAS

    DISCRETA

    Variables cuyas valores son de tipo numrico y

    entero. Generalmente provienen de conteos

    CONTINUA

    Los valores son de numericos y pueden ser fraccionarios.

    Provienen de mediciones con instrumentos.

    NO ES POSIBLE

    ORDENARLOS

    SE PUEDEN

    ORDENAR

    PROVIENEN DE

    CONTADAS

    USO DE INSTRUMENTOS PARA

    MEDIRLOS

  • 35

    VARIABLES CUALITATIVAS

    Son atributos de una poblacin los cuales no

    pueden ser representados numricamente. (no se pueden hacer operaciones algebraicas con ellos)

    Nominales: Si sus valores no se pueden ordenar

    Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar

    (S/No)

    Ordinales: Si sus valores se pueden ordenar

    Calidad de un producto, Grado de satisfaccin,

    Intensidad del dolor

    Qualitative variables

  • 36

    VARIABLES CUANTITATIVAS

    Son variables cuantitativas aquellas caractersticas de la

    poblacin que pueden representarse numricamente.

    (Las operaciones posibles son los promedios y las medidas de

    dispersin, entre otras).

    Discrete (Discretas) : Si toma valores enteros

    Nmero de hijos, Nmero de cigarrillos, Num. de

    cumpleaos

    Continuous (Continuas) : Si entre dos valores, son posibles

    infinitos valores intermedios.

    Altura, Presin, Dosis de medicamento administrado, edad

    Quantitative variables

  • 37

    65 Kg

    Femenino

    26

    S/. 1500

    Catlica

    Peso,

    Gnero,

    Edad,

    Salario,

    Religin

    Cada

    trabajador

    Trabajadores

    en una

    empresa de

    Lima

    Metropolitana

    Datos Variables Unidad de

    anlisis

    Poblacin

    EJEMPLO

  • 38

    DATOS

    VARIABLES CONSTANTES

    CUANTITATIVAS CUALITATIVAS

    DISCRETAS CONTINUAS NOMINALES ORDINALES

  • 39

    QU SE PUEDEN HACER CON LOS DATOS?

    Identificar caracte-

    rsticas de inters

    para la gestin.

    Recoleccin de

    datos

    Organizarlos en tablas, grficos y figuras

    Calcular promedios (media, mediana,

    moda y percentiles) .

    Calcular su dispersin (varianza,

    desviacin estndar ) y forma de la curva.

    Determinar una ecuacin que represente

    la relacin entre ellos (regresin)

    Determinar el grado de asociacin entre

    ellos (correlacin).

    Analizarlos dentro de un horizonte

    temporal (series cronolgicas)

    Utilizar datos para

    mejorar la calidad

  • 40

    PROGRAMAS ESTADISTICOS

    COMPUTARIZADOS

    21

  • 41

  • 42

  • 43

  • 44

  • 45

  • HOJA DE COMPROBACIN

    1. L a estadstica es una ciencia que slo analiza datos

    2. Los datos se organizan para mejorar su comprensin

    3. El anlisis de datos abarca el clculo de promedio y

    medidas de variabilidad

    4. La interpretacin de datos consiste en dar un sentido real a los

    resultados obtenidos

    6. Caracterstica: 70 kgs

    5. Todo dato constituye informacin

    46

  • 8. El color de automvil de los participantes es una variable

    cuantitativa, pues hay 13 cuyo automvil es de color azul, 7 de

    color beige y 2 rojos

    9. La variable cuantitativa proviene de un conteo

    10.El tiempo que demora un proceso productivo es una variable

    cuantitativa continua

    11.Los mdicos que laboran en el Hospital Central constituyen una

    poblacin estadstica

    7. Una misma caracterstica puede generar constantes o variables,

    dependiendo del marco muestral de referencia

  • 12.Habrn tantas poblaciones como caractersticas que se deseen

    registrar en un marco poblacional

    13.Cuanto ms grande es la muestra, necesariamente ser ms

    representativa

    14.El muestreo permite disponer de los datos en menor tiempo,

    reduciendo costos.

    15.El parmetro representa a una poblacin

    16.Existen tanto estimadores como muestras se extraigan de una

    poblacin

  • 18.Los estimadores se representan por letras griegas

    19.En la estadstica descriptiva, el anlisis se limita a un conjunto de

    datos

    20.Las tcnicas que permiten estimar un parmetro a partir de datos

    muestrales se denomina Estadstica Inferencial

    21.El error del muestreo consiste en la equivocacin cuando

    seleccionamos muestras

    17.Diferentes muestras, extradas de una misma poblacin,

    ocasionan diferente calores del estimador