Download - - Estadistica

Transcript
  • PROBABILIDAD

    Y

    ESTADSTICAGR-1

    2015 - A

    ESCUELA POLITCNICA NACIONAL

    FACULTAD DE INGENIERA MECNICA

  • CAPTULO I: ESTADSTICA

    2

  • Es un conjunto de principios y mtodos de apoyo a la

    toma de decisiones en condiciones de incertidumbre.

    Es la ciencia que utiliza mtodos cientficos para

    recolectar, organizar, resumir, presentar y analizar

    datos; para obtener conclusiones vlidas para tomar

    decisiones.

    1.1.1. Introduccin a la Estadstica

    CONCEPTO DE ESTADSTICA

    3

  • Su funcin principal es predecir el comportamiento de

    una poblacin sobre la base de la informacin de una

    muestra, equilibrando: objetivos, costos, tcnicas y

    conclusiones que infieran

    1.1.1. Introduccin a la Estadstica

    FUNCIN DE LA ESTADSTICA

    4

  • DESCRIPTIVA O DEDUCTIVA: Busca describir y analizar

    u grupo determinado, sin sacar conclusiones acerca

    de un grupo mas grande.

    INDUCTIVA O INFERENCIAL: Se ocupa de las

    condiciones donde las inferencias son vlidas.

    1.1.1. Introduccin a la Estadstica

    CLASIFICACIN DE LA ESTADSTICA

    5

  • Es el conjunto total de individuos, objetos o medidas

    que poseen algunas caractersticas comunes

    observables en un lugar y en un momento

    determinado

    Una poblacin puede ser finita o infinita

    1.1.2. Poblacin y Muestra

    POBLACIN

    6

  • Es un subconjunto

    representativo de la

    poblacin. El tipo de

    muestra seleccionado

    depende de la calidad

    del estudio de la

    poblacin.

    1.1.2. Poblacin y Muestra

    MUESTRA

    7

  • Una es un smbolo (X, H, Y, , ) que puedetomar cualquier valor de un conjunto predeterminado,

    llamado DOMINIO de la variable.

    Si la variable slo toma un valor, se le llama variable

    constante. A una variable que toma cualquier valor

    entre dos valores, se le llama variable continua. Si no

    es as, se denomina variable discreta.

    1.1.3. VARIABLES: Discretas y Continuas

    8

  • a) Nmero de acciones vendidas por da en labolsa de valores

    b) Las temperaturas registradas cada mediahora en un observatorio

    c) El tiempo de vida de los televisores

    d) La longitud de 100 tornillos producidos enuna fbrica

    9

  • a) El nmero G de galones de agua en una lavadora

    b) El nmero B de libros en el estante de una biblioteca

    c) La suma S de los puntos obtenidos al lanzar un parde dados

    d) El dimetro D de una esfera

    e) El pas C en Europa10

  • 72,8 a la unidad ms cercana es 73; ya que est mas

    cerca de 73 que de 72

    72,465 a la centsima ms cercana

    1.1.4. Matemtica bsica para estadstica

    11

    REDONDEO DE DATOS

    72,46

  • a) 48,6 unidad ms cercana

    b) 136,5 unidad ms cercana

    c) 2,484 centsima ms cercana

    d) 0,0435 milsima ms cercana

    e) 4,50001 unidad ms cercana

    f) 143,95 dcima ms cercana

    g) 368 centena ms cercana

    h) 24448 millar ms cercano

    i) 5,56500 centsima ms cercana

    j) 5,56501 centsima ms cercana 12

    49

    136

    2,48

    0,044

    5

    144,0

    400

    24000

    5,56

    5,57

  • Sumar los nmeros:

    4,35

    8,65

    2,95

    12,45

    6,65

    7,55

    9,7513

    a) Directamente

    b) Redondeando a la dcimams cercana de acuerdo ala convencin del enteropar

    c) Redondeando a fin deincrementar el dgitoantes del 5

  • Si una altura se registra exactamente como 65,4 pulg,

    significa que la verdadera altura est entre 65,35 y

    65,45. A los dgitos exactos, aparte de los ceros

    necesarios para localizar el punto decimal, se les

    llama dgitos o cifras significativas

    1.1.4. Matemtica bsica para estadstica

    14

    CIFRAS SIGNIFICATIVAS

  • 65,4 3 cifras significativas

    4,5300 5 cifras significativas

    0,0018=,0018=1,8x10-3 2 cifras significativas

    ,001800=0,001800=1,800x10-3 4 cifras significativas

    1.1.4. Matemtica bsica para estadstica

    15

    CIFRAS SIGNIFICATIVAS

  • a) 149,8

    b) 149,80

    c) 0,0028

    d) 0,00280

    e) 1,00280

    f) 9

    g) 7,58400x10-5 16

    4

    5

    2

    3

    6

    1

    6

  • Al realizar clculos que impliquen cualquier

    operacin, el resultado final no debe tener

    ms cifras significativas que los nmeros

    con menos cifras significativas

    1.1.4. Matemtica bsica para estadstica

    17

    CLCULOS

  • CAPTULO I: ESTADSTICA

    18

  • Se les llama a los

    datos recolectados que no han sido organizados

    numricamente.

    EJEMPLO: Conjunto de pesos (libras) de 40

    estudiantes hombres, obtenidas del registro

    universitario, que est ordenado alfabticamente.

    1.2.1. Datos Sueltos

    19

  • 138 164 150 132 144 125 149 157

    146 158 140 147 136 148 152 144

    168 126 138 176 163 119 154 165

    146 173 142 147 135 153 140 135

    161 145 135 142 150 156 145 128

    20

  • Una es un conjunto de datos numricos

    en orden creciente o decreciente de magnitud. A la

    diferencia entre el nmero mayor y el menor se le

    conoce como rango (R) de los datos.

    EJEMPLO: Mayor peso de los 40 estudiantes es 176 lb,

    menor peso es 119 lb.

    1.2.2. Ordenacin

    21

  • 119 125 126 128 132 135 135 135

    136 138 138 140 140 142 142 144

    144 145 145 146 146 147 147 148

    149 150 150 152 153 154 156 157

    158 161 163 164 165 168 173 176

    22

  • Al organizar una gran cantidad de datos en bruto,

    suele resultar til distribuirlos en clases o categoras

    () y determinar la cantidad de datos que pertenece acada clase; esta cantidad se conoce como la

    frecuencia de clase ().

    Para comparar entre dos caractersticas o muestras es

    aconsejable usar frecuencias relativas (), que seexpresa en porcentaje.

    1.2.3. Distribuciones de Frecuencia

    23

  • A la disposicin tabular de los datos en clases con sus

    respectivas frecuencias de clase se le conoce como

    distribucin de frecuencias o tabla de frecuencias

    1.2.3. Distribuciones de Frecuencia

    24

  • PESO (lb)CANTIDAD DE

    ESTUDIANTES

    119 127

    128 136

    137 145

    146 154

    155 163

    164 172

    173 181

    3

    6

    10

    11

    5

    3

    2

    TOTAL 40

    1.2.3. Distribuciones de Frecuencia

    25

  • A los datos organizados y resumidos como en la

    distribucin de frecuencias anterior se les llama datos

    agrupados.

    Aunque al agrupar los datos se pierden muchos de los

    detalles originales de los datos, esto tiene la ventaja

    de que se obtiene una visin general clara y se hacen

    evidentes las relaciones.

    1.2.3. Distribuciones de Frecuencia

    26

  • a) Mtodo emprico: < # <

    b) Muestras pequeas: # =

    # = = , =

    a) Mtodo de Sturges : # = + , log

    # = + , log = , =

    Clculo del nmero de Clases o Intervalos (#)

    27

  • PESO (lb)CANTIDAD DE

    ESTUDIANTES

    119 127

    128 136

    137 145

    146 154

    155 163

    164 172

    173 181

    3

    6

    10

    11

    5

    3

    2

    TOTAL 40

    Nmero de Clases

    28

  • Son los nmeros extremos de una clase.

    Un intervalo de clase que, por lo menos tericamente,

    no tenga indicado el lmite de clase superior o el lmite

    de clase inferior, se conoce como intervalo de clase

    abierto. Por ejemplo, al considerar grupos de edades

    de personas, un intervalo que sea 65 aos o

    mayores es un intervalo de clase abierto.

    1.2.4. Intervalos de clase y lmites de clase (LC)

    29

  • 119 127

    128 136

    137 145

    146 154

    155 163

    164 172

    173 181

    Lmites de Clase

    30

  • Llamada tambin verdadero lmite de clase, son los

    extremos que incluyen todas las medidas de un

    intervalo y se los obtiene dividiendo la precisin de la

    medida de los datos por 2 y restando/aadiendo este

    valor a cada lmite de clase.

    En la prctica, las fronteras de clase se obtienen

    sumando el lmite superior de un intervalo de clase al

    lmite inferior del intervalo de clase inmediato superior

    y dividiendo entre 2.

    1.2.5. Fronteras de Clase (FC)

    31

  • En el ejemplo, la precisin es 1; ya que estamos

    trabajando con unidades.

    PRECISIN = 1

    PRECISIN/2 = = 0,5

    Al lmite inferior de clase se resta 0,5

    Al lmite superior de clase se suma 0,5

    1.2.5. Fronteras de Clase (FC)

    32

  • 118,5 127,5

    127,5 136,5

    136,5 145,5

    145,5 154,5

    154,5 163,5

    163,5 172,5

    172,5 181,5

    Frontera de Clase

    33

  • El tamao, o la amplitud, de un intervalo de clase es la

    diferencia entre sus fronteras superior e inferior y se le

    conoce tambin como amplitud de clase, tamao de

    clase o longitud de clase. Si en una distribucin de

    frecuencia todos los intervalos de clase tienen la

    misma amplitud, esta amplitud comn se denota c.

    =

    #

    1.2.6. Tamao o Amplitud de un Intervalo de clase

    34 =

    = , =

  • 119 127

    128 136

    137 145

    146 154

    155 163

    164 172

    173 181

    Tamao de Clase con Lmites de Clase

    35

    8

    8

    8

    8

    8

    8

    8

  • 119 127

    128 136

    137 145

    146 154

    155 163

    164 172

    173 181

    Tamao de Clase con Frontera de Clase

    36

    9

    9

    9

    9

    9

    9

    9

  • La marca de clase es el punto medio del intervalo de

    clase y se obtiene sumando los lmites de clase

    inferior y superior y dividiendo entre 2.

    A la marca de clase tambin se le conoce como punto

    medio de clase.

    = +

    1.2.7. Marca de Clase ( )

    37

  • 119 127

    128 136

    137 145

    146 154

    155 163

    164 172

    173 181

    Marca de Clase

    38

    123

    132

    141

    150

    159

    168

    177

  • En el conjunto de los datos en bruto,

    se determina el nmero mayor y el

    nmero menor y se halla, as, el

    rango (la diferencia entre los

    nmeros mayor y menor).

    1.2.8. REGLAS GENERALES PARA FORMAR UNADISTRIBUCIN DE FRECUENCIAS

    39

  • Se divide el rango en una cantidad

    adecuada de intervalos de clase de una

    misma amplitud. Si esto no es posible,

    se usan intervalos de clase de

    diferentes amplitudes o intervalos de

    clase abiertos.

    1.2.8. REGLAS GENERALES PARA FORMAR UNADISTRIBUCIN DE FRECUENCIAS

    40

  • Se determina la cantidad de

    observaciones que caen dentro de

    cada intervalo de clase; es decir, se

    encuentran las frecuencias de clase.

    La mejor manera de hacer esto es

    utilizando una hoja de conteo

    1.2.8. REGLAS GENERALES PARA FORMAR UNADISTRIBUCIN DE FRECUENCIAS

    41

  • INTERVALOS CONTEO FRECUENCIAS

    119 127

    128 136

    137 145

    146 154

    155 163

    164 172

    173 181

    ///

    //// /

    //// ////

    //// //// /

    ////

    ///

    //

    3

    6

    10

    11

    5

    3

    2

    TOTAL 40

    42

  • 43

  • Los histogramas y los polgonos de

    frecuencias son dos

    de las

    distribuciones de frecuencias

    1.2.9. HISTOGRAMAS Y POLGONOS DEFRECUENCIAS

    44

  • Conjunto de rectngulos que tienen:

    a) Sus bases sobre un eje horizontal (el eje X ),

    con sus

    de longitudes iguales a la amplitud

    del intervalo de clase,

    b) reas proporcionales a las frecuencias de

    clase.

    HISTOGRAMAS

    45

  • Es una grfica de lnea que presenta las

    frecuencias de clase graficadas contra las

    marcas de clase. Se puede obtener

    conectando los puntos medios de las partes

    superiores de los rectngulos de un

    histograma

    POLGONO DE FRECUENCIA

    46

  • Relativa

    Acumulada

    Ojivas relativas acumuladas

    Ojivas de porcentajes

    1.2.9. DISTRIBUCIONES DE FRECUENCIA

    47

  • La frecuencia relativa de una clase es la frecuencia de

    la clase dividida entre la suma de las frecuencias de

    todas las clases y generalmente se expresa como

    porcentaje

    Las representaciones grficas de las distribuciones de

    frecuencias relativas se obtienen a partir de los

    histogramas o polgonos de frecuencias, cambiando

    nicamente, en la escala vertical

    FRECUENCIAS RELATIVAS

    48

  • A la suma de todas las frecuencias menores que la

    frontera superior de un intervalo de clase dado se le

    llama frecuencia acumulada MENOS

    A la suma de todas las frecuencias mayores que la

    frontera inferior de un intervalo de clase dado se le

    llama frecuencia acumulada MS

    FRECUENCIAS ACUMULADAS

    49

  • Una grfica que muestra las frecuencias

    acumuladas menores de cada frontera superior de

    clase respecto a cada frontera superior de clase o

    viceversa se le conoce como grfica de

    frecuencias acumuladas u ojiva.

    Siempre al hablar de distribuciones acumuladas o

    de ojivas, se tratar del tipo menos que.

    OJIVAS

    50

  • La frecuencia acumulada relativa o frecuencia

    acumulada porcentual es la frecuencia acumulada

    dividida entre la suma de todas las frecuencias

    Si se emplean las frecuencias acumuladas relativas en

    lugar de las frecuencias acumuladas, se obtiene una

    distribucin de frecuencias acumuladas relativas y una

    grfica de frecuencias acumuladas relativas

    DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS

    RELATIVAS Y OJIVAS PORCENTUALES

    51

  • Cuando se tienen poblaciones grandes puede esperarse

    que los polgonos de frecuencias, o los polgonos de

    frecuencias relativas, correspondientes a estas

    poblaciones estn formados por una gran cantidad de

    pequeos segmentos de recta de manera que sus

    formas se aproximen a las de unas curvas, a las cuales

    se les llama curvas de frecuencias o curvas de

    frecuencias relativas, respectivamente.

    CURVAS DE FRECUENCIAS Y OJIVAS SUAVIZADAS

    52

  • Es razonable esperar que estas curvas tericas puedan

    ser aproximadas suavizando los polgonos de

    frecuencias o los polgonos de frecuencias relativas de

    la muestra; esta aproximacin mejorar a medida que

    aumenta el tamao de la muestra. sta es la razn por

    la que a las curvas de frecuencias se les suele llamar

    polgonos de frecuencias suavizados.

    CURVAS DE FRECUENCIAS Y OJIVAS SUAVIZADAS

    53

  • Simtricas

    Sesgadas a la izquierda

    Sesgadas a la derecha

    Distribuidas uniformemente

    En forma de J

    En forma de U

    Bimodales

    Multimodales

    TIPOS DE CURVAS DE FRECUENCIAS

    54

  • CAPTULO I: ESTADSTICA

    55

  • El smbolo, (que se lee X subndice j) representa

    cualquiera de los N valores 1, 2, 3,. . . , quepuede tomar la variable X. A la letra j que aparece en representando a cualquiera de los nmeros 1, 2, 3, . . . ,

    N se le llama subndice o ndice. En lugar de j se puede

    usar, por supuesto, cualquier otra letra, i, k, p, q o s.

    1.3.1. Notacin de ndices

    56

  • El smbolo =1 se emplea para denotar la suma de

    todas las desde j = 1 hasta j = N; por definicin,

    =1

    =1 + 2 + 3 ++

    Cuando no puede haber confusin, esta suma se

    denota simplemente como , , El smbolo es la letra griega mayscula sigma y denota suma.

    1.3.2. Notacin de Sumatoria

    57

  • Un promedio es un valor tpico o representativo de un

    conjunto de datos. Como estos valores tpicos tienden a

    encontrarse en el centro de los conjuntos de datos,

    ordenados de acuerdo con su magnitud, a los

    promedios se les conoce tambin como medidas de

    tendencia central.

    1.3.3.Promedios o medidas de tendencia central

    58

  • Se pueden definir varios tipos de promedios; los ms

    usados son la media aritmtica, la mediana, la moda, la

    media geomtrica y la media armnica. Cada una de

    ellas tiene ventajas y desventajas de acuerdo con el tipo

    de datos y el propsito de su uso.

    1.3.3.Promedios o medidas de tendencia central

    59

  • La media aritmtica, o brevemente la media, de un

    conjunto de N nmeros 1, 2, 3, . . . , se denotaas: (que se lee X barra) y est definida como:

    = + + ++

    = =

    =

    1.3.4. Media

    60

  • Si los nmeros 1, 2, 3,, se presentan 1, 2,3,, veces, respectivamente (es decir, se presentancon frecuencias 1, 2, 3, . . . , ), su media aritmticaes:

    = + + ++

    +++ . . . += =

    =

    =

    =

    1.3.4. Media

    61

  • Algunas veces, a los nmeros 1, 2, 3,, se lesasignan ciertos factores de ponderacin (pesos) 1, 2,3,, que dependen del significado o importanciaque se les asigne a estos nmeros.

    = + + ++

    +++ . . . +=

    1.3.4.1. Media Aritmtica Ponderada

    62

  • Algunas veces, a los nmeros 1, 2, 3,, se lesasignan ciertos factores de ponderacin (pesos) 1, 2,3,, que dependen del significado o importanciaque se les asigne a estos nmeros.

    = + + ++

    +++ . . . +=

    1.3.4.1. Media Aritmtica Ponderada

    63

  • 1. En un conjunto de nmeros, la suma algebraica de

    las desviaciones de estos nmeros respecto a su

    media aritmtica es cero.

    1.3.4.2. Propiedades de la Media Aritmtica

    64

  • 2. En un conjunto de nmeros , la suma de los

    cuadrados de sus desviaciones respecto a un

    nmero es un mnimo si y slo si =

    1.3.4.2. Propiedades de la Media Aritmtica

    65

  • 3. Si la media de nmeros es , la media de nmeros es , . . . , la media de nmeros es, entonces la media de todos estos nmeros es

    = + + ++

    +++ . . . +

    Es decir, una media aritmtica ponderada de todas las

    medias.

    1.3.4.2. Propiedades de la Media Aritmtica

    66

  • 4. Si se cree o se supone que un nmero A (que puede

    ser cualquier nmero) es la media aritmtica y si

    = son las desviaciones de de A,

    entonces:

    = + =

    = +

    = + =

    =

    = +

    1.3.4.2. Propiedades de la Media Aritmtica

    67

  • Cuando se presentan los datos en una distribucin de

    frecuencias, se considera que todos los datos que caen

    en un intervalo de clase dado coinciden con la marca o

    punto medio del intervalo. Para datos agrupados,

    interpretando a las como las marcas de clase, a las

    como las correspondientes frecuencias de clase, a A

    como cualquier marca de clase supuesta y =

    como la desviacin de respecto de A

    1.3.4.3. Clculo de la Media Aritmtica para DatosAgrupados

    68

  • Si todos los intervalos de clase son de una misma

    amplitud c, las desviaciones = se pueden

    expresar como , donde puede tener valores

    enteros positivos o negativos o cero (es decir, 0, 1, 2,

    3, . . .)

    = + =

    = +

    1.3.4.3. Clculo de la Media Aritmtica para DatosAgrupados

    69

  • Es equivalente a la ecuacin = + . A estaecuacin se le conoce como mtodo codificado para

    calcular la media. Es un mtodo muy breve

    recomendado para datos agrupados cuando los

    intervalos de clase tienen todos la misma amplitud.

    Obsrvese que en el mtodo codificado los valores de la

    variable X se transforman en valores de la variable u de

    acuerdo con X = A + cu.

    1.3.4.3. Clculo de la Media Aritmtica para DatosAgrupados

    70

  • La mediana de un conjunto de nmeros acomodados en

    orden de magnitud (es decir, en una ordenacin) es el

    valor central o la media de los dos valores centrales.

    En datos agrupados, la mediana se obtiene por

    interpolacin, como se expresa por la frmula

    = +

    1.3.5. Mediana

    71

  • Geomtricamente, la mediana es el valor de X (abscisa)

    que corresponde a una recta vertical que divide al

    histograma en dos partes que tienen la misma rea. A

    este valor de X se le suele denotar .

    1.3.5. Mediana

    72

  • La moda de un conjunto de nmeros es el valor que se

    presenta con ms frecuencia; es decir, es el valor ms

    frecuente. Puede no haber moda y cuando la hay, puede

    no ser nica.

    A una distribucin que slo tiene una moda se le llama

    unimodal.

    1.3.6. Moda

    73

  • En el caso de datos agrupados, para los que se ha

    construido una curva de frecuencia que se ajuste a los

    datos, la moda es el valor (o los valores) de X que

    corresponden al punto (o puntos) mximos de la curva.

    A este valor de X se le suele denotar .

    1.3.6. Moda

    74

  • En una distribucin de frecuencia o en un histograma la

    moda se puede obtener mediante la frmula siguiente:

    = +

    1.3.6. Moda

    75

  • En las curvas de frecuencias unimodales que son

    ligeramente sesgadas (asimtricas), se tiene la relacin

    emprica siguiente:

    = ( )

    RELACIN EMPRICA MEDIA-MEDIANA-MODA

    76

  • En las figuras se muestran las posiciones relativas de la

    media, la mediana y la moda en curvas de frecuencias

    sesgadas a la derecha o a la izquierda, respectivamente

    RELACIN EMPRICA MEDIA-MEDIANA-MODA

    77

  • La media geomtrica G de N nmeros positivos 1, 2,3,..., es la raz n-sima del producto de los nmeros:

    = 123...

    La Media Geomtrica (G)

    78

  • La media armnica H de N nmeros positivos 1, 2,3,..., es el recproco de la media aritmtica de losrecprocos de los nmeros:

    =

    =

    =

    La Media Armnica (H)

    79

  • La media geomtrica de un conjunto de nmeros

    positivos 1, 2, 3,..., es menor o igual que sumedia aritmtica, pero mayor o igual que su media

    armnica.

    RELACIN ENTRE MEDIA ARITMTICA,GEOMTRICA Y ARMNICA

    80

  • La raz cuadrada media (RCM) o media cuadrtica de un

    conjunto de nmeros 1, 2, 3,..., se denota 2 yse define:

    = = =

    =

    RAZ CUADRADA MEDIA

    81

  • En un conjunto de datos ordenados de acuerdo con su

    magnitud, el valor de en medio, que divide al conjunto

    en dos partes iguales, es la mediana. Entonces aquellos

    valores que dividen al conjunto de datos en cuatro

    partes iguales son denotados Q1, Q2 y Q3 son el

    primero, segundo y tercer cuartiles, respectivamente; el

    valor Q2 coincide con la mediana.

    1.3.7. Cuartiles, deciles y percentiles

    82

  • De igual manera, los valores que dividen al conjunto en

    diez partes iguales son los deciles y se denotan D1, D2,

    . . . , D9, y los valores que dividen al conjunto en 100

    partes iguales son los percentiles y se les denota P1,

    P2, . . . , P99. El quinto decil y el percentil 50 coinciden

    con la mediana. Los percentiles 25 y 75 coinciden con

    el primero y tercer cuartiles, respectivamente.

    1.3.7. Cuartiles, deciles y percentiles

    83

  • A los cuartiles, deciles, percentiles y otros

    valores obtenidos dividiendo al conjunto de

    datos en partes iguales se les llama en

    conjunto cuantiles.

    1.3.7. Cuartiles, deciles y percentiles

    84


Top Related