- estadistica
DESCRIPTION
es estadística descriptiva.TRANSCRIPT
-
PROBABILIDAD
Y
ESTADSTICAGR-1
2015 - A
ESCUELA POLITCNICA NACIONAL
FACULTAD DE INGENIERA MECNICA
-
CAPTULO I: ESTADSTICA
2
-
Es un conjunto de principios y mtodos de apoyo a la
toma de decisiones en condiciones de incertidumbre.
Es la ciencia que utiliza mtodos cientficos para
recolectar, organizar, resumir, presentar y analizar
datos; para obtener conclusiones vlidas para tomar
decisiones.
1.1.1. Introduccin a la Estadstica
CONCEPTO DE ESTADSTICA
3
-
Su funcin principal es predecir el comportamiento de
una poblacin sobre la base de la informacin de una
muestra, equilibrando: objetivos, costos, tcnicas y
conclusiones que infieran
1.1.1. Introduccin a la Estadstica
FUNCIN DE LA ESTADSTICA
4
-
DESCRIPTIVA O DEDUCTIVA: Busca describir y analizar
u grupo determinado, sin sacar conclusiones acerca
de un grupo mas grande.
INDUCTIVA O INFERENCIAL: Se ocupa de las
condiciones donde las inferencias son vlidas.
1.1.1. Introduccin a la Estadstica
CLASIFICACIN DE LA ESTADSTICA
5
-
Es el conjunto total de individuos, objetos o medidas
que poseen algunas caractersticas comunes
observables en un lugar y en un momento
determinado
Una poblacin puede ser finita o infinita
1.1.2. Poblacin y Muestra
POBLACIN
6
-
Es un subconjunto
representativo de la
poblacin. El tipo de
muestra seleccionado
depende de la calidad
del estudio de la
poblacin.
1.1.2. Poblacin y Muestra
MUESTRA
7
-
Una es un smbolo (X, H, Y, , ) que puedetomar cualquier valor de un conjunto predeterminado,
llamado DOMINIO de la variable.
Si la variable slo toma un valor, se le llama variable
constante. A una variable que toma cualquier valor
entre dos valores, se le llama variable continua. Si no
es as, se denomina variable discreta.
1.1.3. VARIABLES: Discretas y Continuas
8
-
a) Nmero de acciones vendidas por da en labolsa de valores
b) Las temperaturas registradas cada mediahora en un observatorio
c) El tiempo de vida de los televisores
d) La longitud de 100 tornillos producidos enuna fbrica
9
-
a) El nmero G de galones de agua en una lavadora
b) El nmero B de libros en el estante de una biblioteca
c) La suma S de los puntos obtenidos al lanzar un parde dados
d) El dimetro D de una esfera
e) El pas C en Europa10
-
72,8 a la unidad ms cercana es 73; ya que est mas
cerca de 73 que de 72
72,465 a la centsima ms cercana
1.1.4. Matemtica bsica para estadstica
11
REDONDEO DE DATOS
72,46
-
a) 48,6 unidad ms cercana
b) 136,5 unidad ms cercana
c) 2,484 centsima ms cercana
d) 0,0435 milsima ms cercana
e) 4,50001 unidad ms cercana
f) 143,95 dcima ms cercana
g) 368 centena ms cercana
h) 24448 millar ms cercano
i) 5,56500 centsima ms cercana
j) 5,56501 centsima ms cercana 12
49
136
2,48
0,044
5
144,0
400
24000
5,56
5,57
-
Sumar los nmeros:
4,35
8,65
2,95
12,45
6,65
7,55
9,7513
a) Directamente
b) Redondeando a la dcimams cercana de acuerdo ala convencin del enteropar
c) Redondeando a fin deincrementar el dgitoantes del 5
-
Si una altura se registra exactamente como 65,4 pulg,
significa que la verdadera altura est entre 65,35 y
65,45. A los dgitos exactos, aparte de los ceros
necesarios para localizar el punto decimal, se les
llama dgitos o cifras significativas
1.1.4. Matemtica bsica para estadstica
14
CIFRAS SIGNIFICATIVAS
-
65,4 3 cifras significativas
4,5300 5 cifras significativas
0,0018=,0018=1,8x10-3 2 cifras significativas
,001800=0,001800=1,800x10-3 4 cifras significativas
1.1.4. Matemtica bsica para estadstica
15
CIFRAS SIGNIFICATIVAS
-
a) 149,8
b) 149,80
c) 0,0028
d) 0,00280
e) 1,00280
f) 9
g) 7,58400x10-5 16
4
5
2
3
6
1
6
-
Al realizar clculos que impliquen cualquier
operacin, el resultado final no debe tener
ms cifras significativas que los nmeros
con menos cifras significativas
1.1.4. Matemtica bsica para estadstica
17
CLCULOS
-
CAPTULO I: ESTADSTICA
18
-
Se les llama a los
datos recolectados que no han sido organizados
numricamente.
EJEMPLO: Conjunto de pesos (libras) de 40
estudiantes hombres, obtenidas del registro
universitario, que est ordenado alfabticamente.
1.2.1. Datos Sueltos
19
-
138 164 150 132 144 125 149 157
146 158 140 147 136 148 152 144
168 126 138 176 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128
20
-
Una es un conjunto de datos numricos
en orden creciente o decreciente de magnitud. A la
diferencia entre el nmero mayor y el menor se le
conoce como rango (R) de los datos.
EJEMPLO: Mayor peso de los 40 estudiantes es 176 lb,
menor peso es 119 lb.
1.2.2. Ordenacin
21
-
119 125 126 128 132 135 135 135
136 138 138 140 140 142 142 144
144 145 145 146 146 147 147 148
149 150 150 152 153 154 156 157
158 161 163 164 165 168 173 176
22
-
Al organizar una gran cantidad de datos en bruto,
suele resultar til distribuirlos en clases o categoras
() y determinar la cantidad de datos que pertenece acada clase; esta cantidad se conoce como la
frecuencia de clase ().
Para comparar entre dos caractersticas o muestras es
aconsejable usar frecuencias relativas (), que seexpresa en porcentaje.
1.2.3. Distribuciones de Frecuencia
23
-
A la disposicin tabular de los datos en clases con sus
respectivas frecuencias de clase se le conoce como
distribucin de frecuencias o tabla de frecuencias
1.2.3. Distribuciones de Frecuencia
24
-
PESO (lb)CANTIDAD DE
ESTUDIANTES
119 127
128 136
137 145
146 154
155 163
164 172
173 181
3
6
10
11
5
3
2
TOTAL 40
1.2.3. Distribuciones de Frecuencia
25
-
A los datos organizados y resumidos como en la
distribucin de frecuencias anterior se les llama datos
agrupados.
Aunque al agrupar los datos se pierden muchos de los
detalles originales de los datos, esto tiene la ventaja
de que se obtiene una visin general clara y se hacen
evidentes las relaciones.
1.2.3. Distribuciones de Frecuencia
26
-
a) Mtodo emprico: < # <
b) Muestras pequeas: # =
# = = , =
a) Mtodo de Sturges : # = + , log
# = + , log = , =
Clculo del nmero de Clases o Intervalos (#)
27
-
PESO (lb)CANTIDAD DE
ESTUDIANTES
119 127
128 136
137 145
146 154
155 163
164 172
173 181
3
6
10
11
5
3
2
TOTAL 40
Nmero de Clases
28
-
Son los nmeros extremos de una clase.
Un intervalo de clase que, por lo menos tericamente,
no tenga indicado el lmite de clase superior o el lmite
de clase inferior, se conoce como intervalo de clase
abierto. Por ejemplo, al considerar grupos de edades
de personas, un intervalo que sea 65 aos o
mayores es un intervalo de clase abierto.
1.2.4. Intervalos de clase y lmites de clase (LC)
29
-
119 127
128 136
137 145
146 154
155 163
164 172
173 181
Lmites de Clase
30
-
Llamada tambin verdadero lmite de clase, son los
extremos que incluyen todas las medidas de un
intervalo y se los obtiene dividiendo la precisin de la
medida de los datos por 2 y restando/aadiendo este
valor a cada lmite de clase.
En la prctica, las fronteras de clase se obtienen
sumando el lmite superior de un intervalo de clase al
lmite inferior del intervalo de clase inmediato superior
y dividiendo entre 2.
1.2.5. Fronteras de Clase (FC)
31
-
En el ejemplo, la precisin es 1; ya que estamos
trabajando con unidades.
PRECISIN = 1
PRECISIN/2 = = 0,5
Al lmite inferior de clase se resta 0,5
Al lmite superior de clase se suma 0,5
1.2.5. Fronteras de Clase (FC)
32
-
118,5 127,5
127,5 136,5
136,5 145,5
145,5 154,5
154,5 163,5
163,5 172,5
172,5 181,5
Frontera de Clase
33
-
El tamao, o la amplitud, de un intervalo de clase es la
diferencia entre sus fronteras superior e inferior y se le
conoce tambin como amplitud de clase, tamao de
clase o longitud de clase. Si en una distribucin de
frecuencia todos los intervalos de clase tienen la
misma amplitud, esta amplitud comn se denota c.
=
#
1.2.6. Tamao o Amplitud de un Intervalo de clase
34 =
= , =
-
119 127
128 136
137 145
146 154
155 163
164 172
173 181
Tamao de Clase con Lmites de Clase
35
8
8
8
8
8
8
8
-
119 127
128 136
137 145
146 154
155 163
164 172
173 181
Tamao de Clase con Frontera de Clase
36
9
9
9
9
9
9
9
-
La marca de clase es el punto medio del intervalo de
clase y se obtiene sumando los lmites de clase
inferior y superior y dividiendo entre 2.
A la marca de clase tambin se le conoce como punto
medio de clase.
= +
1.2.7. Marca de Clase ( )
37
-
119 127
128 136
137 145
146 154
155 163
164 172
173 181
Marca de Clase
38
123
132
141
150
159
168
177
-
En el conjunto de los datos en bruto,
se determina el nmero mayor y el
nmero menor y se halla, as, el
rango (la diferencia entre los
nmeros mayor y menor).
1.2.8. REGLAS GENERALES PARA FORMAR UNADISTRIBUCIN DE FRECUENCIAS
39
-
Se divide el rango en una cantidad
adecuada de intervalos de clase de una
misma amplitud. Si esto no es posible,
se usan intervalos de clase de
diferentes amplitudes o intervalos de
clase abiertos.
1.2.8. REGLAS GENERALES PARA FORMAR UNADISTRIBUCIN DE FRECUENCIAS
40
-
Se determina la cantidad de
observaciones que caen dentro de
cada intervalo de clase; es decir, se
encuentran las frecuencias de clase.
La mejor manera de hacer esto es
utilizando una hoja de conteo
1.2.8. REGLAS GENERALES PARA FORMAR UNADISTRIBUCIN DE FRECUENCIAS
41
-
INTERVALOS CONTEO FRECUENCIAS
119 127
128 136
137 145
146 154
155 163
164 172
173 181
///
//// /
//// ////
//// //// /
////
///
//
3
6
10
11
5
3
2
TOTAL 40
42
-
43
-
Los histogramas y los polgonos de
frecuencias son dos
de las
distribuciones de frecuencias
1.2.9. HISTOGRAMAS Y POLGONOS DEFRECUENCIAS
44
-
Conjunto de rectngulos que tienen:
a) Sus bases sobre un eje horizontal (el eje X ),
con sus
de longitudes iguales a la amplitud
del intervalo de clase,
b) reas proporcionales a las frecuencias de
clase.
HISTOGRAMAS
45
-
Es una grfica de lnea que presenta las
frecuencias de clase graficadas contra las
marcas de clase. Se puede obtener
conectando los puntos medios de las partes
superiores de los rectngulos de un
histograma
POLGONO DE FRECUENCIA
46
-
Relativa
Acumulada
Ojivas relativas acumuladas
Ojivas de porcentajes
1.2.9. DISTRIBUCIONES DE FRECUENCIA
47
-
La frecuencia relativa de una clase es la frecuencia de
la clase dividida entre la suma de las frecuencias de
todas las clases y generalmente se expresa como
porcentaje
Las representaciones grficas de las distribuciones de
frecuencias relativas se obtienen a partir de los
histogramas o polgonos de frecuencias, cambiando
nicamente, en la escala vertical
FRECUENCIAS RELATIVAS
48
-
A la suma de todas las frecuencias menores que la
frontera superior de un intervalo de clase dado se le
llama frecuencia acumulada MENOS
A la suma de todas las frecuencias mayores que la
frontera inferior de un intervalo de clase dado se le
llama frecuencia acumulada MS
FRECUENCIAS ACUMULADAS
49
-
Una grfica que muestra las frecuencias
acumuladas menores de cada frontera superior de
clase respecto a cada frontera superior de clase o
viceversa se le conoce como grfica de
frecuencias acumuladas u ojiva.
Siempre al hablar de distribuciones acumuladas o
de ojivas, se tratar del tipo menos que.
OJIVAS
50
-
La frecuencia acumulada relativa o frecuencia
acumulada porcentual es la frecuencia acumulada
dividida entre la suma de todas las frecuencias
Si se emplean las frecuencias acumuladas relativas en
lugar de las frecuencias acumuladas, se obtiene una
distribucin de frecuencias acumuladas relativas y una
grfica de frecuencias acumuladas relativas
DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS
RELATIVAS Y OJIVAS PORCENTUALES
51
-
Cuando se tienen poblaciones grandes puede esperarse
que los polgonos de frecuencias, o los polgonos de
frecuencias relativas, correspondientes a estas
poblaciones estn formados por una gran cantidad de
pequeos segmentos de recta de manera que sus
formas se aproximen a las de unas curvas, a las cuales
se les llama curvas de frecuencias o curvas de
frecuencias relativas, respectivamente.
CURVAS DE FRECUENCIAS Y OJIVAS SUAVIZADAS
52
-
Es razonable esperar que estas curvas tericas puedan
ser aproximadas suavizando los polgonos de
frecuencias o los polgonos de frecuencias relativas de
la muestra; esta aproximacin mejorar a medida que
aumenta el tamao de la muestra. sta es la razn por
la que a las curvas de frecuencias se les suele llamar
polgonos de frecuencias suavizados.
CURVAS DE FRECUENCIAS Y OJIVAS SUAVIZADAS
53
-
Simtricas
Sesgadas a la izquierda
Sesgadas a la derecha
Distribuidas uniformemente
En forma de J
En forma de U
Bimodales
Multimodales
TIPOS DE CURVAS DE FRECUENCIAS
54
-
CAPTULO I: ESTADSTICA
55
-
El smbolo, (que se lee X subndice j) representa
cualquiera de los N valores 1, 2, 3,. . . , quepuede tomar la variable X. A la letra j que aparece en representando a cualquiera de los nmeros 1, 2, 3, . . . ,
N se le llama subndice o ndice. En lugar de j se puede
usar, por supuesto, cualquier otra letra, i, k, p, q o s.
1.3.1. Notacin de ndices
56
-
El smbolo =1 se emplea para denotar la suma de
todas las desde j = 1 hasta j = N; por definicin,
=1
=1 + 2 + 3 ++
Cuando no puede haber confusin, esta suma se
denota simplemente como , , El smbolo es la letra griega mayscula sigma y denota suma.
1.3.2. Notacin de Sumatoria
57
-
Un promedio es un valor tpico o representativo de un
conjunto de datos. Como estos valores tpicos tienden a
encontrarse en el centro de los conjuntos de datos,
ordenados de acuerdo con su magnitud, a los
promedios se les conoce tambin como medidas de
tendencia central.
1.3.3.Promedios o medidas de tendencia central
58
-
Se pueden definir varios tipos de promedios; los ms
usados son la media aritmtica, la mediana, la moda, la
media geomtrica y la media armnica. Cada una de
ellas tiene ventajas y desventajas de acuerdo con el tipo
de datos y el propsito de su uso.
1.3.3.Promedios o medidas de tendencia central
59
-
La media aritmtica, o brevemente la media, de un
conjunto de N nmeros 1, 2, 3, . . . , se denotaas: (que se lee X barra) y est definida como:
= + + ++
= =
=
1.3.4. Media
60
-
Si los nmeros 1, 2, 3,, se presentan 1, 2,3,, veces, respectivamente (es decir, se presentancon frecuencias 1, 2, 3, . . . , ), su media aritmticaes:
= + + ++
+++ . . . += =
=
=
=
1.3.4. Media
61
-
Algunas veces, a los nmeros 1, 2, 3,, se lesasignan ciertos factores de ponderacin (pesos) 1, 2,3,, que dependen del significado o importanciaque se les asigne a estos nmeros.
= + + ++
+++ . . . +=
1.3.4.1. Media Aritmtica Ponderada
62
-
Algunas veces, a los nmeros 1, 2, 3,, se lesasignan ciertos factores de ponderacin (pesos) 1, 2,3,, que dependen del significado o importanciaque se les asigne a estos nmeros.
= + + ++
+++ . . . +=
1.3.4.1. Media Aritmtica Ponderada
63
-
1. En un conjunto de nmeros, la suma algebraica de
las desviaciones de estos nmeros respecto a su
media aritmtica es cero.
1.3.4.2. Propiedades de la Media Aritmtica
64
-
2. En un conjunto de nmeros , la suma de los
cuadrados de sus desviaciones respecto a un
nmero es un mnimo si y slo si =
1.3.4.2. Propiedades de la Media Aritmtica
65
-
3. Si la media de nmeros es , la media de nmeros es , . . . , la media de nmeros es, entonces la media de todos estos nmeros es
= + + ++
+++ . . . +
Es decir, una media aritmtica ponderada de todas las
medias.
1.3.4.2. Propiedades de la Media Aritmtica
66
-
4. Si se cree o se supone que un nmero A (que puede
ser cualquier nmero) es la media aritmtica y si
= son las desviaciones de de A,
entonces:
= + =
= +
= + =
=
= +
1.3.4.2. Propiedades de la Media Aritmtica
67
-
Cuando se presentan los datos en una distribucin de
frecuencias, se considera que todos los datos que caen
en un intervalo de clase dado coinciden con la marca o
punto medio del intervalo. Para datos agrupados,
interpretando a las como las marcas de clase, a las
como las correspondientes frecuencias de clase, a A
como cualquier marca de clase supuesta y =
como la desviacin de respecto de A
1.3.4.3. Clculo de la Media Aritmtica para DatosAgrupados
68
-
Si todos los intervalos de clase son de una misma
amplitud c, las desviaciones = se pueden
expresar como , donde puede tener valores
enteros positivos o negativos o cero (es decir, 0, 1, 2,
3, . . .)
= + =
= +
1.3.4.3. Clculo de la Media Aritmtica para DatosAgrupados
69
-
Es equivalente a la ecuacin = + . A estaecuacin se le conoce como mtodo codificado para
calcular la media. Es un mtodo muy breve
recomendado para datos agrupados cuando los
intervalos de clase tienen todos la misma amplitud.
Obsrvese que en el mtodo codificado los valores de la
variable X se transforman en valores de la variable u de
acuerdo con X = A + cu.
1.3.4.3. Clculo de la Media Aritmtica para DatosAgrupados
70
-
La mediana de un conjunto de nmeros acomodados en
orden de magnitud (es decir, en una ordenacin) es el
valor central o la media de los dos valores centrales.
En datos agrupados, la mediana se obtiene por
interpolacin, como se expresa por la frmula
= +
1.3.5. Mediana
71
-
Geomtricamente, la mediana es el valor de X (abscisa)
que corresponde a una recta vertical que divide al
histograma en dos partes que tienen la misma rea. A
este valor de X se le suele denotar .
1.3.5. Mediana
72
-
La moda de un conjunto de nmeros es el valor que se
presenta con ms frecuencia; es decir, es el valor ms
frecuente. Puede no haber moda y cuando la hay, puede
no ser nica.
A una distribucin que slo tiene una moda se le llama
unimodal.
1.3.6. Moda
73
-
En el caso de datos agrupados, para los que se ha
construido una curva de frecuencia que se ajuste a los
datos, la moda es el valor (o los valores) de X que
corresponden al punto (o puntos) mximos de la curva.
A este valor de X se le suele denotar .
1.3.6. Moda
74
-
En una distribucin de frecuencia o en un histograma la
moda se puede obtener mediante la frmula siguiente:
= +
1.3.6. Moda
75
-
En las curvas de frecuencias unimodales que son
ligeramente sesgadas (asimtricas), se tiene la relacin
emprica siguiente:
= ( )
RELACIN EMPRICA MEDIA-MEDIANA-MODA
76
-
En las figuras se muestran las posiciones relativas de la
media, la mediana y la moda en curvas de frecuencias
sesgadas a la derecha o a la izquierda, respectivamente
RELACIN EMPRICA MEDIA-MEDIANA-MODA
77
-
La media geomtrica G de N nmeros positivos 1, 2,3,..., es la raz n-sima del producto de los nmeros:
= 123...
La Media Geomtrica (G)
78
-
La media armnica H de N nmeros positivos 1, 2,3,..., es el recproco de la media aritmtica de losrecprocos de los nmeros:
=
=
=
La Media Armnica (H)
79
-
La media geomtrica de un conjunto de nmeros
positivos 1, 2, 3,..., es menor o igual que sumedia aritmtica, pero mayor o igual que su media
armnica.
RELACIN ENTRE MEDIA ARITMTICA,GEOMTRICA Y ARMNICA
80
-
La raz cuadrada media (RCM) o media cuadrtica de un
conjunto de nmeros 1, 2, 3,..., se denota 2 yse define:
= = =
=
RAZ CUADRADA MEDIA
81
-
En un conjunto de datos ordenados de acuerdo con su
magnitud, el valor de en medio, que divide al conjunto
en dos partes iguales, es la mediana. Entonces aquellos
valores que dividen al conjunto de datos en cuatro
partes iguales son denotados Q1, Q2 y Q3 son el
primero, segundo y tercer cuartiles, respectivamente; el
valor Q2 coincide con la mediana.
1.3.7. Cuartiles, deciles y percentiles
82
-
De igual manera, los valores que dividen al conjunto en
diez partes iguales son los deciles y se denotan D1, D2,
. . . , D9, y los valores que dividen al conjunto en 100
partes iguales son los percentiles y se les denota P1,
P2, . . . , P99. El quinto decil y el percentil 50 coinciden
con la mediana. Los percentiles 25 y 75 coinciden con
el primero y tercer cuartiles, respectivamente.
1.3.7. Cuartiles, deciles y percentiles
83
-
A los cuartiles, deciles, percentiles y otros
valores obtenidos dividiendo al conjunto de
datos en partes iguales se les llama en
conjunto cuantiles.
1.3.7. Cuartiles, deciles y percentiles
84