anÁlisis estadÍstico con spss© dat company 5.5 pruebas de hipótesis pruebas de dos colas o...
TRANSCRIPT
-
ANÁLISIS ESTADÍSTICO CON SPSS
SESIÓN 5:
DISTRIBUCIONES Y PRUEBAS DE HIPÓTESIS
-
© Dat Company
Contenido
5.1 Variables aleatorias
5.2 Distribuciones de probabilidad discretas
5.3 Distribuciones de probabilidad continuas
5.4 Características de una variable aleatoria
5.5 Pruebas de hipótesis
2
-
© Dat Company
5.1 Variable Aleatoria
• Dado un experimento aleatorio 𝜀 y 𝛺 el espacio muestralasociado a 𝜀. Una función 𝑋 que asigna a cada elemento𝜔 en 𝛺 uno y solamente un número real 𝑥 = 𝑋(𝜔), sellama variable aleatoria. Es decir, 𝑋 es una función real,
𝑋 : 𝛺 → 𝐼𝑅
• El rango 𝑅𝑋 de la variable aleatoria 𝑋 está dado por elsiguiente conjunto de números reales.
𝑅𝑋 = 𝑥 ∈ 𝐼𝑅 = 𝑋 𝜔 = x,𝜔 ∈ 𝛺 = 𝑋(𝛺)
-
© Dat Company
5.1 Variable Aleatoria
• Sea 𝛺 un espacio muestral asociado a un experimentoaleatorio 𝜀 , y 𝑋 una variable aleatoria con rango 𝑅𝑋definida sobre 𝛺 . Un evento 𝐴 en 𝛺 y un evento 𝐸𝑥 en 𝑅𝑋se dice que son eventos equivalentes, Si,
𝐴 = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥
• Si 𝐴 es un evento en el espacio muestral 𝛺 y 𝐸𝑥 A unevento en el rango Rx de la variable aleatoria X, entonces
definimos la probabilidad como
𝑃 𝐸𝑥 = 𝑃 𝐴 , donde A = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥
-
© Dat Company
5.2 Distribuciones de probabilidad discretas
• Si el rango de la variable aleatoria 𝑋, es un conjunto finitoo infinito numerable de posibles valores, se llama variable
aleatoria discreta. En este caso
𝑅𝑥 = 𝑥1, 𝑥2, 𝑥3, … .
• Sea 𝑋 una variable aleatoria discreta con rango 𝑅𝑥 . Unafunción definida por
𝑝 𝑥 = 𝑃 𝑋 = 𝑥 =
𝜔 ∈ 𝛺 / 𝑋 𝜔 =𝑥
𝑃[ 𝜔 ]
-
© Dat Company
5.2 Distribuciones de probabilidad discretas
• Donde la suma es sobre los sucesos 𝜔 𝜖 𝛺 tal que 𝑋 𝜔 =𝑥 y satisface las siguientes condiciones
𝑝 𝑥 > 0 , ∀ 𝑥 ∈ 𝑅𝑥 ;
𝑥 ∈ 𝑅𝑥
𝑝 𝑥 =
𝑥 ∈ 𝑅𝑥
𝑃 𝑋 = 𝑥 = 1
se llama función de probabilidad o ley de probabilidad de la
variable aleatoria 𝑋
• La función de probabilidad 𝑝 𝑥 debe estar está biendefinida para 𝑥 ∈ 𝑅𝑥 y se asume para los eventosimposibles 𝑝 𝑥 = 0
-
© Dat Company
5.2 Distribuciones de probabilidad discretas
• El dominio de la función 𝑝 puede considerarse como elconjunto de los números, reales y su rango el conjunto
< 0,1] ∪ 0 . Es decir, 𝑝: 𝐼𝑅 → 0,1
• La distribución de probabilidad se representa usualmente
en una tabla
x 𝑥1 𝑥2 𝑥3
𝑝 𝑥 = P[X = x] 𝑝(𝑥1) 𝑝(𝑥2) 𝑝(𝑥3) . . .
Tabla 3. Representación tabular de la distribución de probabilidad
-
© Dat Company
5.2 Distribuciones de probabilidad discretas
Función de distribución de variable aleatoria discreta
• Sea X una variable aleatoria discreta con rango
𝑅𝑥 = 𝑥1, 𝑥2, 𝑥3, … . y función de probabilidad,𝑝 𝑥𝑖 = 𝑃[𝑋 = 𝑥𝑖] , sea 𝑥 un número real cualquiera, lafunción de distribución de 𝑋 se denota por "𝐹(𝑥)“ y sedefine como
𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 =
𝑥𝑖≤𝑥
𝑝( 𝑥𝑖) =
𝑥𝑖≤𝑥
𝑃[𝑋 = 𝑥𝑖]
-
© Dat Company
5.2 Distribuciones de probabilidad discretas
Propiedades de la función de distribución
• Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ, pues 𝐹 𝑥 es unaprobabilidad para cualquier 𝑥 real y las probabilidadesestán limitadas por 0 y 1.
• Propiedad 2: 𝐹 𝑥 es una función no creciente. Sean𝑥1, 𝑥2 ∈ 𝐼𝑅 tales que 𝑥1 ≤ 𝑥2, entonces se tiene
𝑥 𝑋 ≤ 𝑥1 ⊂ 𝑥 𝑋 ≤ 𝑥2
Aplicando probabilidades a ambos eventos,
𝐹 𝑥1 = 𝑃 𝑋 ≤ 𝑥1 ≤ 𝑃[𝑋 ≤ 𝑥2]
Obtenemos 𝐹 𝑥1 = 𝐹 𝑥2
-
© Dat Company
5.2 Distribuciones de probabilidad discretas
• Propiedad 3:
(a) limx→∞
F(x) = P x / X < ∞ = P X < ∞ = 1, pues el evento
x / X < ∞ , es el conjunto de todos los números reales.
(b) limx→∞
F(x) = P x / X < −∞ = P X < −∞ = 0, pues el evento
x / X < −∞ , es el conjunto nulo.
• Propiedad 4: Sea 𝑥𝑘, 𝑥𝑘+1 ∈ 𝑅𝑥 , si x es tal que 𝑥𝑘 ≤ 𝑥 <𝑥𝑘+1, entonces 𝐹 𝑥 = 𝐹 𝑥𝑘 . Es decir, la función 𝐹 𝑥 esconstante e igual a 𝐹 𝑥𝑘 para todo x ∈ [𝑥𝑘 , 𝑥𝑘+1 > Estoimplica que si 𝑋 es una variable discreta, F(𝑥) es unafunción “escalonada"
-
© Dat Company
5.3 Distribuciones de probabilidad continuas
• Si el rango 𝑅𝑥, de una variable aleatoria 𝑋 es un intervalosobre la recta de los números reales, se llama Variable
Aleatoria Continua.
• Sea 𝑋 una variable aleatoria continua con rango 𝑅𝑥. Lafunción de densidad de probabilidad asociado a la
variable aleatoria, es una función 𝑓 𝑥 integrable quesatisface las siguientes condiciones:
1. 𝑓 𝑥 ≥ 0, para todo 𝑥 ∈ ℝ (𝑜 𝑓 𝑋 > 0 , 𝑥 ∈ 𝑅𝑥 )
2. 𝑅𝑥 𝑓 𝑥 𝑑𝑥 = 1 (𝑜 ∞−+∞
𝑓 𝑥 𝑑𝑥 = 1 )
-
© Dat Company
5.3 Distribuciones de probabilidad continuas
• La probabilidad de que la variable aleatoria tome los
valores entre a y b, donde el intervalo 𝑎, 𝑏 ⊂ 𝑅𝑥 . Esdecir, queremos calcular la P 𝑎 ≤ 𝑋 ≤ 𝑏
• Por tanto, la probabilidad del evento 𝐴 = {𝑋 / 𝑎 ≤ 𝑋 ≤ 𝑏}
se define P A = 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = 𝑎
𝑏𝑓 𝑥 𝑑𝑥
• Sea 𝑋 una variable aleatoria continua con función dedensidad 𝑓 𝑥 . La función de distribución acumuladade la variable aleatoria 𝑋 , denotado por se define por“𝐹 𝑥 ”, se define por
𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = −∞
𝑥𝑓 𝑥 𝑑𝑥 , ∀ 𝑥 ∈ ℝ
-
© Dat Company
5.3 Distribuciones de probabilidad continuas
Propiedades de la función de distribución
Las tres primeras propiedades son los mismos que el caso
discreto.
• Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ
• Propiedad 2: lim𝑥→∞
𝐹(𝑥) = lim𝑥→∞
∞
𝑥𝑓 𝑡 𝑑𝑡 = 1;
lim𝑥→−∞
𝐹(𝑥) = lim𝑥→−∞
∞
𝑥𝑓 𝑡 𝑑𝑡 = 0
• Propiedad 3: La función de distribución es no decreciente,
esto es si 𝑎 ≤ 𝑏, entonces 𝐹(𝑎) ≤ 𝐹(𝑏)
-
© Dat Company
5.3 Distribuciones de probabilidad continuas
• Propiedad 4: limℎ→0
𝐹(𝑥 + ℎ) = 𝐹 𝑥 , ∀ 𝑥 ∈ ℝ, con h > 0; o
sea 𝐹 es continua por la derecha, en todos los puntos.
• Propiedad 5: Del segundo teorema fundamental del
cálculo se tiene que si 𝐹(𝑥) es una función derivable,entonces
𝑓 𝑥 =𝑑
𝑑𝑥𝐹(𝑥)
-
© Dat Company
5.4 Características de una variable aleatoria
• La variable aleatoria está completamente determinado por
la distribución de probabilidad [𝑥𝑖 , 𝑝 𝑥𝑖 ; i = 1,2,3,… ] si esdiscreta, y por la función de densidad 𝑓 𝑥 si es continua
• Medidas descriptivas de una variable aleatoria
El primer momento alrededor del origen es el valor
esperado a la media de la variable aleatoria
(esperanza matemática); el segundo momento alrededor
de la media es la varianza de la variable aleatoria;
finalmente la moda y la mediana.
-
© Dat Company
5.4 Características de una variable aleatoria
• El valor esperado o esperanza matemática de 𝑋, sedenota por E(x) y se define
E(x)= σx ∈ 𝑅𝑥 𝑥 𝑝 𝑥 , 𝑆𝑖 𝑋 es una variable aleatoria
discreta
E(x)= 𝑅𝑥𝑥 𝑓 𝑥 𝑑𝑥 =
−∞
∞𝑥 𝑓 𝑥 𝑑 𝑥 , 𝑆𝑖 𝑋 es una
variable aleatoria continua.
• Siempre que σx ∈ 𝑅𝑥 𝑥 𝑝 𝑥 sea absolutamente
convergente, es decir σx ∈ 𝑅𝑥 |𝑥| 𝑝 𝑥 finita y
−∞
∞|𝑥| 𝑓 𝑥 𝑑 𝑥 finita respectivamente.
-
© Dat Company
5.4 Características de una variable aleatoria
• La esperanza matemática de 𝑋 , se llama también, mediade la variable aleatoria, y se denota por 𝜇, o sea 𝜇 = E(X)
Propiedades de la esperanza matemática
• Teorema 5.4.1: Si 𝑋 es una variable aleatoria, 𝑎 𝑦 𝑏constantes. Entonces
(i) 𝐸 𝑎 = 𝑎,
(ii) 𝐸 𝑎 𝐻 𝑋 = 𝑎 𝐸 𝑎 𝐻 𝑋
(iii) 𝐸 𝑎 𝐻 𝑋 + 𝑏 𝐺(𝑋) = 𝑎 𝐸 𝑎 𝐻 𝑥 + 𝑏 𝐸[𝐺(𝑋)]
-
© Dat Company
5.4 Características de una variable aleatoria
• Teorema 5.4.2: Caso especial del (iii)
𝐸 𝑎 𝑋 ± 𝑏 = 𝑎 𝐸 𝑋 ± 𝑏
Si 𝑏=0, entonces 𝐸 𝑎𝑋 = 𝑎 𝐸 𝑥
• Teorema 5.4.3: Sean 𝑋1, 𝑋2, … , 𝑋𝑛, n variables aleatorias y𝑎1 𝑖 = 0,1, … , 𝑛 constantes, entonces
𝐸 𝑎0 +
𝑖=1
𝑛
𝑎𝑖𝑋𝑖 = 𝑎0 +
𝑖=1
𝑛
𝑎𝑖𝐸(𝑋𝑖)
• Consecuencia del Teorema 5.4.3: Si 𝑋 e 𝑌 son variables aleatorias y𝑎, 𝑏 constantes, entonces
𝐸 𝑎 𝑋 + 𝑏𝑌 = 𝑎 𝐸 𝑋 + 𝑏 𝐸(𝑌)
-
© Dat Company
5.4 Características de una variable aleatoria
• La varianza de una variable aleatoria X, se denota por
Var(𝑋) o por 𝜎𝑋2(o simplemente 𝜎2 ) y se define como
Var 𝑋 = 𝜎2 = E X − 𝜇 2
Por lo tanto
𝜎2 = E X − 𝜇 2 = σ𝑥 ∈ 𝑅𝑥(𝑥 − 𝜇)2 𝑝 𝑥 , 𝑠𝑖 𝑋 es discreta
= −∞
∞(𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥, 𝑠𝑖 𝑋 es continua
• Otra media de dispersión llamada desviación típica de la
variable aleatoria, se define
𝝈 = + 𝜎2
-
© Dat Company
5.4 Características de una variable aleatoria
Propiedades de la varianza y desviación típica
• Teorema 5.4.4: Si 𝑋 es una variable aleatoria con media𝜇, la varianza de 𝑋 está dado por
𝑉𝑎𝑟 𝑋 = 𝜎2 = 𝐸 𝑋2 − 𝐸 𝑋 2 = 𝐸 𝑋2 − 𝜇2
• Teorema 5.4.5: Si 𝑋 es una variable aleatoria, a y bconstantes, entonces
𝑉𝑎𝑟 𝑎𝑋 ± 𝑏 = 𝑎2 𝑉𝑎𝑟(𝑋)
• Consecuencia del Teorema 5.4.5
1. Si 𝑎 = 0 , 𝑉𝑎𝑟 𝑏 = 0
2. Si 𝑏 = 0 , 𝑉𝑎𝑟 𝑎𝑋 = 𝑎2 𝑉𝑎𝑟(𝑋)
-
© Dat Company
5.4 Características de una variable aleatoria
• Teorema 5.4.6: Si 𝑋 es una variable aleatoria y 𝑐 unaconstante, entonces
1. 𝜎𝑐𝑋 = 𝑐 𝜎𝑋
2. 𝜎𝑋+𝑐 = 𝜎𝑋
-
© Dat Company
5.5 Pruebas de Hipótesis
• Una hipótesis estadística es una aseveración que se
hace a cerca de la distribución de una o más variables
aleatorias (o poblaciones).
• Se puede especificar una hipótesis, dando el tipo de
distribución y el valor o valores del parámetro o los
parámetros que la definen. Por ejemplo:
(a) 𝑋, tiene una distribución binomial con 𝑝 =1
3
(b) 𝑋, tiene una distribución normal con 𝜇 = 50, 𝜎 = 5
-
© Dat Company
5.5 Pruebas de Hipótesis
• La prueba estadística de una hipótesis, toma los valores
experimentales que son observados y conducen a una
decisión; no rechazar (aceptar) o rechazar la hipótesis
bajo consideración.
• La hipótesis estadisticas se pueden especificar en
hipótesis nula 𝐻0 (es la hipótesis que se quiere probar) yhipótesis alternativa 𝐻1 (es una suposición contraria a laque se quiere probar), que se acepta en caso de que la
primera sea rechazada.
-
© Dat Company
5.5 Pruebas de Hipótesis
• En una terminología de prueba, hablamos de probar la
hipótesis nula contra una alternativa en el supuesto
tentativo que la hipótesis nula es cierta.
• Hay tres tipos principales de pruebas, cada uno de los
cuales es identificado por la forma en que se formulan 𝐻0 y𝐻1.
Prueba de una cola o unilateral:
(a) Prueba de cola inferior o prueba del lado izquierdo:
𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 < 𝜃0
-
© Dat Company
5.5 Pruebas de Hipótesis
Este tipo de prueba se emplea cuando se tiene alguna
evidencia que el parámetro no es igual a 𝜃0 ,si no quedebe ser menor.
(b) Prueba de la cola superior o prueba de la cola derecha:
𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 > 𝜃0
Este tipo de prueba se emplea, en problemas, en que se
tiene algún indicio que el parámetro no es igual al valor
postulado, debe ser mayor que el postulado.
-
© Dat Company
5.5 Pruebas de Hipótesis
Pruebas de dos colas o bilaterales
𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 ≠ 𝜃0
• Este tipo de prueba se emplea, en el caso que el valor que
se prueba no sea verdadera; entonces, todos los demás
valores son posibles.
Teorema del Limite Central
• Una estadística para la media de la población, es la media
muestral ത𝑋 Si la población es normal (o si la muestra esgrande 𝑛 ≥ 30, aún cuando la población no es normal),
-
© Dat Company
5.5 Pruebas de Hipótesis
• La distribución de ത𝑋 es 𝑁 𝜇,𝜎2
𝑛y variable aleatoria
𝑍 =ത𝑋−𝜇0
𝜎/ 𝑛, tiene una distribución 𝑁(0,1).
• Entonces, dada una muestra suficientemente grande de
la población, la distribución de las medias muestrales
seguirán una distribución normal.
lim𝑛→∞
Pr(ത𝑋 − 𝜇0
𝜎/ 𝑛≤ 𝑧) =
1
2𝜋න−∞
𝑥
𝑒−12𝑡2𝑑𝑡
-
© Dat Company
5.5 Pruebas de Hipótesis
• A continuación se muestran algunas distribuciones para
probar hipótesis, suponiendo la normalidad de los errores
del MRSL. Como 𝜎2 no suele conocerse en los estudiosempíricos, casi siempre se usan las distribuciones 𝑡 y 𝐹.
1 restricción 1 o más restricciones
𝜎2 conocida 𝑁 𝜒2
𝜎2 desconocida 𝑡 de Student 𝐹 de Snedecor
-
© Dat Company
5.5 Pruebas de Hipótesis
• Según el supuesto de normalidad, la variable que se
distribuye como una 𝑡 de Student con 𝑛 − 2 gl, se leconsidera como estadístico de prueba 𝒕 (o 𝑡 calculado)
𝑡 =መ𝛽2 − 𝛽2
𝑒𝑒 መ𝛽2
Prueba de hipótesis de 2: prueba 𝜒2
• Las conjeturas para una prueba bilateral son:
𝐻0: 𝜎2 = 𝜎0
2
𝐻1: 𝜎2 ≠ 𝜎0
2
-
© Dat Company
5.5 Pruebas de Hipótesis
• El estadístico de prueba es:
𝜒2 = 𝑛 − 2ො𝜎2
𝜎2
se distribuye con 𝑛 − 2 gl. Con un nivel de significanciadado, 𝛼, se obtendrá el 𝜒2 de tabla.
-
© Dat Company
5.5 Pruebas de Hipótesis
Método del valor p
• El valor 𝑝 es el nivel de significancia más bajo al cualpuede rechazarse una hipótesis nula.
• Consiste en encontrar la “probabilidad real” (nivel exacto
de significancia) en la tabla de valores pertinente,
utilizando el estadístico de prueba, 𝑡 𝑜 𝜒𝟐
• Si el valor 𝑝 es menor al nivel de significancia supuesto,𝛼, se puede rechazar la hipótesis nula.
-
© Dat Company
Referencias
• Moya, R. & Saravia, G. (1988). Probabilidad e inferencia
estadística (2da ed.). Lima: San Marcos.
32