anÁlisis estadÍstico con spss© dat company 5.5 pruebas de hipótesis pruebas de dos colas o...

ANÁLISIS ESTADÍSTICO CON SPSS

SESIÓN 5:

DISTRIBUCIONES Y PRUEBAS DE HIPÓTESIS

© Dat Company

Contenido

5.1 Variables aleatorias

5.2 Distribuciones de probabilidad discretas

5.3 Distribuciones de probabilidad continuas

5.4 Características de una variable aleatoria

5.5 Pruebas de hipótesis

2

© Dat Company

5.1 Variable Aleatoria

• Dado un experimento aleatorio 𝜀 y 𝛺 el espacio muestralasociado a 𝜀. Una función 𝑋 que asigna a cada elemento𝜔 en 𝛺 uno y solamente un número real 𝑥 = 𝑋(𝜔), sellama variable aleatoria. Es decir, 𝑋 es una función real,

𝑋 : 𝛺 → 𝐼𝑅

• El rango 𝑅𝑋 de la variable aleatoria 𝑋 está dado por elsiguiente conjunto de números reales.

𝑅𝑋 = 𝑥 ∈ 𝐼𝑅 = 𝑋 𝜔 = x,𝜔 ∈ 𝛺 = 𝑋(𝛺)

© Dat Company

5.1 Variable Aleatoria

• Sea 𝛺 un espacio muestral asociado a un experimentoaleatorio 𝜀 , y 𝑋 una variable aleatoria con rango 𝑅𝑋definida sobre 𝛺 . Un evento 𝐴 en 𝛺 y un evento 𝐸𝑥 en 𝑅𝑋se dice que son eventos equivalentes, Si,

𝐴 = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥

• Si 𝐴 es un evento en el espacio muestral 𝛺 y 𝐸𝑥 A unevento en el rango Rx de la variable aleatoria X, entonces

definimos la probabilidad como

𝑃 𝐸𝑥 = 𝑃 𝐴 , donde A = 𝜔 ∈ 𝛺 / 𝑋 𝜔 ∈ 𝐸𝑥

© Dat Company


• Si el rango de la variable aleatoria 𝑋, es un conjunto finitoo infinito numerable de posibles valores, se llama variable

aleatoria discreta. En este caso

𝑅𝑥 = 𝑥1, 𝑥2, 𝑥3, … .

• Sea 𝑋 una variable aleatoria discreta con rango 𝑅𝑥 . Unafunción definida por

𝑝 𝑥 = 𝑃 𝑋 = 𝑥 =

𝜔 ∈ 𝛺 / 𝑋 𝜔 =𝑥

𝑃[ 𝜔 ]

© Dat Company


• Donde la suma es sobre los sucesos 𝜔 𝜖 𝛺 tal que 𝑋 𝜔 =𝑥 y satisface las siguientes condiciones

𝑝 𝑥 > 0 , ∀ 𝑥 ∈ 𝑅𝑥 ;

𝑥 ∈ 𝑅𝑥

𝑝 𝑥 =

𝑥 ∈ 𝑅𝑥

𝑃 𝑋 = 𝑥 = 1

se llama función de probabilidad o ley de probabilidad de la

variable aleatoria 𝑋

• La función de probabilidad 𝑝 𝑥 debe estar está biendefinida para 𝑥 ∈ 𝑅𝑥 y se asume para los eventosimposibles 𝑝 𝑥 = 0

© Dat Company


• El dominio de la función 𝑝 puede considerarse como elconjunto de los números, reales y su rango el conjunto

< 0,1] ∪ 0 . Es decir, 𝑝: 𝐼𝑅 → 0,1

• La distribución de probabilidad se representa usualmente

en una tabla

x 𝑥1 𝑥2 𝑥3

𝑝 𝑥 = P[X = x] 𝑝(𝑥1) 𝑝(𝑥2) 𝑝(𝑥3) . . .

Tabla 3. Representación tabular de la distribución de probabilidad

© Dat Company


Función de distribución de variable aleatoria discreta

• Sea X una variable aleatoria discreta con rango

𝑅𝑥 = 𝑥1, 𝑥2, 𝑥3, … . y función de probabilidad,𝑝 𝑥𝑖 = 𝑃[𝑋 = 𝑥𝑖] , sea 𝑥 un número real cualquiera, lafunción de distribución de 𝑋 se denota por "𝐹(𝑥)“ y sedefine como

𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 =

𝑥𝑖≤𝑥

𝑝( 𝑥𝑖) =

𝑥𝑖≤𝑥

𝑃[𝑋 = 𝑥𝑖]

© Dat Company


Propiedades de la función de distribución

• Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ, pues 𝐹 𝑥 es unaprobabilidad para cualquier 𝑥 real y las probabilidadesestán limitadas por 0 y 1.

• Propiedad 2: 𝐹 𝑥 es una función no creciente. Sean𝑥1, 𝑥2 ∈ 𝐼𝑅 tales que 𝑥1 ≤ 𝑥2, entonces se tiene

𝑥 𝑋 ≤ 𝑥1 ⊂ 𝑥 𝑋 ≤ 𝑥2

Aplicando probabilidades a ambos eventos,

𝐹 𝑥1 = 𝑃 𝑋 ≤ 𝑥1 ≤ 𝑃[𝑋 ≤ 𝑥2]

Obtenemos 𝐹 𝑥1 = 𝐹 𝑥2

© Dat Company


• Propiedad 3:

(a) limx→∞

F(x) = P x / X < ∞ = P X < ∞ = 1, pues el evento

x / X < ∞ , es el conjunto de todos los números reales.

(b) limx→∞

F(x) = P x / X < −∞ = P X < −∞ = 0, pues el evento

x / X < −∞ , es el conjunto nulo.

• Propiedad 4: Sea 𝑥𝑘, 𝑥𝑘+1 ∈ 𝑅𝑥 , si x es tal que 𝑥𝑘 ≤ 𝑥 <𝑥𝑘+1, entonces 𝐹 𝑥 = 𝐹 𝑥𝑘 . Es decir, la función 𝐹 𝑥 esconstante e igual a 𝐹 𝑥𝑘 para todo x ∈ [𝑥𝑘 , 𝑥𝑘+1 > Estoimplica que si 𝑋 es una variable discreta, F(𝑥) es unafunción “escalonada"

© Dat Company


• Si el rango 𝑅𝑥, de una variable aleatoria 𝑋 es un intervalosobre la recta de los números reales, se llama Variable

Aleatoria Continua.

• Sea 𝑋 una variable aleatoria continua con rango 𝑅𝑥. Lafunción de densidad de probabilidad asociado a la

variable aleatoria, es una función 𝑓 𝑥 integrable quesatisface las siguientes condiciones:

1. 𝑓 𝑥 ≥ 0, para todo 𝑥 ∈ ℝ (𝑜 𝑓 𝑋 > 0 , 𝑥 ∈ 𝑅𝑥 )

2. 𝑅𝑥 𝑓 𝑥 𝑑𝑥 = 1 (𝑜 ∞−+∞

𝑓 𝑥 𝑑𝑥 = 1 )

© Dat Company


• La probabilidad de que la variable aleatoria tome los

valores entre a y b, donde el intervalo 𝑎, 𝑏 ⊂ 𝑅𝑥 . Esdecir, queremos calcular la P 𝑎 ≤ 𝑋 ≤ 𝑏

• Por tanto, la probabilidad del evento 𝐴 = {𝑋 / 𝑎 ≤ 𝑋 ≤ 𝑏}

se define P A = 𝑃 𝑎 ≤ 𝑋 ≤ 𝑏 = 𝑎

𝑏𝑓 𝑥 𝑑𝑥

• Sea 𝑋 una variable aleatoria continua con función dedensidad 𝑓 𝑥 . La función de distribución acumuladade la variable aleatoria 𝑋 , denotado por se define por“𝐹 𝑥 ”, se define por

𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = −∞

𝑥𝑓 𝑥 𝑑𝑥 , ∀ 𝑥 ∈ ℝ

© Dat Company


Propiedades de la función de distribución

Las tres primeras propiedades son los mismos que el caso

discreto.

• Propiedad 1: 0 ≤ 𝐹 𝑥 ≤ 1 , ∀ 𝑥 ∈ ℝ

• Propiedad 2: lim𝑥→∞

𝐹(𝑥) = lim𝑥→∞

∞

𝑥𝑓 𝑡 𝑑𝑡 = 1;

lim𝑥→−∞

𝐹(𝑥) = lim𝑥→−∞

∞

𝑥𝑓 𝑡 𝑑𝑡 = 0

• Propiedad 3: La función de distribución es no decreciente,

esto es si 𝑎 ≤ 𝑏, entonces 𝐹(𝑎) ≤ 𝐹(𝑏)

© Dat Company


• Propiedad 4: limℎ→0

𝐹(𝑥 + ℎ) = 𝐹 𝑥 , ∀ 𝑥 ∈ ℝ, con h > 0; o

sea 𝐹 es continua por la derecha, en todos los puntos.

• Propiedad 5: Del segundo teorema fundamental del

cálculo se tiene que si 𝐹(𝑥) es una función derivable,entonces

𝑓 𝑥 =𝑑

𝑑𝑥𝐹(𝑥)

© Dat Company


• La variable aleatoria está completamente determinado por

la distribución de probabilidad [𝑥𝑖 , 𝑝 𝑥𝑖 ; i = 1,2,3,… ] si esdiscreta, y por la función de densidad 𝑓 𝑥 si es continua

• Medidas descriptivas de una variable aleatoria

El primer momento alrededor del origen es el valor

esperado a la media de la variable aleatoria

(esperanza matemática); el segundo momento alrededor

de la media es la varianza de la variable aleatoria;

finalmente la moda y la mediana.

© Dat Company


• El valor esperado o esperanza matemática de 𝑋, sedenota por E(x) y se define

E(x)= σx ∈ 𝑅𝑥 𝑥 𝑝 𝑥 , 𝑆𝑖 𝑋 es una variable aleatoria

discreta

E(x)= 𝑅𝑥𝑥 𝑓 𝑥 𝑑𝑥 =

−∞

∞𝑥 𝑓 𝑥 𝑑 𝑥 , 𝑆𝑖 𝑋 es una

variable aleatoria continua.

• Siempre que σx ∈ 𝑅𝑥 𝑥 𝑝 𝑥 sea absolutamente

convergente, es decir σx ∈ 𝑅𝑥 |𝑥| 𝑝 𝑥 finita y

−∞

∞|𝑥| 𝑓 𝑥 𝑑 𝑥 finita respectivamente.

© Dat Company


• La esperanza matemática de 𝑋 , se llama también, mediade la variable aleatoria, y se denota por 𝜇, o sea 𝜇 = E(X)

Propiedades de la esperanza matemática

• Teorema 5.4.1: Si 𝑋 es una variable aleatoria, 𝑎 𝑦 𝑏constantes. Entonces

(i) 𝐸 𝑎 = 𝑎,

(ii) 𝐸 𝑎 𝐻 𝑋 = 𝑎 𝐸 𝑎 𝐻 𝑋

(iii) 𝐸 𝑎 𝐻 𝑋 + 𝑏 𝐺(𝑋) = 𝑎 𝐸 𝑎 𝐻 𝑥 + 𝑏 𝐸[𝐺(𝑋)]

© Dat Company


• Teorema 5.4.2: Caso especial del (iii)

𝐸 𝑎 𝑋 ± 𝑏 = 𝑎 𝐸 𝑋 ± 𝑏

Si 𝑏=0, entonces 𝐸 𝑎𝑋 = 𝑎 𝐸 𝑥

• Teorema 5.4.3: Sean 𝑋1, 𝑋2, … , 𝑋𝑛, n variables aleatorias y𝑎1 𝑖 = 0,1, … , 𝑛 constantes, entonces

𝐸 𝑎0 +

𝑖=1

𝑛

𝑎𝑖𝑋𝑖 = 𝑎0 +

𝑖=1

𝑛

𝑎𝑖𝐸(𝑋𝑖)

• Consecuencia del Teorema 5.4.3: Si 𝑋 e 𝑌 son variables aleatorias y𝑎, 𝑏 constantes, entonces

𝐸 𝑎 𝑋 + 𝑏𝑌 = 𝑎 𝐸 𝑋 + 𝑏 𝐸(𝑌)

© Dat Company


• La varianza de una variable aleatoria X, se denota por

Var(𝑋) o por 𝜎𝑋2(o simplemente 𝜎2 ) y se define como

Var 𝑋 = 𝜎2 = E X − 𝜇 2

Por lo tanto

𝜎2 = E X − 𝜇 2 = σ𝑥 ∈ 𝑅𝑥(𝑥 − 𝜇)2 𝑝 𝑥 , 𝑠𝑖 𝑋 es discreta

= −∞

∞(𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥, 𝑠𝑖 𝑋 es continua

• Otra media de dispersión llamada desviación típica de la

variable aleatoria, se define

𝝈 = + 𝜎2

© Dat Company


Propiedades de la varianza y desviación típica

• Teorema 5.4.4: Si 𝑋 es una variable aleatoria con media𝜇, la varianza de 𝑋 está dado por

𝑉𝑎𝑟 𝑋 = 𝜎2 = 𝐸 𝑋2 − 𝐸 𝑋 2 = 𝐸 𝑋2 − 𝜇2

• Teorema 5.4.5: Si 𝑋 es una variable aleatoria, a y bconstantes, entonces

𝑉𝑎𝑟 𝑎𝑋 ± 𝑏 = 𝑎2 𝑉𝑎𝑟(𝑋)

• Consecuencia del Teorema 5.4.5

1. Si 𝑎 = 0 , 𝑉𝑎𝑟 𝑏 = 0

2. Si 𝑏 = 0 , 𝑉𝑎𝑟 𝑎𝑋 = 𝑎2 𝑉𝑎𝑟(𝑋)

© Dat Company


• Teorema 5.4.6: Si 𝑋 es una variable aleatoria y 𝑐 unaconstante, entonces

1. 𝜎𝑐𝑋 = 𝑐 𝜎𝑋

2. 𝜎𝑋+𝑐 = 𝜎𝑋

© Dat Company

5.5 Pruebas de Hipótesis

• Una hipótesis estadística es una aseveración que se

hace a cerca de la distribución de una o más variables

aleatorias (o poblaciones).

• Se puede especificar una hipótesis, dando el tipo de

distribución y el valor o valores del parámetro o los

parámetros que la definen. Por ejemplo:

(a) 𝑋, tiene una distribución binomial con 𝑝 =1

3

(b) 𝑋, tiene una distribución normal con 𝜇 = 50, 𝜎 = 5

© Dat Company


• La prueba estadística de una hipótesis, toma los valores

experimentales que son observados y conducen a una

decisión; no rechazar (aceptar) o rechazar la hipótesis

bajo consideración.

• La hipótesis estadisticas se pueden especificar en

hipótesis nula 𝐻0 (es la hipótesis que se quiere probar) yhipótesis alternativa 𝐻1 (es una suposición contraria a laque se quiere probar), que se acepta en caso de que la

primera sea rechazada.

© Dat Company


• En una terminología de prueba, hablamos de probar la

hipótesis nula contra una alternativa en el supuesto

tentativo que la hipótesis nula es cierta.

• Hay tres tipos principales de pruebas, cada uno de los

cuales es identificado por la forma en que se formulan 𝐻0 y𝐻1.

Prueba de una cola o unilateral:

(a) Prueba de cola inferior o prueba del lado izquierdo:

𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 < 𝜃0

© Dat Company


Este tipo de prueba se emplea cuando se tiene alguna

evidencia que el parámetro no es igual a 𝜃0 ,si no quedebe ser menor.

(b) Prueba de la cola superior o prueba de la cola derecha:

𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 > 𝜃0

Este tipo de prueba se emplea, en problemas, en que se

tiene algún indicio que el parámetro no es igual al valor

postulado, debe ser mayor que el postulado.

© Dat Company


Pruebas de dos colas o bilaterales

𝐻0: 𝜃 = 𝜃0 ; 𝐻1: 𝜃 ≠ 𝜃0

• Este tipo de prueba se emplea, en el caso que el valor que

se prueba no sea verdadera; entonces, todos los demás

valores son posibles.

Teorema del Limite Central

• Una estadística para la media de la población, es la media

muestral ത𝑋 Si la población es normal (o si la muestra esgrande 𝑛 ≥ 30, aún cuando la población no es normal),

© Dat Company


• La distribución de ത𝑋 es 𝑁 𝜇,𝜎2

𝑛y variable aleatoria

𝑍 =ത𝑋−𝜇0

𝜎/ 𝑛, tiene una distribución 𝑁(0,1).

• Entonces, dada una muestra suficientemente grande de

la población, la distribución de las medias muestrales

seguirán una distribución normal.

lim𝑛→∞

Pr(ത𝑋 − 𝜇0

𝜎/ 𝑛≤ 𝑧) =

1

2𝜋න−∞

𝑥

𝑒−12𝑡2𝑑𝑡

© Dat Company


• A continuación se muestran algunas distribuciones para

probar hipótesis, suponiendo la normalidad de los errores

del MRSL. Como 𝜎2 no suele conocerse en los estudiosempíricos, casi siempre se usan las distribuciones 𝑡 y 𝐹.

1 restricción 1 o más restricciones

𝜎2 conocida 𝑁 𝜒2

𝜎2 desconocida 𝑡 de Student 𝐹 de Snedecor

© Dat Company


• Según el supuesto de normalidad, la variable que se

distribuye como una 𝑡 de Student con 𝑛 − 2 gl, se leconsidera como estadístico de prueba 𝒕 (o 𝑡 calculado)

𝑡 =መ𝛽2 − 𝛽2

𝑒𝑒 መ𝛽2

Prueba de hipótesis de 2: prueba 𝜒2

• Las conjeturas para una prueba bilateral son:

𝐻0: 𝜎2 = 𝜎0

2

𝐻1: 𝜎2 ≠ 𝜎0

2

© Dat Company


• El estadístico de prueba es:

𝜒2 = 𝑛 − 2ො𝜎2

𝜎2

se distribuye con 𝑛 − 2 gl. Con un nivel de significanciadado, 𝛼, se obtendrá el 𝜒2 de tabla.

© Dat Company


Método del valor p

• El valor 𝑝 es el nivel de significancia más bajo al cualpuede rechazarse una hipótesis nula.

• Consiste en encontrar la “probabilidad real” (nivel exacto

de significancia) en la tabla de valores pertinente,

utilizando el estadístico de prueba, 𝑡 𝑜 𝜒𝟐

• Si el valor 𝑝 es menor al nivel de significancia supuesto,𝛼, se puede rechazar la hipótesis nula.

© Dat Company

Referencias

• Moya, R. & Saravia, G. (1988). Probabilidad e inferencia

estadística (2da ed.). Lima: San Marcos.

32

anÁlisis estadÍstico con spss© dat company 5.5 pruebas de hipótesis pruebas de dos colas o...

Documents