두 모집단 비율 차이 개념wolfpack.hnu.ac.kr/2015_spring/is/is... · 2015-05-31 ·...

3
Introductory Statistics Spring 2015 일변량 추론(모비율 차이) 두 모집단 비율 차이 개념 모집단의 관심 모수(θ) 하나이고 모집단 비율의 차이 모집단 개체의 확률밀도함수는 베르누이( ) 그러므로 각 표본 데이터 예제 데이터 여성 CEO는 남성 CEO에 비해 은행으로부터 차별을 받고 있다고 판단하여 다음 조사를 시 행하였다. 1,165명 CEO (남성 1,050명) 대상으로 대출 거절율과 은행 이자율을 조사하였다. (1) 은행 대출 승인률 측면에서 남여 고객을 차별한다고 할 수 있나? 유의수준 5% 그리고 승 인률 차이에 대한 95% 신뢰구간을 구하시오. 1. 연구문제 및 통계적 문제 정의 남자 CEO와 여자 CEO 은행 대출 승인률 차이 모집단 비율 추론 - 가설검정 (유의수준) 2. 데이터 검증 비율 - 대표본 체크 , θ = p 1 p 2 p i x i ~ B( p i ), i = 1, 2 min(np 1 , nq 1 ) > 5 min(np 2 , nq 2 ) > 5 한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr / Page 13 모집단1 x~f(x;p 1 ) 표본 ( x 1 , x 2 ,..., x n ) x i ~ f ( x;θ ) 모집단2 y~f(y;p 2 ) 표본2 ( y 1 , y 2 ,..., y m ) y i ~ f ( y;θ 2 )

Upload: others

Post on 22-Apr-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 두 모집단 비율 차이 개념wolfpack.hnu.ac.kr/2015_Spring/IS/IS... · 2015-05-31 · Introductory Statistics Spring 2015 일변량 추론(모비율 차이) (CNN/USA) 1995년에는

Introductory Statistics Spring 2015 일변량 추론(모비율 차이)

두 모집단 비율 차이 개념

•모집단의 관심 모수(θ) 하나이고 모집단 비율의 차이

•모집단 개체의 확률밀도함수는 베르누이( )

•그러므로 각 표본 데이터

예제 데이터

여성 CEO는 남성 CEO에 비해 은행으로부터 차별을 받고 있다고 판단하여 다음 조사를 시행하였다. 1,165명 CEO (남성 1,050명) 대상으로 대출 거절율과 은행 이자율을 조사하였다.

(1) 은행 대출 승인률 측면에서 남여 고객을 차별한다고 할 수 있나? 유의수준 5% 그리고 승인률 차이에 대한 95% 신뢰구간을 구하시오.

1. 연구문제 및 통계적 문제 정의

남자 CEO와 여자 CEO 은행 대출 승인률 차이

모집단 비율 추론 - 가설검정 (유의수준)

2. 데이터 검증

비율 - 대표본 체크 ,

θ = p1 − p2pi

xi ~ B(pi ),i = 1,2

min(np1,nq1) > 5 min(np2,nq2 ) > 5

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page1 3

모집단1

x~f(x;p1)

표본 (x1, x2,..., xn )

xi ~ f (x;θ )

모집단2

y~f(y;p2)

표본2

(y1, y2,..., ym )

yi ~ f (y;θ2 )

Page 2: 두 모집단 비율 차이 개념wolfpack.hnu.ac.kr/2015_Spring/IS/IS... · 2015-05-31 · Introductory Statistics Spring 2015 일변량 추론(모비율 차이) (CNN/USA) 1995년에는

Introductory Statistics Spring 2015 일변량 추론(모비율 차이)

3. 가설검정 및 신뢰구간 계산

(1) 귀무가설 : : 남녀 승인율은 동일하다.

(2) 대립가설 : - 남자 승인율이 여자보다 높다

(단측가설)

(3) 모수 p에 대한 MVUE : ,

,

,

(4) 검정통계량 및 샘플링분포 :

(5) 유의확률 : =1-NORM.S.DIST(0.981,1)

(6) 95% 신뢰구간 :

(7) 두 모비율 차이 95% 신뢰구간 (-0.034, 0.091) -NORM.S.INV(0.975) 신뢰구간이 0을 가지고 있으므로 차이가 없음의 가설검정과 동일함

4. 결론 및 활용

유의확률이 0.163으로 유의수준 5% 크므로 귀무가설을 기각하지 못함 -> 승인율의 남녀 차이는 없다고 할 수 있음 - 성별 차별 없음

승인률 차이의 95% 신뢰구간 = (-0.03, 0.09)

H0 : p1 = p2θ = p1 − p2

H0 : p1 > p2

p̂1 ~ B(n, p1) p̂2 ~ B(n, p2 )

p̂1 =#of (s)inM

n= 9521050

= 0.906

p̂2 =#of (s)inF

m= 101115

= .878

p̂ = #of (s)inM + #of (s)inFn +m

= 10531165

= 0.904

TS = ( p̂1 − p̂2 )− (p1 − p2 )

p̂q̂(1n+ 1m)

= (0.906 − 0.878)

0.904(1− 0.904)( 11050

+ 1115

)= 0.981~ z

P(z > 0.981) = 0.1632

( p̂1 − p̂2 )± z(α / 2)p̂1q̂1n

+ p̂2q̂2m

= (.906 − .878)±1.96 .906(1− .906) /1050 + .878(1− .878) /115

성별 표본크기 표본비율 검정통계량 유의확률

남자 1,050 0.906 0.981 0.163

여자 115 0.878

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page2 3

Page 3: 두 모집단 비율 차이 개념wolfpack.hnu.ac.kr/2015_Spring/IS/IS... · 2015-05-31 · Introductory Statistics Spring 2015 일변량 추론(모비율 차이) (CNN/USA) 1995년에는

Introductory Statistics Spring 2015 일변량 추론(모비율 차이)

(CNN/USA) 1995년에는 1008명 중 413명이 야구 팬이라고 했다. Mark McGwire와 Sammy

Sosa 홈런 경쟁이 있었던 1998년 여성 야구팬이 늘었는지 알고 싶다.1998년에 1082 여성들을 대상

으로 야구팬인가를 묻는 질문에 682명이 그렇다고 했다. 유의수준 5%에서 검정하시오.

!

한남대학교 권세혁교수 http://wolfpack.hnu.ac.kr

/ Page3 3