[Python] 독립 / 대응 표본 t 검정

250x250

Link

GitHub

나의 GitHub Contribution 그래프

Loading data ...

Notice

Recent Posts

Recent Comments

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

관리 메뉴

Data Science LAB

[Python] 독립 / 대응 표본 t 검정 본문

🛠 Machine Learning/기초 통계

[Python] 독립 / 대응 표본 t 검정

ㅅ ㅜ ㅔ ㅇ 2022. 3. 15. 14:32

728x90

대응 표본 vs 독립 표본

대응 표본 : 부부 100쌍을 뽑아 남편 100명과 아내 100명으로 집단 비교
독립 표본 : 무작위로 남자 100명, 여자 100명을 뽑아 비교

두 집단이 독립적이어야 독립 표본이라고 할 수 있다.

등분산 검정

반드시 등분산 검정 후에 독립표본 t검정을 수행해야한다.

귀무가설 (H0) : 두 집단의 데이터는 등분산성을 만족함

대립가설 (H1) : 두 집단의 데이터는 등분산성을 만족하지 않음

p-value값이 0.05보다 작으면 귀무가설 기각 => 두 집단은 등분산성을 만족하지 않음

import numpy as np
from scipy.stats import levene

a = np.random.normal(10,1,100)
b = np.random.normal(10,1,100)

print("a 분산 : {0:.4f} , b 분산 : {1:.4f}".format(np.var(a),np.var(b)))

print(levene(a,b))

p-value값이 0.61로 0.05보다 크기 때문에 귀무가설을 기각하지 않는다.

따라서 a,b 두 집단의 데이터의 분산은 동일하다고 판단할 수 있다.

정규성 검정

귀무가설 : 데이터는 정규 분포를 따름

대립가설 : 데이터는 정규 분포를 따르지 않음

p-value가 0.05 미만이면 귀무가설 기각 => 데이터는 정규분포를 따르지 않음

from scipy import stats

print('a의 정규성 : ',stats.normaltest(a))
print('b의 정규성 : ',stats.normaltest(b))

두 집단의 정규성 검정 결과, a,b 모두 p-value값이 0.05 이상이므로 정규 분포를 따른다고 판단

독립표본 t-test

두 독립된 표본의 평균을 통계적으로 비교하는 기법
두 개의 모집단에서 크기가 n개인 표본을 각각 추출한 뒤 표본의 관측값들을 이용해 검정
두 집단의 모평균은 동일하다고 가정
정규성, 등분산성을 만족해야함

scipy.stats.ttest_ind(a,b,axis=0,equal_var = True, nan_policy = 'propagate', permutations=None, random_state=None, alternative='two-sided', trim=0)

equal_var : 등분산성 여부 (True : 등분산성 만족/ False : 등분산성 만족❌)

등분산성 검정 결과, 두 집단의 분산이 같다고 판단하였으므로, equal_var = True로 설정

stats.ttest_ind(a,b,equal_var=True)

대응 표본 t-test

a와 b의 shape이 일치해야 함

scipy.stats.ttest_rel(a,b,axis=0, nan_policy = 'propagate', alternative='two-sided')

a = np.random.normal(10,1,100)
b = a + np.random.normal(0,1,100)

stats.ttest_rel(a,b)

728x90

'🛠 Machine Learning > 기초 통계' 카테고리의 다른 글

[Python] 선형 회귀분석 (0)	2022.08.22
[Python] 교차 분석 (카이제곱 검정) (0)	2022.08.21
[Python] 이원 배치 분산 분석 (Two-way ANOVA) (0)	2022.08.20
[Python] 일원 분산 분석(ANOVA) (0)	2022.03.16
[Python] 기술 통계 (0)	2022.03.13

'🛠 Machine Learning/기초 통계' Related Articles

Comments

Data Science LAB

[Python] 독립 / 대응 표본 t 검정 본문

[Python] 독립 / 대응 표본 t 검정

'🛠 Machine Learning > 기초 통계' 카테고리의 다른 글

티스토리툴바