์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- ๋น ๋ฐ์ดํฐ
- ๋์ํ๋ณธ
- ADsP
- ํฌ๋กค๋ง
- ์ฃผ์ฑ๋ถ๋ถ์
- ์ค๋ฒ์ํ๋ง
- ADP
- opencv
- pandas
- ๋ ๋ฆฝํ๋ณธ
- Lambda
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- iloc
- ์๋ํด๋ผ์ฐ๋
- ๋ฐ์ดํฐ๋ถ์
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- ํ ์คํธ๋ถ์
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ์ธ๋์ํ๋ง
- ๊ตฐ์งํ
- ํ์ด์ฌ
- DBSCAN
- Python
- LDA
- numpy
- PCA
- dataframe
- datascience
- t-test
Data Science LAB
[Python] ๋ ๋ฆฝ / ๋์ ํ๋ณธ t ๊ฒ์ ๋ณธ๋ฌธ
[Python] ๋ ๋ฆฝ / ๋์ ํ๋ณธ t ๊ฒ์
ใ ใ ใ ใ 2022. 3. 15. 14:32๋์ ํ๋ณธ vs ๋ ๋ฆฝ ํ๋ณธ
- ๋์ ํ๋ณธ : ๋ถ๋ถ 100์์ ๋ฝ์ ๋จํธ 100๋ช ๊ณผ ์๋ด 100๋ช ์ผ๋ก ์ง๋จ ๋น๊ต
- ๋ ๋ฆฝ ํ๋ณธ : ๋ฌด์์๋ก ๋จ์ 100๋ช , ์ฌ์ 100๋ช ์ ๋ฝ์ ๋น๊ต
๋ ์ง๋จ์ด ๋ ๋ฆฝ์ ์ด์ด์ผ ๋ ๋ฆฝ ํ๋ณธ์ด๋ผ๊ณ ํ ์ ์๋ค.
๋ฑ๋ถ์ฐ ๊ฒ์
๋ฐ๋์ ๋ฑ๋ถ์ฐ ๊ฒ์ ํ์ ๋ ๋ฆฝํ๋ณธ t๊ฒ์ ์ ์ํํด์ผํ๋ค.
๊ท๋ฌด๊ฐ์ค (H0) : ๋ ์ง๋จ์ ๋ฐ์ดํฐ๋ ๋ฑ๋ถ์ฐ์ฑ์ ๋ง์กฑํจ
๋๋ฆฝ๊ฐ์ค (H1) : ๋ ์ง๋จ์ ๋ฐ์ดํฐ๋ ๋ฑ๋ถ์ฐ์ฑ์ ๋ง์กฑํ์ง ์์
p-value๊ฐ์ด 0.05๋ณด๋ค ์์ผ๋ฉด ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ => ๋ ์ง๋จ์ ๋ฑ๋ถ์ฐ์ฑ์ ๋ง์กฑํ์ง ์์
import numpy as np
from scipy.stats import levene
a = np.random.normal(10,1,100)
b = np.random.normal(10,1,100)
print("a ๋ถ์ฐ : {0:.4f} , b ๋ถ์ฐ : {1:.4f}".format(np.var(a),np.var(b)))
print(levene(a,b))
p-value๊ฐ์ด 0.61๋ก 0.05๋ณด๋ค ํฌ๊ธฐ ๋๋ฌธ์ ๊ท๋ฌด๊ฐ์ค์ ๊ธฐ๊ฐํ์ง ์๋๋ค.
๋ฐ๋ผ์ a,b ๋ ์ง๋จ์ ๋ฐ์ดํฐ์ ๋ถ์ฐ์ ๋์ผํ๋ค๊ณ ํ๋จํ ์ ์๋ค.
์ ๊ท์ฑ ๊ฒ์
๊ท๋ฌด๊ฐ์ค : ๋ฐ์ดํฐ๋ ์ ๊ท ๋ถํฌ๋ฅผ ๋ฐ๋ฆ
๋๋ฆฝ๊ฐ์ค : ๋ฐ์ดํฐ๋ ์ ๊ท ๋ถํฌ๋ฅผ ๋ฐ๋ฅด์ง ์์
p-value๊ฐ 0.05 ๋ฏธ๋ง์ด๋ฉด ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ => ๋ฐ์ดํฐ๋ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด์ง ์์
from scipy import stats
print('a์ ์ ๊ท์ฑ : ',stats.normaltest(a))
print('b์ ์ ๊ท์ฑ : ',stats.normaltest(b))
๋ ์ง๋จ์ ์ ๊ท์ฑ ๊ฒ์ ๊ฒฐ๊ณผ, a,b ๋ชจ๋ p-value๊ฐ์ด 0.05 ์ด์์ด๋ฏ๋ก ์ ๊ท ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๊ณ ํ๋จ
๋ ๋ฆฝํ๋ณธ t-test
- ๋ ๋ ๋ฆฝ๋ ํ๋ณธ์ ํ๊ท ์ ํต๊ณ์ ์ผ๋ก ๋น๊ตํ๋ ๊ธฐ๋ฒ
- ๋ ๊ฐ์ ๋ชจ์ง๋จ์์ ํฌ๊ธฐ๊ฐ n๊ฐ์ธ ํ๋ณธ์ ๊ฐ๊ฐ ์ถ์ถํ ๋ค ํ๋ณธ์ ๊ด์ธก๊ฐ๋ค์ ์ด์ฉํด ๊ฒ์
- ๋ ์ง๋จ์ ๋ชจํ๊ท ์ ๋์ผํ๋ค๊ณ ๊ฐ์
- ์ ๊ท์ฑ, ๋ฑ๋ถ์ฐ์ฑ์ ๋ง์กฑํด์ผํจ
scipy.stats.ttest_ind(a,b,axis=0,equal_var = True, nan_policy = 'propagate', permutations=None, random_state=None, alternative='two-sided', trim=0)
equal_var : ๋ฑ๋ถ์ฐ์ฑ ์ฌ๋ถ (True : ๋ฑ๋ถ์ฐ์ฑ ๋ง์กฑ/ False : ๋ฑ๋ถ์ฐ์ฑ ๋ง์กฑโ)
๋ฑ๋ถ์ฐ์ฑ ๊ฒ์ ๊ฒฐ๊ณผ, ๋ ์ง๋จ์ ๋ถ์ฐ์ด ๊ฐ๋ค๊ณ ํ๋จํ์์ผ๋ฏ๋ก, equal_var = True๋ก ์ค์
stats.ttest_ind(a,b,equal_var=True)
๋์ ํ๋ณธ t-test
- a์ b์ shape์ด ์ผ์นํด์ผ ํจ
scipy.stats.ttest_rel(a,b,axis=0, nan_policy = 'propagate', alternative='two-sided')
a = np.random.normal(10,1,100)
b = a + np.random.normal(0,1,100)
stats.ttest_rel(a,b)
'๐ Machine Learning > ๊ธฐ์ด ํต๊ณ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Python] ์ ํ ํ๊ท๋ถ์ (0) | 2022.08.22 |
---|---|
[Python] ๊ต์ฐจ ๋ถ์ (์นด์ด์ ๊ณฑ ๊ฒ์ ) (0) | 2022.08.21 |
[Python] ์ด์ ๋ฐฐ์น ๋ถ์ฐ ๋ถ์ (Two-way ANOVA) (0) | 2022.08.20 |
[Python] ์ผ์ ๋ถ์ฐ ๋ถ์(ANOVA) (0) | 2022.03.16 |
[Python] ๊ธฐ์ ํต๊ณ (0) | 2022.03.13 |