์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- ํฌ๋กค๋ง
- ํ ์คํธ๋ถ์
- ๋ฐ์ดํฐ๋ถ์
- ๋ ๋ฆฝํ๋ณธ
- ADsP
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- ์ธ๋์ํ๋ง
- ์๋ํด๋ผ์ฐ๋
- ์ค๋ฒ์ํ๋ง
- DBSCAN
- ์ฃผ์ฑ๋ถ๋ถ์
- datascience
- t-test
- Lambda
- PCA
- ํ์ด์ฌ
- ๋น ๋ฐ์ดํฐ
- dataframe
- Python
- opencv
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- LDA
- ๋์ํ๋ณธ
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- iloc
- numpy
- ADP
- ๊ตฐ์งํ
- pandas
๋ชฉ๋ก๐ Machine Learning/๊ธฐ์ด ํต๊ณ (9)
Data Science LAB
๋ฑ๋ถ์ฐ๊ฒ์ 1. ์์ธก๊ฒ์ - ๊ท๋ฌด๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ๊ฐ๋ค. - ๋๋ฆฝ๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ๊ฐ์ง ์๋ค. 2. ๋จ์ธก ๊ฒ์ - ๊ท๋ฌด๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ๊ฐ๋ค. - ๋๋ฆฝ๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ์๋ค. or ํฌ๋ค ํ์ด์ฌ์ผ๋ก ํจ์ ๊ตฌํ from scipy.stats import chi2 def var_test(x, va0, direction = 'two-tailed', alpha = 0.05): n = len(x) Q = (n-1) * np.var(x) / va0 print('direction', direction) if direction == 'lower': q = chi2.ppf(alpha, n-1) if Q = q: return 'H_0 rejected' else: return 'H_0 not reject..

ํ์์ ์์ธ๋ถ์ - ์์ธ๋ถ์ (FA)์ ๊ด์ฐฐ๋ ๋ณ์ ์งํฉ์์ ๊ฐ์ฅ ์ํฅ๋ ฅ ์๋ ๊ธฐ๋ณธ ์์ธ ๋๋ ์ ์ฌ ๋ณ์๋ฅผ ๊ฒ์ํ๋ ๋ฐ ์ฌ์ฉ๋๋ ํ์์ ๋ฐ์ดํฐ ๋ถ์ ๋ฐฉ๋ฒ์ด๋ค . - ๋ณ์ ์๋ฅผ ์ค์ฌ ๋ฐ์ดํฐ ํด์์ ๋์์ ์ค๋ค. - ๋ชจ๋ ๋ณ์์์ ์ต๋ ๊ณต๋ถ์ฐ์ ์ถ์ถํ์ฌ ๊ณตํต ์ ์์ ๋ฃ๋๋ค. - ์์ธ ๋ถ์์ ์์ฅ ์กฐ์ฌ, ๊ด๊ณ , ์ฌ๋ฆฌํ, ๊ธ์ต ๋ฐ ์ด์ ์ฐ๊ตฌ์ ๋๋ฆฌ ์ฌ์ฉ๋จ ํ์์ ์์ธ ๋ถ์ ๋ฐฉ๋ฒ 1. ๋ณ์๊ฐ์ ์๊ดํ๋ ฌ๋ก๋ถํฐ ๊ณตํต ์์ธ ๋์ถ 2. ๊ณตํต ์์ธ์ ์ด์ฉํด ๋ณ์๊ฐ์ ์๊ด๊ด๊ณ ์ค๋ช 3. ์์ธ ๋ถํ๋(factor loading)์ด ์ ๋๊ฐ 0.3 ์ด์์ด๋ฉด ์ ์ํ๋ค๊ณ ํ๋จ ํ์์ ์์ธ ๋ถ์์ ๋ชฉ์ 1. ์๋ฃ ์์ฝ : ๋ณ์๋ค์ ๋ช๊ฐ์ ๊ณตํต๋ ๋ณ์ธ์ผ๋ก ๋ฌถ์ 2. ์ถ์ ๋๊ตฌ ํ๋น์ฑ ๊ฒ์ : ๋ณ์ธ๋ค์ด ๋์ผํ ์์ธ์ผ๋ก ๋ฌถ์ด๋์ง๋ฅผ ํ์ธ 3...

๋ฐ์ดํฐ๊ฐ ๋จ์ํ ์ง์ ํํ๊ฐ ์๋ ๋น์ ํ์ ํํ๋ฅผ ๊ฐ๊ณ ์์ ๋, ๊ฐ ๋ณ์์ ๊ฑฐ๋ญ ์ ๊ณฑ์ ์๋ก์ด ๋ณ์๋ก ์ถ๊ฐํ๋ฉด ์ ํ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๋ค. ์ด๋ ๊ฒ ํ์ฅ๋ ํน์ฑ์ ๋ฐ์ดํฐ ์ธํธ์ ์ ํ ๋ชจ๋ธ๋ก ํ๋ จ ์ํค๋ ๊ธฐ๋ฒ์ ๋คํญํ๊ท๋ผ๊ณ ํ๋ค. 1. ๋คํญ ๋ณ์ ์์ฑ PolynomialFeatures(degree=d)๋ฅผ ํ์ฉํด ๋ณ์ ํน์ฑ์ ๊ฑฐ๋ญ์ ๊ณฑ์ผ๋ก ๋ณํ class sklearn.preprocessing.PolynomialFeatures(degree=2, interaction_only=False, include_bias = True, order='C') - ๋งค๊ฐ๋ณ์ degree : ๋คํญ์์ ์ฐจ์ ๊ฒฐ์ (default=2) interaction_only : ๊ต์ฐจํญ์ ์ถ๊ฐํ ์ง ์ฌ๋ถ ๊ฒฐ์ (False์ธ ๊ฒฝ์ฐ ๊ต์ฐจํญ๊ณผ ๋์ผํ ..

ํ๋ ํน์ ๊ทธ ์ด์์ ์์ธ์ด ์ข ์๋ณ์์ ๋ฏธ์น๋ ์ํฅ์ ์ถ์ ํ์ฌ ์์ผ๋ก ํํํ๋ ํต๊ณ๊ธฐ๋ฒ์ผ๋ก ๋จธ์ ๋ฌ๋๊ณผ ๋ค๋ฅด๊ฒ ์์ผ๋ก ํํํ๊ธฐ ๋๋ฌธ์ ํด์๋ ฅ์ ๋์ผ ์ ์๋ค. ์ ํ ํ๊ท๋ถ์์ ํ๊ฐ SST : ์ด๋ณ๋ SSE : ์ค๋ช ๋ ๋ณ๋ SSR : ์ค๋ช ๋์ง ์์ ๋ณ๋์ ์๋ฏธ ์์ ์์์ด ์๋ฏธํ๋ ๋ฐ๋ ์ด ๋ณ๋ ์ค ์ค๋ช ๋ ๋ณ๋์ ๋น์จ์ด๋ค. ์ฆ, ํ๊ท ์ถ์ ์ ์ด ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ์ผ๋ง๋ ์ค๋ช ํ๊ณ ์๋์ง๋ฅผ ์๋ฏธํ๋ฉฐ ์ด ๊ฐ์ด ๋๋ค๋ฉด ํ๊ท ์ถ์ ์ง์ ์ผ๋ก ์๋ก์ด ๊ฐ์ ์์ธกํ๊ฑฐ๋ ์ถ์ ํ๋๋ผ๋ ๋ฏฟ์ ์ ์๋ ์ ๋๋ฅผ ์๋ฏธํ๋ค. RMSE ๊ฐ์ ํ๊ท ์ ๊ณฑ๊ทผ ์ค์ฐจ๋ก ์์ธก๊ฐ์์ ์ค์ ๊ด์ธก๊ฐ์ ๋บ ๊ฐ์ ์ ๊ณฑ์ ํฉ์ ํ๋ณธ์ ์๋ก ๋๋ ๊ฒ์ด๋ค. SSE๊ฐ์ ์์ ๋ (n-2)๋ก ๋๋๊ณ ๋ฃจํธ๋ฅผ ์ทจํ ๊ฐ๊ณผ ๊ฐ๋ค. RMSE ๊ฐ์ด ๋ฎ์ ์๋ก ์์ธก๋ ฅ์ด ์ข๋ค๊ณ ํ ์ ..

2022.08.20 - [Python] ์ด์ ๋ฐฐ์น ๋ถ์ฐ ๋ถ์ (Two-way ANOVA) [Python] ์ด์ ๋ฐฐ์น ๋ถ์ฐ ๋ถ์ (Two-way ANOVA) Two - way ANOVA ๋ถ์ฐ ๋ถ์์์ ํ๋์ ์ข ์๋ณ์์ ๋ํ ๋ ๊ฐ์ ๋ ๋ฆฝ๋ณ์ A, B์ ์ํฅ์ ์์๋ณด๊ธฐ ์ํด ์ฌ์ฉ๋๋ ๊ฒ์ฆ ๋ฐฉ๋ฒ ๋ ๋ ๋ฆฝ๋ณ์ ์ฌ์ด์ ์๊ด๊ด๊ณ๊ฐ ์๋ ์ง๋ฅผ ์ดํด๋ณด๋ ๊ตํธ์์ฉ์ ๋ํ ๊ฒ suhye.tistory.com ์์ ํฌ์คํ ํ๋ ANOVA ๋ถ์์ ์ข ์๋ณ์๊ฐ ์ฐ์ํ ๋ณ์์์ง๋ง, ์นด์ด์ ๊ณฑ ๊ฒ์ ์ ์ข ์๋ณ์๊ฐ ๋ฒ์ฃผํ ๋ณ์์ธ ๊ฒฝ์ฐ์ ์ฌ์ฉํ๋ ํต๊ณ ๊ธฐ๋ฒ์ด๋ค. ๊ต์ฐจ ๋ถ์์ ๊ต์ฐจํ๋ฅผ ํตํด ๊ฐ ์ ์ ๊ด์ฐฐ ๋น๋์ ๊ธฐ๋ ๋น๋๊ฐ์ ์ฐจ์ด๋ฅผ ๊ฒ์ ํ๋ ๊ธฐ๋ฒ์ด๋ค. 1. ์ ํฉ์ฑ ๊ฒ์ : ๊ฐ ๋ฒ์ฃผ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ์ ๋น๋ ๋ถํฌ๊ฐ ์ด๋ก ์ ์ผ๋ก ๊ธฐ๋ํ๋ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด..

Two - way ANOVA ๋ถ์ฐ ๋ถ์์์ ํ๋์ ์ข ์๋ณ์์ ๋ํ ๋ ๊ฐ์ ๋ ๋ฆฝ๋ณ์ A, B์ ์ํฅ์ ์์๋ณด๊ธฐ ์ํด ์ฌ์ฉ๋๋ ๊ฒ์ฆ ๋ฐฉ๋ฒ ๋ ๋ ๋ฆฝ๋ณ์ ์ฌ์ด์ ์๊ด๊ด๊ณ๊ฐ ์๋ ์ง๋ฅผ ์ดํด๋ณด๋ ๊ตํธ์์ฉ์ ๋ํ ๊ฒ์ฆ์ด ๋ฐ๋์ ์งํ๋์ด์ผ ํ๋ค. ์ง๋จ์ ์ธก์ ์น๋ ๋ ๋ฆฝ์ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฆ ๋ฑ๋ถ์ฐ์ฑ ๊ท๋ฌด๊ฐ์ค (H0) - ๋ณ์ A์ ๋ฐ๋ฅธ ์ข ์ ๋ณ์์ ๊ฐ์๋ ์ฐจ์ด๊ฐ ์๋ค. - ๋ณ์ B์ ๋ฐ๋ฅธ ์ข ์ ๋ณ์์ ๊ฐ์๋ ์ฐจ์ด๊ฐ ์๋ค. - ๋ณ์ A, B์ ๊ตํธ์์ฉ์ ์๋ค. ๋๋ฆฝ๊ฐ์ค (H1) - ๋ณ์ A์ ๋ฐ๋ฅธ ์ข ์ ๋ณ์์ ๊ฐ์๋ ์ฐจ์ด๊ฐ ์๋ค. - ๋ณ์ B์ ๋ฐ๋ฅธ ์ข ์ ๋ณ์์ ๊ฐ์๋ ์ฐจ์ด๊ฐ ์๋ค. - ๋ณ์ A, B์ ๊ตํธ์์ฉ์ ์๋ค. ์์ mtcars = pd.read_csv('../data/mtcars.csv') mtcars.head(..