์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- opencv
- ๊ตฐ์งํ
- ํ ์คํธ๋ถ์
- ๋ ๋ฆฝํ๋ณธ
- ๋ฐ์ดํฐ๋ถ์
- ๋์ํ๋ณธ
- pandas
- LDA
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- dataframe
- ๋น ๋ฐ์ดํฐ
- ์๋ํด๋ผ์ฐ๋
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ADsP
- numpy
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ํฌ๋กค๋ง
- ์ฃผ์ฑ๋ถ๋ถ์
- ํ์ด์ฌ
- iloc
- ADP
- Python
- Lambda
- ์ค๋ฒ์ํ๋ง
- ์ธ๋์ํ๋ง
- DBSCAN
- PCA
- t-test
- datascience
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
๋ชฉ๋ก๐ Machine Learning/๊ธฐ์ด ํต๊ณ (9)
Data Science LAB
๋ถ์ฐ๋ถ์ ๋ ๊ฐ ์ด์์ ์ง๋จ์์ ๊ทธ๋ฃน ํ๊ท ๊ฐ ์ฐจ์ด๋ฅผ ๊ทธ๋ฃน ๋ด ๋ณ๋์ ๋น๊ตํ์ฌ ์ดํด๋ณด๋ ํต๊ณ ๋ถ์ ๊ธฐ๋ฒ ๋ ๊ฐ ์ด์์ ์ง๋จ์ ํ๊ท ์ฐจ์ด์ ๋ํ ํต๊ณ์ ์ ์์ฑ ๊ฒ์ ์ผ์ ๋ฐฐ์น ๋ถ์ฐ ๋ถ์ ๋ถ์ฐ๋ถ์์์ ๋ฐ์๊ฐ์ ๋ํ ํ๋์ ๋ฒ์ฃผํ ๋ณ์์ ์ํฅ์ ์์๋ณด๊ธฐ ์ํด ์ฌ์ฉ๋จ ๋ชจ์ง๋จ์ ์์๋ ์ ํ์ด ์์ผ๋ฉฐ, ํ๋ณธ์ ์๋ ๊ฐ์ง ์์๋ ๋จ F ๊ฒ์ ํต๊ณ๋ ์ฌ์ฉ ๊ฐ ์ง๋จ์ ์ธก์ ์น๋ ๋ ๋ฆฝ์ ์ด๋ฉฐ, ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ผ์ผ ํจ ๊ฐ ์ง๋จ ์ธก์ ์น์ ๋ถ์ฐ์ ๊ฐ๋ค๊ณ ๊ฐ์ (๋ฑ๋ถ์ฐ์ฑ) ์์ธ ์ ๊ณฑํฉ(SS) ์์ ๋(df) ํ๊ท ์ ๊ณฑ(MS) ๋ถ์ฐ๋น(F) ์ฒ๋ฆฌ SSA k-1 MSA F = MSA/MSE ์ค์ฐจ SSE N-k MSE ์ ์ฒด SST N-1 ๊ท๋ฌด๊ฐ์ค(H0) : k๊ฐ์ ์ง๋จ ๊ฐ ๋ชจํ๊ท ์๋ ์ฐจ์ด๊ฐ ์๋ค. ๋๋ฆฝ๊ฐ์ค(H1) : k๊ฐ์ ์ง๋จ ๊ฐ ๋ชจํ๊ท ์ด ๋ชจ๋..
๋์ ํ๋ณธ vs ๋ ๋ฆฝ ํ๋ณธ ๋์ ํ๋ณธ : ๋ถ๋ถ 100์์ ๋ฝ์ ๋จํธ 100๋ช ๊ณผ ์๋ด 100๋ช ์ผ๋ก ์ง๋จ ๋น๊ต ๋ ๋ฆฝ ํ๋ณธ : ๋ฌด์์๋ก ๋จ์ 100๋ช , ์ฌ์ 100๋ช ์ ๋ฝ์ ๋น๊ต ๋ ์ง๋จ์ด ๋ ๋ฆฝ์ ์ด์ด์ผ ๋ ๋ฆฝ ํ๋ณธ์ด๋ผ๊ณ ํ ์ ์๋ค. ๋ฑ๋ถ์ฐ ๊ฒ์ ๋ฐ๋์ ๋ฑ๋ถ์ฐ ๊ฒ์ ํ์ ๋ ๋ฆฝํ๋ณธ t๊ฒ์ ์ ์ํํด์ผํ๋ค. ๊ท๋ฌด๊ฐ์ค (H0) : ๋ ์ง๋จ์ ๋ฐ์ดํฐ๋ ๋ฑ๋ถ์ฐ์ฑ์ ๋ง์กฑํจ ๋๋ฆฝ๊ฐ์ค (H1) : ๋ ์ง๋จ์ ๋ฐ์ดํฐ๋ ๋ฑ๋ถ์ฐ์ฑ์ ๋ง์กฑํ์ง ์์ p-value๊ฐ์ด 0.05๋ณด๋ค ์์ผ๋ฉด ๊ท๋ฌด๊ฐ์ค ๊ธฐ๊ฐ => ๋ ์ง๋จ์ ๋ฑ๋ถ์ฐ์ฑ์ ๋ง์กฑํ์ง ์์ import numpy as np from scipy.stats import levene a = np.random.normal(10,1,100) b = np.random.normal(10,1,100..

์๋ ํ์ธ์! ์ค๋์ Python์ ์ด์ฉํ์ฌ ๊ธฐ์ด ํต๊ณ๋์ ๊ตฌํ๋ ๋ฐฉ๋ฒ์ ๋ํด์ ํฌ์คํ ํด๋ณด๋ ค๊ณ ํฉ๋๋ค! ์ค์ฌ ํต๊ณ๋ : ๋ฐ์ดํฐ์ ์ค์ฌ ๊ฒฝํฅ์ ๋ํ๋ด๋ ์์น import numpy as np from scipy import stats x = [1,3,5,7,9] - ํ๊ท np.mean(x) - ์ค์๊ฐ np.median(x) - ์ต๋น๊ฐ stats.mode(x) ๋ณ๋ ํต๊ณ๋ ๋ฐ์ดํฐ์ ๋ณ๋์ฑ์ ๋ํ๋ - ๋ฒ์ np.max(x) - np.min(x) - ํธ์ฐจ ๋ฐ ๋ณ๋ deviation = x - np.mean(x) variation = sum(deviation**2) variation - ๋ถ์ฐ np.var(x) - ํ์คํธ์ฐจ np.std(x) - ์ฌ๋ถ์์ #์ 1 ์ฌ๋ถ์์ np.quantile(x,0.25) ํํ ํต..