์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- LDA
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ๋ ๋ฆฝํ๋ณธ
- pandas
- Python
- ๋ฐ์ดํฐ๋ถ์
- iloc
- ๋์ํ๋ณธ
- DBSCAN
- ADsP
- t-test
- ํ์ด์ฌ
- ๋น ๋ฐ์ดํฐ
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- ํ ์คํธ๋ถ์
- ์ค๋ฒ์ํ๋ง
- Lambda
- ์ธ๋์ํ๋ง
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- numpy
- opencv
- ๊ตฐ์งํ
- PCA
- dataframe
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ADP
- datascience
- ์๋ํด๋ผ์ฐ๋
- ํฌ๋กค๋ง
- ์ฃผ์ฑ๋ถ๋ถ์
๋ชฉ๋ก๐ Machine Learning (36)
Data Science LAB

์์ฌ๊ฒฐ์ ๋๋ฌด๋ฅผ ์๊ฐํํ๊ธฐ ์ํ ํจํค์ง์ธ Graphviz ์ค์น ๋ฐฉ๋ฒ Homebrew ์ค์น 2022.09.15 - [Python] Mac์์ tesseract ์ค์นํ๊ธฐ ๋ฐ ํ๊ธ ์ถ๊ฐ [Python] Mac์์ tesseract ์ค์นํ๊ธฐ ๋ฐ ํ๊ธ ์ถ๊ฐ ์ด๋ฒ์ ๋งฅ๋ถ ํ๋ก๋ก ๋ ธํธ๋ถ์ ๋ณ๊ฒฝํ๋ฉด์ ๊ฐ๋ฐ ํ๊ฒฝ ์ค์ ์ ๋ค์ํ๋๋ฐ ์๊ฐ๋ณด๋ค ๋๋ฌด ์ด๋ ค์ด ๊ฒ,,,ใ ,,,,, tesseract ์ค์น ๋ฐฉ๋ฒ 1. Homebrew ์ค์น https://brew.sh/index_ko Homebrew The Missing Package Manage.. suhye.tistory.com ์ฌ๊ธฐ ์๋ถ๋ถ ์ฐธ๊ณ ํฐ๋ฏธ๋์์ graphviz ํจํค์ง ์ถ๊ฐ brew install graphviz pip ์ค์น pip install graphviz from ..
๋ฑ๋ถ์ฐ๊ฒ์ 1. ์์ธก๊ฒ์ - ๊ท๋ฌด๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ๊ฐ๋ค. - ๋๋ฆฝ๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ๊ฐ์ง ์๋ค. 2. ๋จ์ธก ๊ฒ์ - ๊ท๋ฌด๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ๊ฐ๋ค. - ๋๋ฆฝ๊ฐ์ค : ํ๋ณธ์ ๋ถ์ฐ์ ์๋ค. or ํฌ๋ค ํ์ด์ฌ์ผ๋ก ํจ์ ๊ตฌํ from scipy.stats import chi2 def var_test(x, va0, direction = 'two-tailed', alpha = 0.05): n = len(x) Q = (n-1) * np.var(x) / va0 print('direction', direction) if direction == 'lower': q = chi2.ppf(alpha, n-1) if Q = q: return 'H_0 rejected' else: return 'H_0 not reject..

ํ์์ ์์ธ๋ถ์ - ์์ธ๋ถ์ (FA)์ ๊ด์ฐฐ๋ ๋ณ์ ์งํฉ์์ ๊ฐ์ฅ ์ํฅ๋ ฅ ์๋ ๊ธฐ๋ณธ ์์ธ ๋๋ ์ ์ฌ ๋ณ์๋ฅผ ๊ฒ์ํ๋ ๋ฐ ์ฌ์ฉ๋๋ ํ์์ ๋ฐ์ดํฐ ๋ถ์ ๋ฐฉ๋ฒ์ด๋ค . - ๋ณ์ ์๋ฅผ ์ค์ฌ ๋ฐ์ดํฐ ํด์์ ๋์์ ์ค๋ค. - ๋ชจ๋ ๋ณ์์์ ์ต๋ ๊ณต๋ถ์ฐ์ ์ถ์ถํ์ฌ ๊ณตํต ์ ์์ ๋ฃ๋๋ค. - ์์ธ ๋ถ์์ ์์ฅ ์กฐ์ฌ, ๊ด๊ณ , ์ฌ๋ฆฌํ, ๊ธ์ต ๋ฐ ์ด์ ์ฐ๊ตฌ์ ๋๋ฆฌ ์ฌ์ฉ๋จ ํ์์ ์์ธ ๋ถ์ ๋ฐฉ๋ฒ 1. ๋ณ์๊ฐ์ ์๊ดํ๋ ฌ๋ก๋ถํฐ ๊ณตํต ์์ธ ๋์ถ 2. ๊ณตํต ์์ธ์ ์ด์ฉํด ๋ณ์๊ฐ์ ์๊ด๊ด๊ณ ์ค๋ช 3. ์์ธ ๋ถํ๋(factor loading)์ด ์ ๋๊ฐ 0.3 ์ด์์ด๋ฉด ์ ์ํ๋ค๊ณ ํ๋จ ํ์์ ์์ธ ๋ถ์์ ๋ชฉ์ 1. ์๋ฃ ์์ฝ : ๋ณ์๋ค์ ๋ช๊ฐ์ ๊ณตํต๋ ๋ณ์ธ์ผ๋ก ๋ฌถ์ 2. ์ถ์ ๋๊ตฌ ํ๋น์ฑ ๊ฒ์ : ๋ณ์ธ๋ค์ด ๋์ผํ ์์ธ์ผ๋ก ๋ฌถ์ด๋์ง๋ฅผ ํ์ธ 3...
1. ๋ชจ๋ ์ปฌ๋ผ์ ๊ฒฐ์ธก์น๋ฅผ ๊ฐ ์ปฌ๋ผ์ ์ค์๊ฐ์ผ๋ก ์ฑ์ฐ๊ธฐ df.fillna(df.mean(numeric_only=True)) df.isna().sum().sum() # 0 2. ํน์ ์ปฌ๋ผ์ ๊ฒฐ์ธก์น๋ฅผ ๊ทธ ์ปฌ๋ผ์ ์ค์๊ฐ์ผ๋ก ์ฑ์ฐ๊ธฐ df['col'].fillna(df['col'].median())

๋ฐ์ดํฐ๊ฐ ๋จ์ํ ์ง์ ํํ๊ฐ ์๋ ๋น์ ํ์ ํํ๋ฅผ ๊ฐ๊ณ ์์ ๋, ๊ฐ ๋ณ์์ ๊ฑฐ๋ญ ์ ๊ณฑ์ ์๋ก์ด ๋ณ์๋ก ์ถ๊ฐํ๋ฉด ์ ํ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๋ค. ์ด๋ ๊ฒ ํ์ฅ๋ ํน์ฑ์ ๋ฐ์ดํฐ ์ธํธ์ ์ ํ ๋ชจ๋ธ๋ก ํ๋ จ ์ํค๋ ๊ธฐ๋ฒ์ ๋คํญํ๊ท๋ผ๊ณ ํ๋ค. 1. ๋คํญ ๋ณ์ ์์ฑ PolynomialFeatures(degree=d)๋ฅผ ํ์ฉํด ๋ณ์ ํน์ฑ์ ๊ฑฐ๋ญ์ ๊ณฑ์ผ๋ก ๋ณํ class sklearn.preprocessing.PolynomialFeatures(degree=2, interaction_only=False, include_bias = True, order='C') - ๋งค๊ฐ๋ณ์ degree : ๋คํญ์์ ์ฐจ์ ๊ฒฐ์ (default=2) interaction_only : ๊ต์ฐจํญ์ ์ถ๊ฐํ ์ง ์ฌ๋ถ ๊ฒฐ์ (False์ธ ๊ฒฝ์ฐ ๊ต์ฐจํญ๊ณผ ๋์ผํ ..

ํ๋ ํน์ ๊ทธ ์ด์์ ์์ธ์ด ์ข ์๋ณ์์ ๋ฏธ์น๋ ์ํฅ์ ์ถ์ ํ์ฌ ์์ผ๋ก ํํํ๋ ํต๊ณ๊ธฐ๋ฒ์ผ๋ก ๋จธ์ ๋ฌ๋๊ณผ ๋ค๋ฅด๊ฒ ์์ผ๋ก ํํํ๊ธฐ ๋๋ฌธ์ ํด์๋ ฅ์ ๋์ผ ์ ์๋ค. ์ ํ ํ๊ท๋ถ์์ ํ๊ฐ SST : ์ด๋ณ๋ SSE : ์ค๋ช ๋ ๋ณ๋ SSR : ์ค๋ช ๋์ง ์์ ๋ณ๋์ ์๋ฏธ ์์ ์์์ด ์๋ฏธํ๋ ๋ฐ๋ ์ด ๋ณ๋ ์ค ์ค๋ช ๋ ๋ณ๋์ ๋น์จ์ด๋ค. ์ฆ, ํ๊ท ์ถ์ ์ ์ด ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ์ผ๋ง๋ ์ค๋ช ํ๊ณ ์๋์ง๋ฅผ ์๋ฏธํ๋ฉฐ ์ด ๊ฐ์ด ๋๋ค๋ฉด ํ๊ท ์ถ์ ์ง์ ์ผ๋ก ์๋ก์ด ๊ฐ์ ์์ธกํ๊ฑฐ๋ ์ถ์ ํ๋๋ผ๋ ๋ฏฟ์ ์ ์๋ ์ ๋๋ฅผ ์๋ฏธํ๋ค. RMSE ๊ฐ์ ํ๊ท ์ ๊ณฑ๊ทผ ์ค์ฐจ๋ก ์์ธก๊ฐ์์ ์ค์ ๊ด์ธก๊ฐ์ ๋บ ๊ฐ์ ์ ๊ณฑ์ ํฉ์ ํ๋ณธ์ ์๋ก ๋๋ ๊ฒ์ด๋ค. SSE๊ฐ์ ์์ ๋ (n-2)๋ก ๋๋๊ณ ๋ฃจํธ๋ฅผ ์ทจํ ๊ฐ๊ณผ ๊ฐ๋ค. RMSE ๊ฐ์ด ๋ฎ์ ์๋ก ์์ธก๋ ฅ์ด ์ข๋ค๊ณ ํ ์ ..