์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Python
- PCA
- ํ ์คํธ๋ถ์
- LDA
- dataframe
- datascience
- ADP
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- DBSCAN
- ์ฃผ์ฑ๋ถ๋ถ์
- ๊ตฐ์งํ
- ์๋ํด๋ผ์ฐ๋
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ๋น ๋ฐ์ดํฐ
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- numpy
- ํ์ด์ฌ
- ์ค๋ฒ์ํ๋ง
- pandas
- t-test
- opencv
- ๋ ๋ฆฝํ๋ณธ
- ์ธ๋์ํ๋ง
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- iloc
- ๋ฐ์ดํฐ๋ถ์
- ADsP
- ํฌ๋กค๋ง
- ๋์ํ๋ณธ
- Lambda
๋ชฉ๋ก๐ Machine Learning/์ฐจ์ ์ถ์ (5)
Data Science LAB

NMF ๊ฐ์ NMF๋ Truncated SVD์ ๊ฐ์ด ๋ฎ์ ๋ญํฌ๋ฅผ ํตํ ํ๋ ฌ ๊ทผ์ฌ ๋ฐฉ์์ ๋ณํ์ด๋ค. NMF๋ ์๋ณธ ํ๋ ฌ ๋ด์ ๋ชจ๋ ์์ ๊ฐ์ด ๋ชจ๋ 0 ์ด์์ด๋ผ๋๊ฒ ๋ณด์ฅ๋๋ฉด ์ข ๋ ๊ฐ๋จํ๊ฒ ๋ ๊ฐ์ ์์ ํ๋ ฌ๋ก ๋ถํด๋ ์ ์๋ ๊ธฐ๋ฒ์ ์ง์นญํ๋ค. 4ร6 ์๋ณธ ํ๋ ฌ V๋ 4ร2 ํ๋ ฌ W์ 2ร6ํ๋ ฌ H๋ก ๊ทผ์ฌํด ๋ถํด๋ ์ ์๋ค. ํ๋ ฌ ๋ถํด(Matrix Factorization)๋ ์ผ๋ฐ์ ์ผ๋ก SVD์ ๊ฐ์ ํ๋ ฌ ๋ถํด ๊ธฐ๋ฒ์ ํต์นญํ๋ค. ์ด์ฒ๋ผ ํ๋ ฌ ๋ถํด๋ฅผ ํ๊ฒ ๋๋ฉด W์ Hํ๋ ฌ์ ๊ธธ๊ณ ๊ฐ๋ ํ๋ ฌW์ ์๊ณ ๋์ ํ๋ ฌ H๋ก ๋ถํด๋๋ค. ๋ถํด๋ ํ๋ ฌ์ ์ ์ฌ ์์๋ฅผ ํน์ฑ์ผ๋ก ๊ฐ์ง๊ฒ ๋๋๋ฐ, ๋ถํด ํ๋ ฌ W๋ ์๋ณธ ํ์ ๋ํด ์ด ์ ์ฌ ์์์ ๊ฐ์ด ์ผ๋ง๋ ๋๋์ง์ ๋์ํ๋ฉฐ, ๋ถํด ํ๋ ฌ H๋ ์ด ์ ์ฌ ์์๊ฐ ์๋ณธ ์ด๋ก ์ด๋ป๊ฒ ๊ตฌ..

SVD ๊ฐ์ SVD๋ PCA์ ๋น์ทํ๊ฒ ํ๋ ฌ ๋ถํด ๊ธฐ๋ฒ์ ์ด์ฉํ์ง๋ง, PCA๋ ์ ๋ฐฉํ๋ ฌ๋ง์ ๊ณ ์ ๋ฒกํฐ๋ก ๋ถํดํ๋ ๋ฐ๋ฉด, SVD๋ ํ๊ณผ ์ด์ด ๋ค๋ฅธ ๋ชจ๋ ํ๋ ฌ์ ์ ์ฉํ ์ ์๋ค. ์ผ๋ฐ์ ์ผ๋ก, SVD๋ mรn ํฌ๊ธฐ์ ํ๋ ฌ A๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ๋ถํดํ๋ ๊ฒ์ ์๋ฏธํ๋ค. SVD๋ ํน์ด๊ฐ ๋ถํด๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋ฉฐ, ํ๋ ฌ U์ V์ ์ํ๋ ๋ฒกํฐ๋ ํน์ด๋ฒกํฐ์ด๋ค. ๋ชจ๋ ํน์ด๋ฒกํฐ๋ ์๋กํ๋ ์ฑ์ง์ ๊ฐ์ง๋ค. U : mรm ํฌ๊ธฐ์ ํ๋ ฌ, ์ญํ๋ ฌ์ด ๋์นญ ํ๋ ฌ โ : mรn ํฌ๊ธฐ์ ํ๋ ฌ, ๋น๋๊ฐ ์ฑ๋ถ์ด 0 V : nรnํฌ๊ธฐ์ ํ๋ ฌ, ์ญํ๋ ฌ์ด ๋์นญ V,U๋ ์ง๊ตํ๋ ฌ ๋๋คํ๋ ฌ ์์ฑ import numpy as np from numpy.linalg import svd np.random.seed(121) a = np.random.randn(4,4..

LDA ๊ฐ์ LDA๋ ์ ํ ํ๋ณ ๋ถ์๋ฒ์ผ๋ก, PCA์ ๋งค์ฐ ์ ์ฌํ๊ฒ ์ ๋ ฅ ๋ฐ์ดํฐ์ ์ ์ ์ฐจ์ ๊ณต๊ฐ์ ํฌ์ฌํด ์ฐจ์์ ์ถ์ํ๋ ๊ธฐ๋ฒ์ด๋ค. PCA์์ ์ฐจ์ด๋ LDA๋ ์ง๋ํ์ต์ ๋ถ๋ฅ์์ ์ฌ์ฉํ๊ธฐ ์ฝ๋๋ก ๊ฐ๋ณ ํด๋์ค๋ฅผ ๋ถ๋ณํ ์ ์๋ ๊ธฐ์ค์ ์ต๋ํ ์ ์งํ๋ฉด์ ์ฐจ์์ ์ถ์ํ๋ค. ๋ฐ๋ฉด PCA๋ ์ ๋ ฅ ๋ฐ์ดํฐ์ ๋ณ๋์ฑ์ ๊ฐ์ฅ ํฐ ์ถ์ ์ฐพ์์ง๋ง, LDA๋ ์ ๋ ฅ ๋ฐ์ดํฐ์ ๊ฒฐ์ ๊ฐ ํด๋์ค๋ฅผ ์ต๋ํ์ผ๋ก ๋ถ๋ฆฌํ ์ ์๋ ์ถ์ ์ฐพ๋๋ค. #์ฐธ๊ณ 2022.03.05 - [Python] PCA(Principal Component Analysis) [Python] PCA(Principal Component Analysis) PCA ๊ฐ์ PCA(Principal Component Analysis)๋ ๊ฐ์ฅ ๋ํ์ ์ธ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ์ผ๋ก ์ฌ๋ฌ ..

2022.03.05 - [Python] PCA(Principal Component Analysis) [Python] PCA(Principal Component Analysis) PCA ๊ฐ์ PCA(Principal Component Analysis)๋ ๊ฐ์ฅ ๋ํ์ ์ธ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ์ผ๋ก ์ฌ๋ฌ ๋ณ์ ๊ฐ์ ์กด์ฌํ๋ ์๊ด๊ด๊ณ๋ฅผ ์ด์ฉํด ์ด๋ฅผ ๋ํํ๋ ์ฃผ์ฑ๋ถ(Principal Component)๋ฅผ ์ถ์ถํด ์ฐจ์์ ์ถ์ํ๋ ๊ธฐ๋ฒ์ด๋ค. suhye.tistory.com ์ง๋ ํฌ์คํ ์์ ๊ณต๋ถํ์๋ PCA๋ฅผ ๋ค๋ฅธ ๋ฐ์ดํฐ์ ์ ์ด์ฉํ์ฌ ์ค์ตํด ๋ณด๋ ค๊ณ ํ๋ค. ๋ฐ์ดํฐ์ ๋ค์ด๋ก๋ https://archive.ics.uci.edu/ml/datasets/default+of+credit+card+clients UCI Machine Lear..

PCA ๊ฐ์ PCA(Principal Component Analysis)๋ ๊ฐ์ฅ ๋ํ์ ์ธ ์ฐจ์ ์ถ์ ๊ธฐ๋ฒ์ผ๋ก ์ฌ๋ฌ ๋ณ์ ๊ฐ์ ์กด์ฌํ๋ ์๊ด๊ด๊ณ๋ฅผ ์ด์ฉํด ์ด๋ฅผ ๋ํํ๋ ์ฃผ์ฑ๋ถ(Principal Component)๋ฅผ ์ถ์ถํด ์ฐจ์์ ์ถ์ํ๋ ๊ธฐ๋ฒ์ด๋ค. PCA ์ฐจ์ ์ถ์๋ก ์ธํ ์ ๋ณด ์ ์ค์ ์ต์ํํ๊ธฐ ์ํด ๊ฐ์ฅ ๋์ ๋ถ์ฐ์ ๊ฐ์ง๋ ๋ฐ์ดํฐ์ ์ถ์ ์ฐพ์ ์ด ์ถ์ผ๋ก ์ฐจ์์ ์ถ์ํ๋ค. ์ด๊ฒ์ด PCA์ ์ฃผ์ฑ๋ถ์ด ๋๋๋ฐ, ๋ถ์ฐ์ด ๋ฐ์ดํฐ์ ํน์ฑ์ ๊ฐ์ฅ ์ ๋ํ๋ด๋ ๊ฒ์ ์๋ฏธํ๋ค. ๋ฐ์ดํฐ์ ๊ฐ์ฅ ๊ฐ๊น์ด ์ดํ๋ฉด์ ์ ์ํ๊ณ , ์ด ์ดํ๋ฉด์ ๋ฐ์ดํฐ๋ฅผ ํฌ์์ํค๋ ๊ฒ์ด๋ค. ํฌ์์์ผฐ์ ๋ ๋ฐ์ดํฐ์ ๊ณผ์ ํ๊ท ์ ๊ณฑ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ์ฅ ์์ ์ดํ๋ฉด์ ์ฐพ๊ณ ํฌ์ ์ํค๋ ๊ณผ์ ์ ๊ทธ๋ฆผ์ ๋ํ๋ด์๋ค. PCA๋ ์ ์ผ ๋จผ์ ๊ฐ์ฅ ๋ฐ์ดํฐ ๋ณ๋์ฑ์ ๊ธฐ๋ฐ์ผ๋ก ์ฒซ ๋ฒ..