์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Lambda
- ๋ ๋ฆฝํ๋ณธ
- ADP
- ํฌ๋กค๋ง
- dataframe
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- iloc
- ์ฃผ์ฑ๋ถ๋ถ์
- ์๋ํด๋ผ์ฐ๋
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ์ธ๋์ํ๋ง
- PCA
- ํ์ด์ฌ
- ๊ตฐ์งํ
- DBSCAN
- ADsP
- ๋์ํ๋ณธ
- LDA
- numpy
- opencv
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- Python
- pandas
- ํ ์คํธ๋ถ์
- t-test
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- ์ค๋ฒ์ํ๋ง
- datascience
- ๋ฐ์ดํฐ๋ถ์
- ๋น ๋ฐ์ดํฐ
Data Science LAB
์ถ์ฒ ์์คํ ๋ณธ๋ฌธ
๊ทธ ๋์ ๋จธ์ ๋ฌ๋์ ๊ณต๋ถํ๋ฉด์ ์ถ์ฒ ์์คํ ์ ๋ํ ๊ณต๋ถ๋ ํ์ง ์์์๋๋ฐ ์ด๋ฒ ๊ธฐํ์ ๊ณต๋ถํด๋ณด๋ ค๊ณ ํ๋ค..!์ฒ์ ์ ํ๋ ๊ฑฐ๋ผ ์ ๊ธฐํ๊ธฐ๋ ํ๊ณ , ์ ํ๋ธ๋ ๋ทํ๋ฆญ์ค ๋ฑ๋ฑ ์ฌ๋ฌ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ๋ค์ ๋ํด ๊ถ๊ธํ๊ฒ ๋ง์๋๋ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ๊ณต๋ถํด๋ณด๋ ค๊ณ ํ๋ค...!

์ถ์ฒ ์์คํ ์ด๋?
์ถ์ฒ ์์คํ (ๆจ่ฆsystem)์ ์ ๋ณด ํํฐ๋ง (IF) ๊ธฐ์ ์ ์ผ์ข ์ผ๋ก, ํน์ ์ฌ์ฉ์๊ฐ ๊ด์ฌ์ ๊ฐ์ง๋งํ ์ ๋ณด (์ํ, ์์ , ์ฑ , ๋ด์ค, ์ด๋ฏธ์ง, ์น ํ์ด์ง ๋ฑ)๋ฅผ ์ถ์ฒํ๋ ๊ฒ์ด๋ค. ์ถ์ฒ ์์คํ ์๋ ํ์ ํํฐ๋ง ๊ธฐ๋ฒ์ ์ฃผ๋ก ์ฌ์ฉํ๋ค. ์์ ๋ถ๋งํฌ ์ฌ์ดํธ์์ ๋งํฌ๋ฅผ ์ฌ๋๋ค์๊ฒ ์ถ์ฒํ๊ณ ๋ฌด๋น๋ ์ฆ ๋ฐ์ดํฐ ์ธํธ์์ ์ํ๋ฅผ ์ถ์ฒํ๋ ๋ฐฉ๋ฒ๋ฑ์ด ์ด์ ์ํ๋ค.
์ ๋ณด ํํฐ๋ง ๋ง๋ค๊ธฐ - ์ํค๋ฐฑ๊ณผ, ์ฐ๋ฆฌ ๋ชจ๋์ ๋ฐฑ๊ณผ์ฌ์
ํธ์ง๊ธฐ๊ฐ ์ง๊ธ ๋ก๋๋ฉ๋๋ค. ๋ช ์ด ํ์๋ ์ด ๋ฉ์์ง๊ฐ ์ฌ์ ํ ๋ณด์ด๋ฉด, ๋ฌธ์๋ฅผ ๋ค์ ๋ก๋ํด ์ฃผ์ญ์์ค.
ko.wikipedia.org
์จ๋ผ์ธ ์คํ ์ด์์์ ์ถ์ฒ ์์คํ
๋๋ถ๋ถ์ ์ ์ ์๊ฑฐ๋ ์ ์ฒด๋ ์จ๋ผ์ธ ์ฝํ ์ธ ์ ๊ณต ์ ์ฒด์๋ ์ํ์ด ๋๋ฌด ๋ง๊ธฐ ๋๋ฌธ์, ๊ณ ๊ฐ๋ค์ ๋ค์ํ ์ํ ์ด๋ฏธ์ง์ ๋ฒ์กํ ์นดํ ๊ณ ๋ฆฌ, ๋ฉ๋ด ๊ตฌ์ฑ ๋ฑ์ผ๋ก ์ธํด ์จ๋ผ์ธ์์์ ์ ํ ์ ํ์ ์ด๋ ค์์ ๊ฒช๋๋ค. ์ด๋ฌํ ๊ฒฝํ์ด ์์ด๋ฉด ์จ๋ผ์ธ ์ผํ์ ๋ํ ๋ถ์ ์ ์ธ ์ด๋ฏธ์ง๊ฐ ๊ฐํด์ ธ ๋งค์ถ ๊ฐ์๋ก ์ด์ด์ง ์ ์๋ค.
ํ์ ๋ ์๊ฐ์ด๋ผ๋ ์ ์ฝ ์์์ ๋๋ฌด ๋ง์ ์ํ๊ณผ ์ฝํ ์ธ ๋ ์คํ๋ ค ๊ณ ๊ฐ์ด ์ด๋ค ์ํ์ ๊ณจ๋ผ์ผ ํ ์ง์ ๋ํ ์๋ฐ๊ฐ์ ๋๋ผ๊ฒ ๋ง๋ค ์ ๋ฐ์ ์๊ธฐ ๋๋ฌธ์, ์ถ์ฒ ์์คํ ์ด ํ์ํ๋ค. ์๋น์๊ฐ ๋ฌด์์ ์ํ๋ ์ง ๋น ๋ฅด๊ฒ ์ฐพ์๋ด์ด ์ฌ์ฉ์๊ฐ ์จ๋ผ์ธ ์ผํ์ ์ฆ๊ฑฐ์์ ๋๋ผ๊ฒ ํด์ผ ํ๋ค.
- ์ฌ์ฉ์๊ฐ ์ด๋ค ์ํ์ ๊ตฌ๋งคํ๋๊ฐ?
- ์ฌ์ฉ์๊ฐ ์ด๋ค ์ํ์ ๋๋ฌ๋ณด๊ฑฐ๋ ์ฅ๋ฐ๊ตฌ๋์ ๋ฃ์๋๊ฐ?
- ์ฌ์ฉ์๊ฐ ํ๊ฐํ ์ํ ํ์ ?
- ์ฌ์ฉ์๊ฐ ์ค์ค๋ก ์์ฑํ ์์ ์ ์ทจํฅ์?
- ์ฌ์ฉ์๊ฐ ๋ฌด์์ ํด๋ฆญํ๋๊ฐ?
์์ ๋ฌธ์ ์ ๋ํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ์ฒ ์์คํ ์ ์ฌ์ฉ์๊ฐ ์ํ์ ๊ตฌ๋งคํ๋๋ก ์ ๋ํ๋ค.
์ถ์ฒ ์์คํ ์ ํ
- ์ฝํ ์ธ ๊ธฐ๋ฐ ํํฐ๋ง(Content Based Filtering) : ์ฌ์ฉ์๊ฐ ํน์ ์์ดํ ์ ๋งค์ฐ ์ ํธํ๋ ๊ฒฝ์ฐ, ๊ทธ ์์ดํ ๊ณผ ๋น์ทํ ์ฝํ ์ธ ๋ฅผ ๊ฐ์ง ๋ค๋ฅธ ์์ดํ ์ ์ถ์ฒํ๋ ๋ฐฉ์์ด๋ค. ์ฌ์ฉ์๊ฐ ๋์ ํ์ ์ ์ค ์์ดํ ๊ณผ ๋น์ทํ ์ข ๋ฅ, ๋ฆฌ๋ทฐ ํค์๋ ๋ฑ์ ๋ค์ํ ์ฝํ ์ธ ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ํ์ ์ถ์ฒํด ์ค๋ค.
- ํ์ ํํฐ๋ง(Collaborative Filtering) : ์ฌ์ฉ์์ ํ๋, ํ๋ ๋๋ ์ ํธ๋์ ๋ํ ๋ง์ ์ ๋ณด๋ฅผ ๋ถ์ํ๊ณ ๋ชจ์ ๋ค๋ฅธ ์ฌ์ฉ์์์ ๋น์ทํจ์ ๊ธฐ์ด๋ฅผ ๋๊ณ ์ฌ์ฉ์๋ค์ด ๋ฌด์์ ์ข์ํ ์ง ์์ธกํ๋ค. ํ์ ํํฐ๋ง์ Machine Analyzable Content์ ์์กดํ์ง ์์ ๊ทธ ์์ดํ ์์ฒด๋ฅผ ์ ํํ๊ฒ ์ดํดํ์ง ์์๋ ์ํ ๊ฐ์ ๋ณต์กํ ์์ดํ ๋ค์ ์ถ์ฒํ ์ ์๋ค. ํ์ ํํฐ๋ง์ ์ต๊ทผ์ ์ด์(Nearest Neighbor) ํ์ ํํฐ๋ง๊ณผ ์ ์ฌ์์ธ(Latent Factor) ํ์ ํํฐ๋ง์ผ๋ก ๋๋๋ค.