250x250
Link
๋‚˜์˜ GitHub Contribution ๊ทธ๋ž˜ํ”„
Loading data ...
Notice
Recent Posts
Recent Comments
๊ด€๋ฆฌ ๋ฉ”๋‰ด

Data Science LAB

์ถ”์ฒœ ์‹œ์Šคํ…œ ๋ณธ๋ฌธ

๐Ÿ›  Machine Learning/์ถ”์ฒœ ์‹œ์Šคํ…œ

์ถ”์ฒœ ์‹œ์Šคํ…œ

ใ…… ใ…œ ใ…” ใ…‡ 2022. 3. 8. 16:19
728x90

๊ทธ ๋™์•ˆ ๋จธ์‹ ๋Ÿฌ๋‹์„ ๊ณต๋ถ€ํ•˜๋ฉด์„œ ์ถ”์ฒœ ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ๊ณต๋ถ€๋Š” ํ•˜์ง€ ์•Š์•˜์—ˆ๋Š”๋ฐ ์ด๋ฒˆ ๊ธฐํšŒ์— ๊ณต๋ถ€ํ•ด๋ณด๋ ค๊ณ  ํ•œ๋‹ค..!์ฒ˜์Œ ์ ‘ํ•˜๋Š” ๊ฑฐ๋ผ ์‹ ๊ธฐํ•˜๊ธฐ๋„ ํ•˜๊ณ , ์œ ํŠœ๋ธŒ๋‚˜ ๋„ทํ”Œ๋ฆญ์Šค ๋“ฑ๋“ฑ ์—ฌ๋Ÿฌ ์ถ”์ฒœ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋“ค์— ๋Œ€ํ•ด ๊ถ๊ธˆํ•œ๊ฒŒ ๋งŽ์•˜๋Š”๋ฐ ์ฐจ๊ทผ์ฐจ๊ทผ ๊ณต๋ถ€ํ•ด๋ณด๋ ค๊ณ  ํ•œ๋‹ค...!

 

 

์ถ”์ฒœ ์‹œ์Šคํ…œ ์ด๋ž€?

์ถ”์ฒœ ์‹œ์Šคํ…œ(ๆŽจ่–ฆsystem)์€ ์ •๋ณด ํ•„ํ„ฐ๋ง (IF) ๊ธฐ์ˆ ์˜ ์ผ์ข…์œผ๋กœ, ํŠน์ • ์‚ฌ์šฉ์ž๊ฐ€ ๊ด€์‹ฌ์„ ๊ฐ€์งˆ๋งŒํ•œ ์ •๋ณด (์˜ํ™”, ์Œ์•…, ์ฑ…, ๋‰ด์Šค, ์ด๋ฏธ์ง€, ์›น ํŽ˜์ด์ง€ ๋“ฑ)๋ฅผ ์ถ”์ฒœํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์ถ”์ฒœ ์‹œ์Šคํ…œ์—๋Š” ํ˜‘์—… ํ•„ํ„ฐ๋ง ๊ธฐ๋ฒ•์„ ์ฃผ๋กœ ์‚ฌ์šฉํ•œ๋‹ค. ์†Œ์…œ ๋ถ๋งˆํฌ ์‚ฌ์ดํŠธ์—์„œ ๋งํฌ๋ฅผ ์‚ฌ๋žŒ๋“ค์—๊ฒŒ ์ถ”์ฒœํ•˜๊ณ  ๋ฌด๋น„๋ Œ์ฆˆ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ์˜ํ™”๋ฅผ ์ถ”์ฒœํ•˜๋Š” ๋ฐฉ๋ฒ•๋“ฑ์ด ์ด์— ์†ํ•œ๋‹ค.

 

์ •๋ณด ํ•„ํ„ฐ๋ง ๋งŒ๋“ค๊ธฐ - ์œ„ํ‚ค๋ฐฑ๊ณผ, ์šฐ๋ฆฌ ๋ชจ๋‘์˜ ๋ฐฑ๊ณผ์‚ฌ์ „

ํŽธ์ง‘๊ธฐ๊ฐ€ ์ง€๊ธˆ ๋กœ๋“œ๋ฉ๋‹ˆ๋‹ค. ๋ช‡ ์ดˆ ํ›„์—๋„ ์ด ๋ฉ”์‹œ์ง€๊ฐ€ ์—ฌ์ „ํžˆ ๋ณด์ด๋ฉด, ๋ฌธ์„œ๋ฅผ ๋‹ค์‹œ ๋กœ๋“œํ•ด ์ฃผ์‹ญ์‹œ์˜ค.

ko.wikipedia.org

 

 

์˜จ๋ผ์ธ ์Šคํ† ์–ด์—์„œ์˜ ์ถ”์ฒœ ์‹œ์Šคํ…œ

๋Œ€๋ถ€๋ถ„์˜ ์ „์ž ์ƒ๊ฑฐ๋ž˜ ์—…์ฒด๋‚˜ ์˜จ๋ผ์ธ ์ฝ˜ํ…์ธ  ์ œ๊ณต ์—…์ฒด์—๋Š” ์ƒํ’ˆ์ด ๋„ˆ๋ฌด ๋งŽ๊ธฐ ๋•Œ๋ฌธ์—, ๊ณ ๊ฐ๋“ค์€ ๋‹ค์–‘ํ•œ ์ƒํ’ˆ ์ด๋ฏธ์ง€์™€ ๋ฒˆ์žกํ•œ ์นดํ…Œ๊ณ ๋ฆฌ, ๋ฉ”๋‰ด ๊ตฌ์„ฑ ๋“ฑ์œผ๋กœ ์ธํ•ด ์˜จ๋ผ์ธ์ƒ์—์„œ ์ œํ’ˆ ์„ ํƒ์˜ ์–ด๋ ค์›€์„ ๊ฒช๋Š”๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฝํ—˜์ด ์Œ“์ด๋ฉด ์˜จ๋ผ์ธ ์‡ผํ•‘์— ๋Œ€ํ•œ ๋ถ€์ •์ ์ธ ์ด๋ฏธ์ง€๊ฐ€ ๊ฐ•ํ•ด์ ธ ๋งค์ถœ ๊ฐ์†Œ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ๋‹ค.

ํ•œ์ •๋œ ์‹œ๊ฐ„์ด๋ผ๋Š” ์ œ์•ฝ ์†์—์„œ ๋„ˆ๋ฌด ๋งŽ์€ ์ƒํ’ˆ๊ณผ ์ฝ˜ํ…์ธ ๋Š” ์˜คํžˆ๋ ค ๊ณ ๊ฐ์ด ์–ด๋–ค ์ƒํ’ˆ์„ ๊ณจ๋ผ์•ผ ํ• ์ง€์— ๋Œ€ํ•œ ์••๋ฐ•๊ฐ์„ ๋Š๋ผ๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ๋ฐ–์— ์—†๊ธฐ ๋•Œ๋ฌธ์—, ์ถ”์ฒœ ์‹œ์Šคํ…œ์ด ํ•„์š”ํ•˜๋‹ค. ์†Œ๋น„์ž๊ฐ€ ๋ฌด์—‡์„ ์›ํ•˜๋Š” ์ง€ ๋น ๋ฅด๊ฒŒ ์ฐพ์•„๋‚ด์–ด ์‚ฌ์šฉ์ž๊ฐ€ ์˜จ๋ผ์ธ ์‡ผํ•‘์˜ ์ฆ๊ฑฐ์›€์„ ๋Š๋ผ๊ฒŒ ํ•ด์•ผ ํ•œ๋‹ค. 

  • ์‚ฌ์šฉ์ž๊ฐ€ ์–ด๋–ค ์ƒํ’ˆ์„ ๊ตฌ๋งคํ–ˆ๋Š”๊ฐ€?
  • ์‚ฌ์šฉ์ž๊ฐ€ ์–ด๋–ค ์ƒํ’ˆ์„ ๋‘˜๋Ÿฌ๋ณด๊ฑฐ๋‚˜ ์žฅ๋ฐ”๊ตฌ๋‹ˆ์— ๋„ฃ์—ˆ๋Š”๊ฐ€?
  • ์‚ฌ์šฉ์ž๊ฐ€ ํ‰๊ฐ€ํ•œ ์˜ํ™” ํ‰์ ?
  • ์‚ฌ์šฉ์ž๊ฐ€ ์Šค์Šค๋กœ ์ž‘์„ฑํ•œ ์ž์‹ ์˜ ์ทจํ–ฅ์€?
  • ์‚ฌ์šฉ์ž๊ฐ€ ๋ฌด์—‡์„ ํด๋ฆญํ–ˆ๋Š”๊ฐ€?

์œ„์˜ ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ถ”์ฒœ ์‹œ์Šคํ…œ์€ ์‚ฌ์šฉ์ž๊ฐ€ ์ƒํ’ˆ์„ ๊ตฌ๋งคํ•˜๋„๋ก ์œ ๋„ํ•œ๋‹ค. 

 

 

 

 

์ถ”์ฒœ ์‹œ์Šคํ…œ ์œ ํ˜•

  • ์ฝ˜ํ…์ธ  ๊ธฐ๋ฐ˜ ํ•„ํ„ฐ๋ง(Content Based Filtering) : ์‚ฌ์šฉ์ž๊ฐ€ ํŠน์ • ์•„์ดํ…œ์„ ๋งค์šฐ ์„ ํ˜ธํ•˜๋Š” ๊ฒฝ์šฐ, ๊ทธ ์•„์ดํ…œ๊ณผ ๋น„์Šทํ•œ ์ฝ˜ํ…์ธ ๋ฅผ ๊ฐ€์ง„ ๋‹ค๋ฅธ ์•„์ดํ…œ์„ ์ถ”์ฒœํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ๋†’์€ ํ‰์ ์„ ์ค€ ์•„์ดํ…œ๊ณผ ๋น„์Šทํ•œ ์ข…๋ฅ˜, ๋ฆฌ๋ทฐ ํ‚ค์›Œ๋“œ ๋“ฑ์˜ ๋‹ค์–‘ํ•œ ์ฝ˜ํ…์ธ ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ œํ’ˆ์„ ์ถ”์ฒœํ•ด ์ค€๋‹ค. 
  • ํ˜‘์—… ํ•„ํ„ฐ๋ง(Collaborative Filtering) : ์‚ฌ์šฉ์ž์˜ ํ–‰๋™, ํ™œ๋™ ๋˜๋Š” ์„ ํ˜ธ๋„์— ๋Œ€ํ•œ ๋งŽ์€ ์ •๋ณด๋ฅผ ๋ถ„์„ํ•˜๊ณ  ๋ชจ์•„ ๋‹ค๋ฅธ ์‚ฌ์šฉ์ž์™€์˜ ๋น„์Šทํ•จ์— ๊ธฐ์ดˆ๋ฅผ ๋‘๊ณ  ์‚ฌ์šฉ์ž๋“ค์ด ๋ฌด์—‡์„ ์ข‹์•„ํ•  ์ง€ ์˜ˆ์ธกํ•œ๋‹ค. ํ˜‘์—… ํ•„ํ„ฐ๋ง์€ Machine Analyzable Content์— ์˜์กดํ•˜์ง€ ์•Š์•„ ๊ทธ ์•„์ดํ…œ ์ž์ฒด๋ฅผ ์ •ํ™•ํ•˜๊ฒŒ ์ดํ•ดํ•˜์ง€ ์•Š์•„๋„ ์˜ํ™” ๊ฐ™์€ ๋ณต์žกํ•œ ์•„์ดํ…œ๋“ค์„ ์ถ”์ฒœํ•  ์ˆ˜ ์žˆ๋‹ค. ํ˜‘์—… ํ•„ํ„ฐ๋ง์€ ์ตœ๊ทผ์ ‘ ์ด์›ƒ(Nearest Neighbor) ํ˜‘์—… ํ•„ํ„ฐ๋ง๊ณผ ์ž ์žฌ์š”์ธ(Latent Factor) ํ˜‘์—… ํ•„ํ„ฐ๋ง์œผ๋กœ ๋‚˜๋‰œ๋‹ค.

 

 

 

728x90
Comments