250x250
Link
๋‚˜์˜ GitHub Contribution ๊ทธ๋ž˜ํ”„
Loading data ...
Notice
Recent Posts
Recent Comments
๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก๐Ÿ›  Machine Learning/ํ…์ŠคํŠธ ๋ถ„์„ (11)

Data Science LAB

[Python] ๋ฌธ์„œ ์œ ์‚ฌ๋„

๋ฌธ์„œ ์‚ฌ์ด์˜ ์œ ์‚ฌ๋„ ์ธก์ •์€ ์ฃผ๋กœ ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„(Cosine Similarity)๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ๋ฒกํ„ฐ์˜ ํฌ๊ธฐ ๋ณด๋‹ค๋Š” ๋ฒกํ„ฐ์˜ ์ƒํ˜ธ ๋ฐฉํ–ฅ์„ฑ์ด ์–ผ๋งˆ๋‚˜ ์œ ์‚ฌํ•œ์ง€์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ์ธก์ •ํ•œ๋‹ค. ๋‘ ๋ฒกํ„ฐ์˜ ์‚ฌ์ž‡๊ฐ์— ๋”ฐ๋ผ ์ƒํ™” ๊ด€๊ณ„๋Š” ์œ ์‚ฌํ•˜๊ฑฐ๋‚˜ ๊ด€๋ จ์ด ์—†๊ฑฐ๋‚˜ ์•„์˜ˆ ๋ฐ˜๋Œ€ ๊ด€๊ณ„๊ฐ€ ๋  ์ˆ˜ ์žˆ๋‹ค. ๋‘ ๋ฒกํ„ฐ A,B์˜ ๋‚ด์  ๊ฐ’์€ ๋‘ ๋ฒกํ„ฐ์˜ ํฌ๊ธฐ๋ฅผ ๊ฒ‚ํ•œ ๊ฐ’์— ์ฝ”์‚ฌ์ธ ๊ฐ๋„ ๊ฐ’์„ ๊ณฑํ•œ ๊ฐ’์ด๋‹ค. ๋”ฐ๋ผ์„œ ์œ ์‚ฌ๋„(similarity)๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋‘ ๋ฒกํ„ฐ์˜ ๋‚ด์ ์„ ์ด ๋ฒกํ„ฐ ํฌ๊ธฐ์˜ ํ•ฉ์œผ๋กœ ๋‚˜๋ˆˆ ๊ฒƒ์ด๋‹ค. ๋‘ ๋„˜ํŒŒ์ด ๋ฐฐ์—ด์— ๋Œ€ํ•œ ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„ ๊ตฌํ•˜๋Š” ํ•จ์ˆ˜ ์ƒ์„ฑ import numpy as np def cos_similarity(v1,v2): dot_product = np.dot(v1,v2) l2_norm = (np.sqrt(sum(np.square(v1..

[Python] ํ† ํ”ฝ ๋ชจ๋ธ๋ง (20 ๋‰ด์Šค๊ทธ๋ฃน)

Topic Modeling ํ† ํ”ฝ ๋ชจ๋ธ๋ง์ด๋ž€ ๋ฌธ์„œ ์ง‘ํ•ฉ์— ์ˆจ์–ด ์žˆ๋Š” ์ฃผ์ œ๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๊ฒƒ์ด๋‹ค. ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ํ† ํ”ฝ ๋ชจ๋ธ์€ ์ˆจ๊ฒจ์ง„ ์ฃผ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ์ค‘์‹ฌ ๋‹จ์–ด๋ฅผ ํ•จ์ถ•์ ์œผ๋กœ ์ถ”์ถœํ•ด๋‚ธ๋‹ค. ํ† ํ”ฝ๋ชจ๋ธ๋ง์—์„œ๋Š” LDA(Latent Dirichlet Allocation)์„ ์ฃผ๋กœ ํ™œ์šฉํ•œ๋‹ค. ํ”ํžˆ ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ์‚ฌ์šฉํ•˜๋Š” LDA(Linear Discriminant Analysis)์™€๋Š” ๋‹ค๋ฅธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋ฏ€๋กœ ์ฃผ์˜ํ•ด์•ผํ•œ๋‹ค. ๊ธฐ๋ณธ ๋ฐ์ดํ„ฐ์…‹์ธ 20๋‰ด์Šค๊ทธ๋ฃน ๋ฐ์ดํ„ฐ ์…‹์„ ์ด์šฉํ•˜์—ฌ ํ† ํ”ฝ๋ชจ๋ธ๋ง์„ ์ง„ํ–‰ํ•ด๋ณด๋ ค๊ณ  ํ•œ๋‹ค. 20๋‰ด์Šค๊ทธ๋ฃน ๋ฐ์ดํ„ฐ์…‹์—๋Š” 20๊ฐ€์ง€์˜ ์ฃผ์ œ๋ฅผ ๊ฐ€์ง„ ๋‰ด์Šค๊ทธ๋ฃน์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋Š”๋ฐ, ๊ทธ ์ค‘ 8๊ฐœ์˜ ์ฃผ์ œ๋ฅผ ์ถ”์ถœํ•˜๊ณ , ์ด๋“ค ํ…์ŠคํŠธ์— LDA ๊ธฐ๋ฐ˜์˜ ํ† ํ”ฝ ๋ชจ๋ธ๋ง์„ ์ ์šฉํ•ด๋ณด๋ ค๊ณ  ํ•œ๋‹ค. ํ•„์š”ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๋กœ๋”ฉ ํ›„ ์นดํ…Œ๊ณ ๋ฆฌ ์ถ”์ถœ f..

[Python] ๊ฐ์„ฑ๋ถ„์„ - ๋น„์ง€๋„ ํ•™์Šต

์ด์ „ ํฌ์ŠคํŒ…(์ง€๋„ํ•™์Šต)์— ์ด์–ด์„œ ๋น„์ง€๋„ ํ•™์Šต์˜ ๊ฐ์„ฑ ๋ถ„์„๊นŒ์ง€ ๊ณต๋ถ€ํ•ด ๋ณด๋ ค๊ณ  ํ•œ๋‹ค! https://suhye.tistory.com/entry/mn?category=1040378 [Python] ๊ฐ์„ฑ ๋ถ„์„(Sentiment Analysis) - ์ง€๋„ํ•™์Šต ๊ฐ์„ฑ๋ถ„์„ ์ด๋ž€? ๊ฐ์„ฑ๋ถ„์„์ด๋ž€ ๋ฌธ์„œ์˜ ์ฃผ๊ด€์ ์ธ ๊ฐ์„ฑ/์˜๊ฒฌ/๊ฐ์ •/๊ธฐ๋ถ„ ๋“ฑ์„ ํŒŒ์•…ํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ, ์†Œ์…œ๋ฏธ๋””์–ด๋‚˜ ์—ฌ๋ก ์กฐ์‚ฌ, ์˜จ๋ผ์ธ ๋ฆฌ๋ทฐ ๋“ฑ ๋‹ค์–‘ํ•œ ๋ถ„์•ผ์—์„œ ํ™œ์šฉ๋˜๊ณ  ์žˆ๋‹ค. ๋ฌธ์„œ์˜ ๊ธ€์ž๊ฐ€ ๋‚˜ํƒ€ suhye.tistory.com ๋น„์ง€๋„ํ•™์Šต ๊ธฐ๋ฐ˜ ๊ฐ์„ฑ ๋ถ„์„์€ ์‚ฌ์ „(Lexicon)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•™์Šตํ•œ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ๊ฐ์„ฑ ๋ถ„์„ ๋ฐ์ดํ„ฐ์…‹์€ ๋ ˆ์ด๋ธ”์„ ๊ฐ–๊ณ  ์žˆ์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— Lexicon์ด ์œ ์šฉํ•˜๊ฒŒ ์‚ฌ์šฉ๋œ๋‹ค. Lexicon์€ ๊ธ์ • ๊ฐ์„ฑ ๋˜๋Š” ๋ถ€์ • ๊ฐ์„ฑ์˜ ์ •๋„๋ฅผ ์˜๋ฏธํ•˜๋Š” ์ˆ˜์น˜๋ฅผ ๊ฐ€์ง€..