250x250
Link
๋‚˜์˜ GitHub Contribution ๊ทธ๋ž˜ํ”„
Loading data ...
Notice
Recent Posts
Recent Comments
๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก๐Ÿ›  Machine Learning/Clustering (5)

Data Science LAB

[Python] DBSCAN

DBSCAN DBSCAN์€ ๋ฐ€๋„ ๊ธฐ๋ฐ˜์˜ ๊ตฐ์ง‘ํ™” ๋Œ€ํ‘œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. ๊ฐ„๋‹จํ•˜๊ณ  ์ง๊ด€์ ์ธ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๊ฐ€ ๊ธฐํ•˜ํ•™์ ์œผ๋กœ ๋ณต์žกํ•œ ๊ฒฝ์šฐ์—๋„ ํšจ๊ณผ์ ์œผ๋กœ ๊ตฐ์ง‘ํ™”ํ•  ์ˆ˜ ์žˆ๋‹ค. ์œ„์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ์›ํ˜•์˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๋ฅผ ๋„๋Š” ๊ฒฝ์šฐ, KMeans ๋‚˜ GMM์€ ๊ตฐ์ง‘ํ™”๋ฅผ ์ž˜ ์ˆ˜ํ–‰ํ•˜์ง€ ๋ชปํ•œ๋‹ค. ์ž…์‹ค๋ก  ์ฃผ๋ณ€ ์˜์—ญ(epsilon) : ๊ฐœ๋ณ„ ๋ฐ์ดํ„ฐ๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ์ž…์‹ค๋ก  ๋ฐ˜๊ฒฝ์„ ๊ฐ€์ง€๋Š” ์›ํ˜•์˜ ์˜์—ญ ์ตœ์†Œ ๋ฐ์ดํ„ฐ ๊ฐœ์ˆ˜(min points) : ๊ฐœ๋ณ„ ๋ฐ์ดํ„ฐ์˜ ์ฃผ๋ณ€ ์˜์—ญ์— ํฌํ•จ๋˜๋Š” ํƒ€ ๋ฐ์ดํ„ฐ์˜ ๊ฐœ์ˆ˜ ์ž…์‹ค๋ก  ์ฃผ๋ณ€ ์˜์—ญ ๋‚ด์— ํฌํ•จ๋˜๋Š” ์ตœ์†Œ ๋ฐ์ดํ„ฐ ๊ฐœ์ˆ˜๋ฅผ ์ถฉ์กฑ์‹œํ‚ค๋Š”๊ฐ€์— ๋”ฐ๋ผ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๋ฅผ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜ํ•œ๋‹ค. ํ•ต์‹ฌ ํฌ์ธํŠธ(Core Point) : ์ฃผ๋ณ€ ์˜์—ญ ๋‚ด์— ์ตœ์†Œ ๋ฐ์ดํ„ฐ ๊ฐœ์ˆ˜ ์ด์ƒ์˜ ํƒ€ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์„ ๊ฒฝ์šฐ, ํ•ด๋‹น ๋ฐ์ดํ„ฐ๋ฅผ ์˜๋ฏธ ..

[python] GMM(Gaussian Mixture Model)

GMM GMM ๊ตฐ์ง‘ํ™”๋Š” ๊ตฐ์ง‘ํ™”๋ฅผ ์ ์šฉํ•˜๊ณ ์ž ํ•˜๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ๋“ค์ด ์„ž์—ฌ์„œ ์ƒ์„ฑ๋œ ๊ฒƒ์ด๋ผ๋Š” ๊ฐ€์ •ํ•˜์— ๊ตฐ์ง‘ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค. ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋Š” ์ •๊ทœ ๋ถ„ํฌ(Normal distribution)๋ผ๊ณ ๋„ ํ•˜๋ฉฐ, ์ขŒ์šฐ ๋Œ€์นญํ˜•์˜ ์ข… ํ˜•ํƒœ์ด๋‹ค. GMM์€ ๋ฐ์ดํ„ฐ๋ฅผ ์—ฌ๋Ÿฌ๊ฐœ์˜ ์ •๊ทœ ๋ถ„ํฌ๊ฐ€ ์„ž์ธ ๊ฒƒ์œผ๋กœ ๊ฐ„์ฃผํ•˜์—ฌ ์„ž์ธ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ์—์„œ ๊ฐœ๋ณ„ ์œ ํ˜•์˜ ์ •๊ทœ ๋ถ„ํฌ๋ฅผ ์ถ”์ถœํ•œ๋‹ค. ์ „์ฒด ๋ฐ์ดํ„ฐ ์…‹์€ ์„œ๋กœ ๋‹ค๋ฅธ ์ •๊ทœ ๋ถ„ํฌ ํ˜•ํƒœ๋ฅผ ๊ฐ€์ง„ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ํ™•๋ฅ  ๋ถ„ํฌ ๊ณก์„ ์œผ๋กœ ๊ตฌ์„ฑ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋ ‡๊ฒŒ ์„œ๋กœ ๋‹ค๋ฅธ ์ •๊ทœ ๋ถ„ํฌ์— ๊ธฐ๋ฐ˜ํ•˜์—ฌ ๊ตฐ์ง‘ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์ด GMM ๊ตฐ์ง‘ํ™” ๋ฐฉ์‹์ด๋‹ค. GMM์„ ์ด์šฉํ•œ iris ๋ฐ์ดํ„ฐ์…‹ ๊ตฐ์ง‘ํ™” from sklearn.datasets import load_iris from sklearn..

[Python] ํ‰๊ท  ์ด๋™

Mean Shift ํ‰๊ท  ์ด๋™(Mean Shift)์€ KMeans์™€ ์œ ์‚ฌํ•˜๊ฒŒ ์ค‘์‹ฌ์„ ๊ตฐ์ง‘์˜ ์ค‘์‹ฌ์œผ๋กœ ์ง€์†์ ์œผ๋กœ ์›€์ง์ด๋ฉด์„œ ๊ตฐ์ง‘ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•œ๋‹ค. KMeans๋Š” ์ค‘์‹ฌ์— ์†Œ์†๋œ ๋ฐ์ดํ„ฐ์˜ ํ‰๊ท  ๊ฑฐ๋ฆฌ ์ค‘์‹ฌ์œผ๋กœ ์ด๋™ํ•˜์ง€๋งŒ, ํ‰๊ท  ์ด๋™์€ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ์—ฌ ์žˆ๋Š” ๋ฐ€๋„๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๊ณณ์œผ๋กœ ์ด๋™์‹œํ‚จ๋‹ค. ํ‰๊ท  ์ด๋™ ๊ตฐ์ง‘ํ™”๋Š” ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๋„๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ตฐ์ง‘์˜ ์ค‘์‹ฌ์ ์„ ์ฐพ๋Š”๋‹ค. ๊ตฐ์ง‘ ์ค‘์‹ฌ์ ์€ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๊ฐ€ ๋ชจ์—ฌ ์žˆ๋Š” ๊ณณ์ด๋ผ๋Š” ์ƒ๊ฐ์—์„œ ์ฐฉ์•ˆํ•œ ๊ฒƒ์ด๋ฉฐ ์ด๋ฅผ ์œ„ํ•ด ํ™•๋ฅ  ๋ฐ€๋„ ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•œ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ์ฃผ์–ด์ง„ ๋ชจ๋ธ์˜ ํ™•๋ฅ  ๋ฐ€๋„ ํ•จ์ˆ˜๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด KDE(Kernel Density Estimation)๋ฅผ ์ด์šฉํ•œ๋‹ค. ํŠน์ • ๋ฐ์ดํ„ฐ ๋ฐ˜๊ฒฝ ๋‚ด์˜ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ํ™•๋ฅ  ๋ฐ€๋„๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๊ณณ์œผ๋กœ ์ด๋™ํ•˜๊ธฐ ์œ„ํ•ด์„œ ์ฃผ๋ณ€ ๋ฐ์ดํ„ฐ์™€์˜ ๊ฑฐ๋ฆฌ ๊ฐ’์„ KDE ํ•จ์ˆ˜์˜ ์ž…..

[Python] ๊ตฐ์ง‘ ํ‰๊ฐ€(์‹ค๋ฃจ์—ฃ ๊ณ„์ˆ˜)

Clustering Evaluation iris ๋ฐ์ดํ„ฐ์…‹์—๋Š” ๊ฒฐ๊ณผ๊ฐ’์— ํ’ˆ์ข…์„ ์˜๋ฏธํ•˜๋Š” ํƒ€๊นƒ ๋ ˆ์ด๋ธ”์ด ์žˆ์–ด ๊ตฐ์ง‘ํ™”๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ž˜ ์ด๋ฃจ์–ด์ ธ ์žˆ๋Š” ์ง€ ํŒ๋‹จํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋Œ€๋ถ€๋ถ„์˜ ๊ตฐ์ง‘ํ™” ๋ฐ์ดํ„ฐ์…‹์—๋Š” ํƒ€๊นƒ ๋ ˆ์ด๋ธ”์ด ์กด์žฌํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์—, ๋ฐ์ดํ„ฐ ๋‚ด์— ์ˆจ์–ด ์žˆ๋Š” ๋ณ„๋„์˜ ๊ทธ๋ฃน์„ ์ฐพ์•„ ์˜๋ฏธ๋ฅผ ๋ถ€์—ฌํ•˜๊ณ ๋‚˜, ๋™์ผํ•œ ๋ถ„๋ฅ˜ ๊ฐ’์— ์†ํ•˜๋”๋ผ๋„ ๊ทธ ์•ˆ์—์„œ ๋” ์„ธ๋ถ„ํ™”๋œ ๊ตฐ์ง‘ํ™”๋ฅผ ์ถ”๊ตฌํ•˜๊ฑฐ๋‚˜, ์„œ๋กœ ๋‹ค๋ฅธ ๋ถ„๋ฅ˜๊ฐ’์˜ ๋ฐ์ดํ„ฐ๋„ ๋” ๋„“์€ ๊ตฐ์ง‘ํ™” ๋ ˆ๋ฒจํ™” ๋“ฑ์˜ ์˜์—ญ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ๋น„์ง€๋„ํ•™์Šต์˜ ํŠน์„ฑ ์ƒ ์ •ํ™•ํ•˜๊ฒŒ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ๋Š” ์–ด๋ ต์ง€๋งŒ, ๊ตฐ์ง‘ํ™”์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ ์‹ค๋ฃจ์—ฃ ๋ถ„์„์„ ์‚ฌ์šฉํ•œ๋‹ค. Silhouette analysis ์‹ค๋ฃจ์—ฃ ๋ถ„์„์ด๋ž€ ๊ฐ ๊ตฐ์ง‘ ๊ฐ„์˜ ๊ฑฐ๋ฆฌ๊ฐ€ ์–ผ๋งˆ๋‚˜ ํšจ์œก์ ์œผ๋กœ ๋ถ„๋ฆฌ๋˜์–ด ์žˆ๋Š” ์ง€๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ํšจ์œจ์ ์œผ๋กœ ๋ถ„..

[Python] KMeans Clustering(K-ํ‰๊ท  ๊ตฐ์ง‘ํ™”)

KMeans Clustering์ด๋ž€? ๊ฐ€์žฅ ์ž์ฃผ ์‚ฌ์šฉ๋˜๋Š” ๊ตฐ์ง‘ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ, ๋ฐ์ดํ„ฐ์…‹์„ K๊ฐœ์˜ ๊ตฐ์ง‘์œผ๋กœ ๊ตฐ์ง‘ํ™”ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. ์ž„์˜์˜ ๊ตฐ์ง‘ ์ค‘์‹ฌ์  ๊ฐœ์ˆ˜(K)๋ฅผ ์„ค์ •ํ•˜์—ฌ ํ•ด๋‹น ์ค‘์‹ฌ์— ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์„ ํƒํ•œ๋‹ค. ๊ตฐ์ง‘ ์ค‘์‹ฌ์ ์€ ์„ ํƒ๋œ ๋ฐ์ดํ„ฐ์˜ ํ‰๊ท  ์ง€์ ์œผ๋กœ ์ด๋™ํ•˜๊ณ , ์ด๋™๋œ ์ค‘์‹ฌ์ ์—์„œ ๋‹ค์‹œ ๊ฐ€๊นŒ์šด ํฌ์ธํŠธ๋ฅผ ์„ ํƒ, ๋‹ค์‹œ ์ค‘์‹ฌ์ ์„ ํ‰๊ท  ์ง€์ ์œผ๋กœ ์ด๋™ํ•˜๋Š” ํ”„๋กœ์„ธ์Šค๋ฅผ ๋ฐ˜๋ณต์ ์œผ๋กœ ์ˆ˜ํ–‰ํ•œ๋‹ค. ๋”์ด์ƒ ์ค‘์‹ฌ์ ์˜ ์ด๋™์ด ์—†์„ ๋•Œ๊นŒ์ง€ ๋ฐ˜๋ณต์„ ๊ณ„์†ํ•œ๋‹ค. KMeans Process 1. ๊ตฐ์ง‘ํ™”์˜ ๊ธฐ์ค€์ด ๋˜๋Š” ์ค‘์‹ฌ์„ ๊ตฌ์„ฑํ•˜๋ ค๋Š” ๊ตฐ์ง‘์˜ ๊ฐœ์ˆ˜๋งŒํผ ์ž„์˜์˜ ์œ„์น˜์— ๊ฐ€์ ธ๋‹ค ๋†“์Œ 2. ๊ฐ ๋ฐ์ดํ„ฐ๋Š” ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ๊ณณ์— ์œ„์น˜ํ•œ ์ค‘์‹ฌ์ ์— ์†Œ์† 3. ๊ฐ ๋ฐ์ดํ„ฐ์˜ ์†Œ์†์ด ๊ฒฐ์ •๋˜๋ฉด ๊ตฐ์ง‘ ์ค‘์‹ฌ์ ์„ ์†Œ์†๋œ ๋ฐ์ดํ„ฐ์˜ ํ‰๊ท  ์ค‘์‹ฌ์œผ๋กœ ์ด๋™ 4. ๋ฐ”๋€ ์ค‘์‹ฌ..