250x250
Link
๋‚˜์˜ GitHub Contribution ๊ทธ๋ž˜ํ”„
Loading data ...
Notice
Recent Posts
Recent Comments
๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก๐Ÿ›  Machine Learning/๊ธฐ์ดˆ ํ†ต๊ณ„ (9)

Data Science LAB

[Python] ํƒ์ƒ‰์  ์š”์ธ๋ถ„์„ (FA)

ํƒ์ƒ‰์  ์š”์ธ๋ถ„์„ - ์š”์ธ๋ถ„์„ (FA)์€ ๊ด€์ฐฐ๋œ ๋ณ€์ˆ˜ ์ง‘ํ•ฉ์—์„œ ๊ฐ€์žฅ ์˜ํ–ฅ๋ ฅ ์žˆ๋Š” ๊ธฐ๋ณธ ์š”์ธ ๋˜๋Š” ์ž ์žฌ ๋ณ€์ˆ˜๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” ํƒ์ƒ‰์  ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ฐฉ๋ฒ•์ด๋‹ค . - ๋ณ€์ˆ˜ ์ˆ˜๋ฅผ ์ค„์—ฌ ๋ฐ์ดํ„ฐ ํ•ด์„์— ๋„์›€์„ ์ค€๋‹ค. - ๋ชจ๋“  ๋ณ€์ˆ˜์—์„œ ์ตœ๋Œ€ ๊ณต๋ถ„์‚ฐ์„ ์ถ”์ถœํ•˜์—ฌ ๊ณตํ†ต ์ ์ˆ˜์— ๋„ฃ๋Š”๋‹ค. - ์š”์ธ ๋ถ„์„์€ ์‹œ์žฅ ์กฐ์‚ฌ, ๊ด‘๊ณ , ์‹ฌ๋ฆฌํ•™, ๊ธˆ์œต ๋ฐ ์šด์˜ ์—ฐ๊ตฌ์— ๋„๋ฆฌ ์‚ฌ์šฉ๋จ ํƒ์ƒ‰์  ์š”์ธ ๋ถ„์„ ๋ฐฉ๋ฒ• 1. ๋ณ€์ˆ˜๊ฐ„์˜ ์ƒ๊ด€ํ–‰๋ ฌ๋กœ๋ถ€ํ„ฐ ๊ณตํ†ต ์š”์ธ ๋„์ถœ 2. ๊ณตํ†ต ์š”์ธ์„ ์ด์šฉํ•ด ๋ณ€์ˆ˜๊ฐ„์˜ ์ƒ๊ด€๊ด€๊ณ„ ์„ค๋ช… 3. ์š”์ธ ๋ถ€ํ•˜๋Ÿ‰(factor loading)์ด ์ ˆ๋Œ“๊ฐ’ 0.3 ์ด์ƒ์ด๋ฉด ์œ ์˜ํ•˜๋‹ค๊ณ  ํŒ๋‹จ ํƒ์ƒ‰์  ์š”์ธ ๋ถ„์„์˜ ๋ชฉ์  1. ์ž๋ฃŒ ์š”์•ฝ : ๋ณ€์ˆ˜๋“ค์„ ๋ช‡๊ฐœ์˜ ๊ณตํ†ต๋œ ๋ณ€์ธ์œผ๋กœ ๋ฌถ์Œ 2. ์ถœ์ •๋„๊ตฌ ํƒ€๋‹น์„ฑ ๊ฒ€์ • : ๋ณ€์ธ๋“ค์ด ๋™์ผํ•œ ์š”์ธ์œผ๋กœ ๋ฌถ์ด๋Š”์ง€๋ฅผ ํ™•์ธ 3...

[Python] ๋‹คํ•ญ ํšŒ๊ท€๋ถ„์„ (Polynomial Regression)

๋ฐ์ดํ„ฐ๊ฐ€ ๋‹จ์ˆœํ•œ ์ง์„  ํ˜•ํƒœ๊ฐ€ ์•„๋‹Œ ๋น„์„ ํ˜•์˜ ํ˜•ํƒœ๋ฅผ ๊ฐ–๊ณ  ์žˆ์„ ๋•Œ, ๊ฐ ๋ณ€์ˆ˜์˜ ๊ฑฐ๋“ญ ์ œ๊ณฑ์„ ์ƒˆ๋กœ์šด ๋ณ€์ˆ˜๋กœ ์ถ”๊ฐ€ํ•˜๋ฉด ์„ ํ˜• ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ™•์žฅ๋œ ํŠน์„ฑ์„ ๋ฐ์ดํ„ฐ ์„ธํŠธ์— ์„ ํ˜• ๋ชจ๋ธ๋กœ ํ›ˆ๋ จ ์‹œํ‚ค๋Š” ๊ธฐ๋ฒ•์„ ๋‹คํ•ญํšŒ๊ท€๋ผ๊ณ ํ•œ๋‹ค. 1. ๋‹คํ•ญ ๋ณ€์ˆ˜ ์ƒ์„ฑ PolynomialFeatures(degree=d)๋ฅผ ํ™œ์šฉํ•ด ๋ณ€์ˆ˜ ํŠน์„ฑ์„ ๊ฑฐ๋“ญ์ œ๊ณฑ์œผ๋กœ ๋ณ€ํ™˜ class sklearn.preprocessing.PolynomialFeatures(degree=2, interaction_only=False, include_bias = True, order='C') - ๋งค๊ฐœ๋ณ€์ˆ˜ degree : ๋‹คํ•ญ์‹์˜ ์ฐจ์ˆ˜ ๊ฒฐ์ • (default=2) interaction_only : ๊ต์ฐจํ•ญ์„ ์ถ”๊ฐ€ํ• ์ง€ ์—ฌ๋ถ€ ๊ฒฐ์ • (False์ธ ๊ฒฝ์šฐ ๊ต์ฐจํ•ญ๊ณผ ๋™์ผํ•œ ..

[Python] ์„ ํ˜• ํšŒ๊ท€๋ถ„์„

ํ•˜๋‚˜ ํ˜น์€ ๊ทธ ์ด์ƒ์˜ ์›์ธ์ด ์ข…์†๋ณ€์ˆ˜์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์ถ”์ ํ•˜์—ฌ ์‹์œผ๋กœ ํ‘œํ˜„ํ•˜๋Š” ํ†ต๊ณ„๊ธฐ๋ฒ•์œผ๋กœ ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๋‹ค๋ฅด๊ฒŒ ์‹์œผ๋กœ ํ‘œํ˜„ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํ•ด์„๋ ฅ์„ ๋†’์ผ ์ˆ˜ ์žˆ๋‹ค. ์„ ํ˜• ํšŒ๊ท€๋ถ„์„์˜ ํ‰๊ฐ€ SST : ์ด๋ณ€๋™ SSE : ์„ค๋ช…๋œ ๋ณ€๋™ SSR : ์„ค๋ช…๋˜์ง€ ์•Š์€ ๋ณ€๋™์„ ์˜๋ฏธ ์œ„์˜ ์ˆ˜์‹์ด ์˜๋ฏธํ•˜๋Š” ๋ฐ”๋Š” ์ด ๋ณ€๋™ ์ค‘ ์„ค๋ช…๋œ ๋ณ€๋™์˜ ๋น„์œจ์ด๋‹ค. ์ฆ‰, ํšŒ๊ท€ ์ถ”์ •์„ ์ด ์ „์ฒด ๋ฐ์ดํ„ฐ๋ฅผ ์–ผ๋งˆ๋‚˜ ์„ค๋ช…ํ•˜๊ณ  ์žˆ๋Š”์ง€๋ฅผ ์˜๋ฏธํ•˜๋ฉฐ ์ด ๊ฐ’์ด ๋†’๋‹ค๋ฉด ํšŒ๊ท€ ์ถ”์ • ์ง์„ ์œผ๋กœ ์ƒˆ๋กœ์šด ๊ฐ’์„ ์˜ˆ์ธกํ•˜๊ฑฐ๋‚˜ ์ถ”์ •ํ•˜๋”๋ผ๋„ ๋ฏฟ์„ ์ˆ˜ ์žˆ๋Š” ์ •๋„๋ฅผ ์˜๋ฏธํ•œ๋‹ค. RMSE ๊ฐ’์€ ํ‰๊ท  ์ œ๊ณฑ๊ทผ ์˜ค์ฐจ๋กœ ์˜ˆ์ธก๊ฐ’์—์„œ ์‹ค์ œ ๊ด€์ธก๊ฐ’์„ ๋บ€ ๊ฐ’์˜ ์ œ๊ณฑ์˜ ํ•ฉ์„ ํ‘œ๋ณธ์˜ ์ˆ˜๋กœ ๋‚˜๋ˆˆ ๊ฒƒ์ด๋‹ค. SSE๊ฐ’์„ ์ž์œ ๋„ (n-2)๋กœ ๋‚˜๋ˆ„๊ณ  ๋ฃจํŠธ๋ฅผ ์ทจํ•œ ๊ฐ’๊ณผ ๊ฐ™๋‹ค. RMSE ๊ฐ’์ด ๋‚ฎ์„ ์ˆ˜๋ก ์˜ˆ์ธก๋ ฅ์ด ์ข‹๋‹ค๊ณ  ํ•  ์ˆ˜ ..

[Python] ๊ต์ฐจ ๋ถ„์„ (์นด์ด์ œ๊ณฑ ๊ฒ€์ •)

2022.08.20 - [Python] ์ด์› ๋ฐฐ์น˜ ๋ถ„์‚ฐ ๋ถ„์„ (Two-way ANOVA) [Python] ์ด์› ๋ฐฐ์น˜ ๋ถ„์‚ฐ ๋ถ„์„ (Two-way ANOVA) Two - way ANOVA ๋ถ„์‚ฐ ๋ถ„์„์—์„œ ํ•˜๋‚˜์˜ ์ข…์†๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๋‘ ๊ฐœ์˜ ๋…๋ฆฝ๋ณ€์ˆ˜ A, B์˜ ์˜ํ–ฅ์„ ์•Œ์•„๋ณด๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ๊ฒ€์ฆ ๋ฐฉ๋ฒ• ๋‘ ๋…๋ฆฝ๋ณ€์ˆ˜ ์‚ฌ์ด์— ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์žˆ๋Š” ์ง€๋ฅผ ์‚ดํŽด๋ณด๋Š” ๊ตํ˜ธ์ž‘์šฉ์— ๋Œ€ํ•œ ๊ฒ€ suhye.tistory.com ์•ž์„œ ํฌ์ŠคํŒ… ํ–ˆ๋˜ ANOVA ๋ถ„์„์€ ์ข…์†๋ณ€์ˆ˜๊ฐ€ ์—ฐ์†ํ˜• ๋ณ€์ˆ˜์˜€์ง€๋งŒ, ์นด์ด์ œ๊ณฑ ๊ฒ€์ •์€ ์ข…์†๋ณ€์ˆ˜๊ฐ€ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜์ธ ๊ฒฝ์šฐ์— ์‚ฌ์šฉํ•˜๋Š” ํ†ต๊ณ„ ๊ธฐ๋ฒ•์ด๋‹ค. ๊ต์ฐจ ๋ถ„์„์€ ๊ต์ฐจํ‘œ๋ฅผ ํ†ตํ•ด ๊ฐ ์…€์˜ ๊ด€์ฐฐ ๋นˆ๋„์™€ ๊ธฐ๋Œ€ ๋นˆ๋„๊ฐ„์˜ ์ฐจ์ด๋ฅผ ๊ฒ€์ •ํ•˜๋Š” ๊ธฐ๋ฒ•์ด๋‹ค. 1. ์ ํ•ฉ์„ฑ ๊ฒ€์ • : ๊ฐ ๋ฒ”์ฃผ์— ๋”ฐ๋ฅธ ๋ฐ์ดํ„ฐ์˜ ๋นˆ๋„ ๋ถ„ํฌ๊ฐ€ ์ด๋ก ์ ์œผ๋กœ ๊ธฐ๋Œ€ํ•˜๋Š” ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด..

[Python] ์ด์› ๋ฐฐ์น˜ ๋ถ„์‚ฐ ๋ถ„์„ (Two-way ANOVA)

Two - way ANOVA ๋ถ„์‚ฐ ๋ถ„์„์—์„œ ํ•˜๋‚˜์˜ ์ข…์†๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๋‘ ๊ฐœ์˜ ๋…๋ฆฝ๋ณ€์ˆ˜ A, B์˜ ์˜ํ–ฅ์„ ์•Œ์•„๋ณด๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ๊ฒ€์ฆ ๋ฐฉ๋ฒ• ๋‘ ๋…๋ฆฝ๋ณ€์ˆ˜ ์‚ฌ์ด์— ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์žˆ๋Š” ์ง€๋ฅผ ์‚ดํŽด๋ณด๋Š” ๊ตํ˜ธ์ž‘์šฉ์— ๋Œ€ํ•œ ๊ฒ€์ฆ์ด ๋ฐ˜๋“œ์‹œ ์ง„ํ–‰๋˜์–ด์•ผ ํ•œ๋‹ค. ์ง‘๋‹จ์˜ ์ธก์ •์น˜๋Š” ๋…๋ฆฝ์  ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฆ„ ๋“ฑ๋ถ„์‚ฐ์„ฑ ๊ท€๋ฌด๊ฐ€์„ค (H0) - ๋ณ€์ˆ˜ A์— ๋”ฐ๋ฅธ ์ข…์† ๋ณ€์ˆ˜์˜ ๊ฐ’์—๋Š” ์ฐจ์ด๊ฐ€ ์—†๋‹ค. - ๋ณ€์ˆ˜ B์— ๋”ฐ๋ฅธ ์ข…์† ๋ณ€์ˆ˜์˜ ๊ฐ’์—๋Š” ์ฐจ์ด๊ฐ€ ์—†๋‹ค. - ๋ณ€์ˆ˜ A, B์˜ ๊ตํ˜ธ์ž‘์šฉ์€ ์—†๋‹ค. ๋Œ€๋ฆฝ๊ฐ€์„ค (H1) - ๋ณ€์ˆ˜ A์— ๋”ฐ๋ฅธ ์ข…์† ๋ณ€์ˆ˜์˜ ๊ฐ’์—๋Š” ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค. - ๋ณ€์ˆ˜ B์— ๋”ฐ๋ฅธ ์ข…์† ๋ณ€์ˆ˜์˜ ๊ฐ’์—๋Š” ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค. - ๋ณ€์ˆ˜ A, B์˜ ๊ตํ˜ธ์ž‘์šฉ์€ ์žˆ๋‹ค. ์˜ˆ์‹œ mtcars = pd.read_csv('../data/mtcars.csv') mtcars.head(..