μΌ | μ | ν | μ | λͺ© | κΈ | ν |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- μΈλμνλ§
- νμ΄μ¬
- ADsP
- λ°μ΄ν°λΆκ· ν
- λ 립νλ³Έ
- DBSCAN
- opencv
- iloc
- PCA
- ν¬λ‘€λ§
- Python
- dataframe
- μ€λ²μνλ§
- λμνλ³Έ
- λ°μ΄ν°λΆμμ€μ λ¬Έκ°
- λ°μ΄ν°λΆμ
- datascience
- λΉ λ°μ΄ν°λΆμκΈ°μ¬
- t-test
- κ΅°μ§ν
- pandas
- ADP
- LDA
- numpy
- μλν΄λΌμ°λ
- λ°μ΄ν°λΆμμ λ¬Έκ°
- Lambda
- ν μ€νΈλΆμ
- μ£Όμ±λΆλΆμ
- λΉ λ°μ΄ν°
Data Science LAB
[Python] κ΅μ°¨ λΆμ (μΉ΄μ΄μ κ³± κ²μ ) λ³Έλ¬Έ
[Python] κ΅μ°¨ λΆμ (μΉ΄μ΄μ κ³± κ²μ )
γ γ γ γ 2022. 8. 21. 03:362022.08.20 - [Python] μ΄μ λ°°μΉ λΆμ° λΆμ (Two-way ANOVA)
[Python] μ΄μ λ°°μΉ λΆμ° λΆμ (Two-way ANOVA)
Two - way ANOVA λΆμ° λΆμμμ νλμ μ’ μλ³μμ λν λ κ°μ λ 립λ³μ A, Bμ μν₯μ μμ보기 μν΄ μ¬μ©λλ κ²μ¦ λ°©λ² λ λ 립λ³μ μ¬μ΄μ μκ΄κ΄κ³κ° μλ μ§λ₯Ό μ΄ν΄λ³΄λ κ΅νΈμμ©μ λν κ²
suhye.tistory.com
μμ ν¬μ€ν νλ ANOVA λΆμμ μ’ μλ³μκ° μ°μν λ³μμμ§λ§, μΉ΄μ΄μ κ³± κ²μ μ μ’ μλ³μκ° λ²μ£Όν λ³μμΈ κ²½μ°μ μ¬μ©νλ ν΅κ³ κΈ°λ²μ΄λ€.
κ΅μ°¨ λΆμμ κ΅μ°¨νλ₯Ό ν΅ν΄ κ° μ μ κ΄μ°° λΉλμ κΈ°λ λΉλκ°μ μ°¨μ΄λ₯Ό κ²μ νλ κΈ°λ²μ΄λ€.
1. μ ν©μ± κ²μ
: κ° λ²μ£Όμ λ°λ₯Έ λ°μ΄ν°μ λΉλ λΆν¬κ° μ΄λ‘ μ μΌλ‘ κΈ°λνλ λΆν¬λ₯Ό λ°λ₯΄λ μ§λ₯Ό κ²μ
scipy.stats.chisquare(f_obs(λ°μ΄ν°νμ ), f_exp (κΈ°λλΉλ) = None, ddof=0, axis=0)
- κ·λ¬΄κ°μ€ : νμ΄νλ μμ‘΄μ μ€ λ¨μμ λΉμ¨μ΄ 50%, μ¬μμ λΉμ¨μ΄ 50%μ΄λ€.
- λ립κ°μ€ : νμ΄νλ μμ‘΄μ μ€ λ¨μμ λΉμ¨μ΄ 50%, μ¬μμ λΉμ¨μ΄ 50%κ° μλλ€.
import pandas as pd
df = pd.read_csv('../data/titanic.csv')
df.head()
df_t = df[df['survived'] == 1]
table = df_t[['sex']].value_counts()
table
μμ‘΄μ μ€ λ¨μκ° 109λͺ , μ¬μκ° 233λͺ μΈ κ²μ νμΈ
-> κΈ°λλμ : λ¨μ 171 / μ¬μ 171 (μ΄ν© 342λͺ )
from scipy.stats import chisquare
chi = chisquare(table, f_exp=[171,171])
print('μ ν©λ κ²μ \n', chi)
# μ ν©λ κ²μ
# Power_divergenceResult(statistic=44.95906432748538, pvalue=2.0119672574477235e-11)
μΉ΄μ΄μ κ³± ν΅κ³λμ 44.96, p-valueκ°μ 0.05λ³΄λ€ μμΌλ―λ‘ κ·λ¬΄κ°μ€ κΈ°κ° -> νμ΄νλνΈμ μμ‘΄ν λ¨μμ μ¬μμ λΉμ¨μ 50:50μ΄λΌκ³ ν μ μμ
2. λ λ¦½μ± κ²μ
λͺ¨μ§λ¨μ΄ λ λ³μ A, Bμ μν΄ λ²μ£Όν λμμ λ, μ΄ λ³μλ€ μ¬μ΄μ κ΄κ³κ° λ λ¦½μΈ μ§λ₯Ό κ²μ
scipy.stats.chi2_contingency((observed(κ΄μ°°λΉλ), correection=True, lambda_=None)
νμ΄νλ λ°μ΄ν°μμ μ’μ λ±κΈ(class)μ μμ‘΄μ¬λΆ(survived)κ° μλ‘ λ 립μΈμ§ κ²μ
- κ·λ¬΄κ°μ€ : classλ³μμ survived λ³μλ λ 립
- λ립κ°μ€ : classλ³μμ survived λ³μλ λ λ¦½μ΄ μλ
table = pd.crosstab(df['class'], df['survived'])
table
from scipy.stats import chi2_contingency
chi, p, df, expect = chi2_contingency(table)
print('Statics : ', chi)
print('p-value', p)
print('df : ',df)
print('expect : \n', expect)
- κ·λ¬΄κ°μ€ : classμ λΆν¬λ survivedμ κ΄κ³μμ΄ λμΌνλ€.
- λ립κ°μ€ : classμ λΆν¬λ survivedμ κ΄κ³μμ΄ λμΌνμ§ μλ€.
'π Machine Learning > κΈ°μ΄ ν΅κ³' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[Python] λ€ν νκ·λΆμ (Polynomial Regression) (0) | 2022.08.24 |
---|---|
[Python] μ ν νκ·λΆμ (0) | 2022.08.22 |
[Python] μ΄μ λ°°μΉ λΆμ° λΆμ (Two-way ANOVA) (0) | 2022.08.20 |
[Python] μΌμ λΆμ° λΆμ(ANOVA) (0) | 2022.03.16 |
[Python] λ 립 / λμ νλ³Έ t κ²μ (0) | 2022.03.15 |