μΌ | μ | ν | μ | λͺ© | κΈ | ν |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- PCA
- λμνλ³Έ
- λ 립νλ³Έ
- λΉ λ°μ΄ν°λΆμκΈ°μ¬
- μΈλμνλ§
- μ£Όμ±λΆλΆμ
- DBSCAN
- pandas
- νμ΄μ¬
- κ΅°μ§ν
- λ°μ΄ν°λΆκ· ν
- opencv
- ADP
- ν¬λ‘€λ§
- ADsP
- μλν΄λΌμ°λ
- μ€λ²μνλ§
- λ°μ΄ν°λΆμμ€μ λ¬Έκ°
- Lambda
- λΉ λ°μ΄ν°
- iloc
- numpy
- Python
- λ°μ΄ν°λΆμμ λ¬Έκ°
- LDA
- λ°μ΄ν°λΆμ
- ν μ€νΈλΆμ
- dataframe
- datascience
- t-test
Data Science LAB
[Python] OverSampling/UnderSampling λ³Έλ¬Έ
[Python] OverSampling/UnderSampling
γ γ γ γ 2022. 3. 14. 19:07λ μ΄λΈμ λΆν¬κ° λΆκ· νν λ°μ΄ν°μ μ νμ΅μν¬ λ μμΈ‘ μ±λ₯μ λ¬Έμ κ° λ°μν μ μλλ°, μ΄λ μ΄μμΉ λ μ΄λΈμ΄ μ μ λ μ΄λΈμ λ°μ΄ν° 건μμ λΉν΄ λ무 μ κΈ° λλ¬Έμ λ°μνλ νμμ΄λ€. μ¦, μ΄μ λ μ΄λΈμ λ°μ΄ν°λ λ§€μ° μ κΈ° λλ¬Έμ λ€μν μ νμ νμ΅νμ§ λͺ»νλ λ°λ©΄ μ μ λ μ΄λΈμ λ°μ΄ν° 건μλ λ§€μ° λ§μ μΌλ°©μ μΌλ‘ μ μ λ μ΄λΈμ μΉμ°μΉ νμ΅μ μνν΄ μ λλ‘λ μ΄μ λ°μ΄ν° κ²μΆμ΄ μ΄λ €μμ§λ€. μ΄λ¬ν λ¬Έμ μ μ ν΄κ²°νκΈ° μν λ°©λ²μΌλ‘ μ€λ²μνλ§/μΈλμνλ§μ λ°©λ²μ΄ μλ€.
OverSampling
μ΄μμΉ λ μ΄λΈκ³Ό κ°μ΄ μ μ λ°μ΄ν° μ μ μ¦μνμ¬ νμ΅μ νμν λ°μ΄ν°λ₯Ό ν보νλ λ°©λ²μ΄λ€. λμΌν λ°μ΄ν°λ₯Ό λ¨μν μ¦μμν€λ©΄ κ³Όμ ν©μ΄ λκΈ° λλ¬Έμ, μλ³Έ λ°μ΄ν°μ νΌμ² κ°λ€μ μ‘°κΈμ© λ³κ²½νμ¬ μ¦μνλ€. λνμ μΈ μ€λ²μνλ§ λ°©λ²μλ SMOTEκ° μλ€.
- SMOTE : μ μ λ°μ΄ν°μ μ μλ κ°λ³ λ°μ΄ν°μ KNN(μ΅κ·Όμ μ΄μ)μ μ°Ύμμ μ΄ λ°μ΄ν°μ Kκ° μ΄μλ€μ μ°¨μ΄λ₯Ό μΌμ κ°μΌλ‘ λ§λ€μ΄ κΈ°μ‘΄ λ°μ΄ν°μ μ½κ° μ°¨μ΄κ° λλ μλ‘μ΄ λ°μ΄ν°λ€μ μμ±νλ λ°©μ
#ν¨ν€μ§ μ€μΉ
conda install -c conda-forge imbalanced-learn
from imlearn.over_sampling import SMOTE
smote = SMOTE()
X_train_over, y_train_over = smote.fit_sample(X_train,y_train)
πμ£Όμ : κ²μ¦ λ°μ΄ν°λ ν μ€νΈ λ°μ΄ν°μ μλ μ μ©νλ©΄ μλ¨
UnderSampling
λ§μ λ°μ΄ν° μ μ μ μ λ°μ΄ν°μ μμ€μΌλ‘ κ°μμν€λ λ°©μμ΄λ€. μ μ λ μ΄λΈ λ°μ΄ν°λ₯Ό μ΄μ λ μ΄λΈ λ°μ΄ν° μμ€μΌλ‘ κ°μμν€λ©΄ κ³Όλνκ² μ μ λ μ΄λΈλ‘ νμ΅νλ λ¬Έμ λ ν΄κ²°ν μ μμ§λ§, λ무 λ§μ μ μ λ μ΄λΈ λ°μ΄ν°λ₯Ό κ°μμν€κΈ° λλ¬Έμ μ μ λ μ΄λΈμ κ²½μ° μ€νλ € μ λλ‘λ νμ΅μ μνν μ μλ€. μ΄λ¬ν λ¨μ λλ¬Έμ μΈλ μνλ§ κΈ°λ²μ μ μ¬μ©λμ§ μλλ€.
'π Machine Learning > λ°μ΄ν° μ μ²λ¦¬' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
[Python] κ²°μΈ‘μΉ μ€μκ°μΌλ‘ μ±μ°κΈ° (0) | 2022.09.17 |
---|---|
[λ¨Έμ λ¬λ/ML] κ²°μΈ‘μΉ μ²λ¦¬ λ°©λ² (0) | 2022.06.04 |
[Python] λ°μ΄ν° EDAλ₯Ό νλ²μ νλ λ°©λ²(pandas profiling) (0) | 2022.04.06 |