250x250
Link
๋์ GitHub Contribution ๊ทธ๋ํ
Loading data ...
Notice
Recent Posts
Recent Comments
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ์๋ํด๋ผ์ฐ๋
- ์ธ๋์ํ๋ง
- ํฌ๋กค๋ง
- iloc
- ADP
- ๋น ๋ฐ์ดํฐ
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- pandas
- t-test
- ๋ฐ์ดํฐ๋ถ์
- PCA
- ๋์ํ๋ณธ
- ADsP
- Lambda
- numpy
- ํ ์คํธ๋ถ์
- datascience
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- DBSCAN
- ๊ตฐ์งํ
- ์ค๋ฒ์ํ๋ง
- ํ์ด์ฌ
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- ์ฃผ์ฑ๋ถ๋ถ์
- LDA
- ๋ ๋ฆฝํ๋ณธ
- opencv
- Python
- dataframe
Archives
Data Science LAB
[Deep Learning] ๋ฐฐ์น ์ ๊ทํ (Batch Normalization, BN) ๋ณธ๋ฌธ
๐ง Deep Learning
[Deep Learning] ๋ฐฐ์น ์ ๊ทํ (Batch Normalization, BN)
ใ ใ ใ ใ 2022. 12. 9. 23:03728x90
๊ธฐ์กด์ Gradient Vanishing, Exploding ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ์๋ก์ด ํ์ฑํ ํจ์๋ฅผ ์ฐพ๊ฑฐ๋ ๊ฐ์ค์น๋ฅผ ์ด๊ธฐํํ๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉ
-> ํ๋ จํ๋ ๋์ ๋ค์ ๋ฐ์ํ์ง ์์ผ๋ฆฌ๋ ๋ณด์ฅ โ
์ด์ 2015๋ ์ธ๋ฅด๊ฒ์ด ์ด์คํ์ ์น๋ฆฌ์ํฐ์ธ ์ธ๊ฒ์ง๊ฐ ๋ฐฐ์น์ ๊ทํ ๊ธฐ๋ฒ ์ ์
- Batch Normalization

- Batch : ์ ๊ฒฝ๋ง ํ์ต ์ ๋ณดํต ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ์์ ๋จ์๋ก ๋ถํ ํ์ฌ ํ์ต์ ์งํํ๋๋ฐ, ์ด ๋ ์ฌ์ฉ๋๋ ๋จ์
- Batch Normalization : ๋ฐฐ์น ๋จ์๋ก ์ ๊ทํํจ
- ๊ฐ ์ธต์์ ํ์ฑํ ํจ์๋ฅผ ํต๊ณผํ๊ธฐ ์ ์ด๋ ํ์ ๋ชจ๋ธ์ ์ฐ์ฐ์ ํ๋ ์ถ๊ฐ
- ์ด ์ฐ์ฐ์ ๋จ์ํ๊ฒ ์ ๋ ฅ์ ์์ ์ ๋ง์ถ๊ณ ์ ๊ทํํ ๋ค์, ๊ฐ ์ธต์์ ๋ ๊ฐ์ ์๋ก์ด ํ๋ผ๋ฏธํฐ๋ก ๊ฒฐ๊ด๊ฐ์ ์ค์ผ์ผ์ ์กฐ์ ํ๊ณ ์ด๋์ํด
- ์ ๊ฒฝ๋ง์ ์ฒซ ๋ฒ์งธ ์ธต์ผ๋ก ๋ฐฐ์น ์ ๊ทํ๋ฅผ ์ถ๊ฐํ๋ฉด ํ๋ จ ์ธํธ๋ฅผ ํ์คํํ ํ์ ์์
- ํ๋ จํ๋ ๋์ ๋ฐฐ์น ์ ๊ทํ๋ ์ ๋ ฅ์ ์ ๊ทํํ ๋ค์ ์ค์ผ์ผ์ ์กฐ์ ํ๊ณ ์ด๋ ์ํด
์ฆ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์์ ์ ๋ง์ถ๊ณ ์ ๊ทํํ๊ธฐ ์ํด์๋ ํ๊ท ๊ณผ ํ์คํธ์ฐจ๋ฅผ ์ถ์ ํด์ผ ํจ

๋ฐฐ์น ์ ๊ทํ์ ์ฅ์
1. ํ์ต ์๋๋ฅผ ๋น ๋ฅด๊ฒ ํ ์ ์์
2. ๊ฐ์ค์น ์ด๊ธฐํ์ ๋ํ ๋ฏผ๊ฐ๋๋ฅผ ๊ฐ์ ์ํด (hyper parameter์ ์ค์ ์ด ์ข ๋ ์์ ๋ก์ ์ง)
3. ๋ชจ๋ธ์ ์ผ๋ฐํ(regularization) ํจ๊ณผ
์ผ๋ผ์ค๋ก ๊ตฌํํ ๋ฐฐ์น ์ ๊ทํ ์์
model = tf.keras.Sequential([
keras.layers.Flatten(input_shape=[28,28]),
keras.layers.BatchNormalization(),
keras.layers.Dense(300, kernel_initializer='he_normal', use_bias=False),
keras.layers.BatchNormalization(),
keras.layers.Activation('relu'),
keras.layers.Dense(100, kernel_initializer='he_normal', use_bias=False),
keras.layers.BatchNormalization(),
keras.layers.Activation('relu'),
keras.layers.Dense(10,activation='softmax')
])
728x90