์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- opencv
- ์ค๋ฒ์ํ๋ง
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- iloc
- t-test
- ADP
- ๋์ํ๋ณธ
- ์ฃผ์ฑ๋ถ๋ถ์
- numpy
- ํ์ด์ฌ
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- ADsP
- Lambda
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
- ํฌ๋กค๋ง
- ํ ์คํธ๋ถ์
- ๋ฐ์ดํฐ๋ถ์
- DBSCAN
- Python
- datascience
- PCA
- LDA
- ๋น ๋ฐ์ดํฐ
- ์ธ๋์ํ๋ง
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ์๋ํด๋ผ์ฐ๋
- pandas
- ๋ ๋ฆฝํ๋ณธ
- dataframe
- ๊ตฐ์งํ
Data Science LAB
[CV] Object Detection Neck ์ ๋ฆฌ ๋ณธ๋ฌธ
[CV] Object Detection Neck ์ ๋ฆฌ
ใ ใ ใ ใ 2023. 5. 21. 17:41๋ณธ ํฌ์คํ ์ Naver Boostcamp AI Tech 5๊ธฐ
Object Detection ๊ฐ์ ์๋ฃ๋ฅผ ๋ฐํ์ผ๋ก ์์ฑ๋์์ต๋๋ค.
Neck ๋ฑ์ฅ ๋ฐฐ๊ฒฝ

๊ธฐ์กด์ RPN์ backbone network๋ฅผ ํต๊ณผํ ๋ง์ง๋ง feature map๋ง ์ฌ์ฉํ์ฌ RPN์ ํตํ ROI๋ฅผ ์ถ์ถํ์๋ค.
-> ์ค๊ฐ์ ์๋ feature๋ค์ ์ฌ์ฉํ๊ธฐ ์ํด Neck ๋ฑ์ฅ
- feature map ์ low level(ํฐ feature map)์ ์์ ๊ฐ์ฒด๋ฅผ, high level (์์ feature map)์ ํฐ ๊ฐ์ฒด๋ฅผ ์ถ์ถํจ
(high level์์๋ semantic ์ ๋ณด๊ฐ ํ๋ถํ์ง๋ง localization ์ ๋ณด๊ฐ ๋ถ์กฑ, low level์์๋ localization ์ ๋ณด๊ฐ ํ๋ถํ์ง๋ง sementic ์ ๋ณด๊ฐ ๋ถ์กฑ)
- Back bone์ ํต๊ณผํ feature map์์ ๋ค์ํ ํฌ๊ธฐ์ ๊ฐ์ฒด๋ฅผ ์์ธกํด์ผ ํ๋๋ฐ ๋ง์ง๋ง layer ๋ง ํ์ฉํ๋ฉด ์์ ๊ฐ์ฒด๋ฅผ ์ถ์ถํ๊ธฐ ์ด๋ ค์
- ๊ธฐ์กด์ RPN์ backbone network๋ฅผ ํต๊ณผํ ๋ง์ง๋ง feature map๋ง ์ฌ์ฉํ์ฌ RPN์ ํตํ ROI๋ฅผ ์ถ์ถํ์๋ค.
- ์ค๊ฐ์ ์๋ feature๋ค์ ์ ์์ด์ ํ๋ถํ ์ ๋ณด๋ฅผ ์ป๊ฒ ํ๊ธฐ ์ํด Neck ๋ฑ์ฅ
FPN (Feature Pyramid Network)
์ด๋ฏธ์ง ์์ฒด์ ์ฌ์ด์ฆ๋ฅผ ์กฐ์ ํด feature ์ถ์ถ
1. High level์์ low level์ semantic ์ ๋ณด๋ฅผ ์ ๋ฌํด์ผ ํ๋ฏ๋ก top-down path way๋ฅผ ์ถ๊ฐ
-> pyramid ๊ตฌ์กฐ๋ฅผ ํตํด high - leow๋ก ์์ฐจ์ ์ผ๋ก ์ ๋ณด ์ ๋ฌ

2. Lateral connection๋ฐฉ์์ผ๋ก ๋๊ฐ์ feature merge

3. ๋ ๊ฐ์ feature์ shape์ด ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ bottom-up ๊ณผ์ ์์ ๋์จ feature map์ 1 * 1 conv layer๋ฅผ ํต๊ณผํด channel size๋ฅผ ๋๋ ค ์ค

4. Top-down์์ ๋์จ feature map์ upsampling์ ํตํด width์ height์ ๋์ฌ์ค (Nearest Neighbor Upsampling ๊ธฐ๋ฒ ์ฌ์ฉ)

์ ์ฒด Pipeline
Backbone : ResNet ์ฌ์ฉ
ResNet์๋ ์ด 4๊ฐ์ stage๊ฐ ์์ผ๋ฉฐ, pooling์ผ๋ก w, h๊ฐ ์ ๋ฐ์ผ๋ก ์ค์ด๋ฆ์ต์ข ์ ์ผ๋ก ์ถ๋ ฅ๋ RoI๋ฅผ ๋์์ผ๋ก NMS๋ฅผ ์ํํจ -> 1000๊ฐ์ ROI๋ก ๋ง๋ฆ
๊ฐ ROI๊ฐ ์ด๋ค feature map์์ ๋์จ ๊ฑด์ง ์ ์ ์๊ธฐ ๋๋ฌธ์ Mapping๊ณผ์ ์ด ํ์ํจ
๊ณ์ฐ๋ k๊ฐ์ด ์์ ์๋ก low-level์์ ์๋ฏธ
PANet (Path Aggregation Network)
FPN์์๋ ๋๋ฌด ๋ง์ feature ๊ฐ conv layer๋ฅผ ํต๊ณผํด ์ ๋ณด๊ฐ top์ผ๋ก ์ ๊ฐ ์ ์๋์ง ์๋ฌธ ๋๋ฌธ์ ๋ฑ์ฅ

-> FPN์์์ Top Down ์ดํ ๋ค์ Bottom up ์ํํจ

๊ฒฝ๊ณ์ ์๋ RoI์ ๋ํด์๋ K๊ฐ ๊ณ์ฐ์ด ์ ๋๋ก ๋์์ด ์๋จ
- FPN : ํ๋์ stage์์ ROI projection & Pooling
- Adapted Feature Pooling : ๋ชจ๋ stage์์ ROI projection & Pooling
DetectoRS
: ๊ฐ์ ๊ฒ์ ๋ ๋ฒ์ฉ ๋ฐ๋ณต์ ์ผ๋ก ๋ณด๋ฉด ์ฑ๋ฅ์ด ์ข์์ง๋ ์ง ํ์ธํ ๋ชจ๋ธ
Recursive Feature Pyramid (RFP)
backbone์ ํตํด FPN ๋ ๊ฒฐ๊ณผ๋ฌผ์ ๋ค์ Backbone์ ํ์ต์ํด

ํ์ต์๋๊ฐ ๋งค์ฐ ๋๋ฆผ (ํ๋ฒ Neck์ ํต๊ณผํ stage๋ค์ ASPP๋ฅผ ๊ฑฐ์ณ์ ๋ค์ ํ๋ฒ feature map๋ค๊ณผ ํฉ์ณ์ง)
ASPP
Receptive field๋ฅผ ๋๋ฆฌ๋ ๋ฐฉ๋ฒ์ผ๋ก ํ๋์ feature map์์ pooling์ ์งํํ ๋ diliation rate๋ฅผ ๋ณํ์์ผ๊ฐ๋ฉฐ receptive field๋ฅผ ํค์๋๊ฐ๋ฉฐ pooling

BiFPN (Bi-directional Feature Pyramid)
๊ธฐ์กด์ PANet์ ๊ฐ์ํ ํ ๋ชจ๋ธ๋ก ํจ์จ์ฑ์ ์ํด feature map์ด ํ ๊ณณ์์๋ง ์ค๋ ๋ ธ๋๋ค์ ์ ๊ฑฐ


- FPN๊ณผ ๊ฐ์ด ๋จ์ํ๊ฒ summation์ ํ๋ ๊ฒ ์๋ ๊ฐ feature ๋ณ๋ก ๊ฐ์ค์น ๋ถ์ฌ ํ summation
- ๋ชจ๋ธ ์ฌ์ด์ฆ๋ ๊ฑฐ์ ์ฆ๊ฐํ์ง ์์
- feature ๋ณ ๊ฐ์ค์น๋ฅผ ํตํด ์ค์ํ feature๋ฅผ ๊ฐ์กฐํด ์ฑ๋ฅ์ด ํฅ์๋จ

NASFPN
๊ธฐ์กด FPN, PANet์ ๋ฌธ์ ์ ์ธ top-down, bottom-up ์ ์ ํด์ง pathway๋ก feature map์ ํฉ์น๋ ๊ฒ์ ํด๊ฒฐํ ๋ชจ๋ธ
NAS (neural architecture search)๋ฅผ ํตํด์ ์ต์ ์ FPN architecture๋ฅผ ์ฐพ์ผ๋ ค๊ณ ์๋

๋จ์
- COCO dataset, ResNet ๊ธฐ์ค์ผ๋ก ์ฐพ์ architecture๋ก ๋ฒ์ฉ์ ์ด์ง ๋ชปํจ (๋ฐ์ดํฐ์ ์ด๋ backbone์ด ๋ฐ๋๋ฉด ๋ค์ ํ์ตํด์ผํจ)
- High cost
AugFPN
high level feature๋ low level๋ก ๊ฐ๊ธฐ ์ํด์ channel์ ์๋ฅผ ์ค์ด๋ ์ฐ์ฐ๋ง ์ํํ๊ธฐ ๋๋ฌธ์ ์ ๋ณด์์ค ๋ฐ์ํ๋๋ฐ 1๊ฐ์ feature map์์ RoI๋ฅผ ์์ฑํ๋ ๊ฒ์ผ๋ก ์ด ๋ฌธ์ ๋ฅผ ์ด๋ ์ ๋ ํด๊ฒฐํจ
Residual Feature Augmentation
Ratio - invariant Adatpive Pooling : ๋ค์ํ scale์ feature map ์์ฑ (256 channel)


๋์ผํ scale๋ก upsamplig ํ ๋ค ๊ฐ์ค์น๋ฅผ ๋๊ณ ํฉ์นจ
'๐ฅ๏ธ Computer Vision > Object Detection' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[CV] Object Detection library (1) - Detectron 2 (0) | 2023.05.28 |
---|---|
[CV] Object Detection 1stage detectors (0) | 2023.05.22 |
[CV] Object Detection 2 Stage Detectors (R-CNN, Fast-RCNN, Faster-RCNN) ์ ๋ฆฌ (0) | 2023.05.21 |
[CV] Object Detection Overview (evaluation ๋ฐฉ๋ฒ) (0) | 2023.05.18 |