์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- ํ์ด์ฌ
- dataframe
- ๋ฐ์ดํฐ๋ถ์
- ADP
- ๋ ๋ฆฝํ๋ณธ
- iloc
- ๋์ํ๋ณธ
- Lambda
- ํฌ๋กค๋ง
- ๋ฐ์ดํฐ๋ถ๊ท ํ
- ํ ์คํธ๋ถ์
- ์๋ํด๋ผ์ฐ๋
- numpy
- ์ฃผ์ฑ๋ถ๋ถ์
- opencv
- ๋น ๋ฐ์ดํฐ
- datascience
- ์ธ๋์ํ๋ง
- ADsP
- t-test
- DBSCAN
- LDA
- ๊ตฐ์งํ
- ์ค๋ฒ์ํ๋ง
- ๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ
- PCA
- ๋ฐ์ดํฐ๋ถ์์ ๋ฌธ๊ฐ
- Python
- pandas
- ๋น ๋ฐ์ดํฐ๋ถ์๊ธฐ์ฌ
Data Science LAB
[CV] Object Detection Neck ์ ๋ฆฌ ๋ณธ๋ฌธ
[CV] Object Detection Neck ์ ๋ฆฌ
ใ ใ ใ ใ 2023. 5. 21. 17:41๋ณธ ํฌ์คํ ์ Naver Boostcamp AI Tech 5๊ธฐ
Object Detection ๊ฐ์ ์๋ฃ๋ฅผ ๋ฐํ์ผ๋ก ์์ฑ๋์์ต๋๋ค.
Neck ๋ฑ์ฅ ๋ฐฐ๊ฒฝ
๊ธฐ์กด์ RPN์ backbone network๋ฅผ ํต๊ณผํ ๋ง์ง๋ง feature map๋ง ์ฌ์ฉํ์ฌ RPN์ ํตํ ROI๋ฅผ ์ถ์ถํ์๋ค.
-> ์ค๊ฐ์ ์๋ feature๋ค์ ์ฌ์ฉํ๊ธฐ ์ํด Neck ๋ฑ์ฅ
- feature map ์ low level(ํฐ feature map)์ ์์ ๊ฐ์ฒด๋ฅผ, high level (์์ feature map)์ ํฐ ๊ฐ์ฒด๋ฅผ ์ถ์ถํจ
(high level์์๋ semantic ์ ๋ณด๊ฐ ํ๋ถํ์ง๋ง localization ์ ๋ณด๊ฐ ๋ถ์กฑ, low level์์๋ localization ์ ๋ณด๊ฐ ํ๋ถํ์ง๋ง sementic ์ ๋ณด๊ฐ ๋ถ์กฑ)
- Back bone์ ํต๊ณผํ feature map์์ ๋ค์ํ ํฌ๊ธฐ์ ๊ฐ์ฒด๋ฅผ ์์ธกํด์ผ ํ๋๋ฐ ๋ง์ง๋ง layer ๋ง ํ์ฉํ๋ฉด ์์ ๊ฐ์ฒด๋ฅผ ์ถ์ถํ๊ธฐ ์ด๋ ค์
- ๊ธฐ์กด์ RPN์ backbone network๋ฅผ ํต๊ณผํ ๋ง์ง๋ง feature map๋ง ์ฌ์ฉํ์ฌ RPN์ ํตํ ROI๋ฅผ ์ถ์ถํ์๋ค.
- ์ค๊ฐ์ ์๋ feature๋ค์ ์ ์์ด์ ํ๋ถํ ์ ๋ณด๋ฅผ ์ป๊ฒ ํ๊ธฐ ์ํด Neck ๋ฑ์ฅ
FPN (Feature Pyramid Network)
์ด๋ฏธ์ง ์์ฒด์ ์ฌ์ด์ฆ๋ฅผ ์กฐ์ ํด feature ์ถ์ถ
1. High level์์ low level์ semantic ์ ๋ณด๋ฅผ ์ ๋ฌํด์ผ ํ๋ฏ๋ก top-down path way๋ฅผ ์ถ๊ฐ
-> pyramid ๊ตฌ์กฐ๋ฅผ ํตํด high - leow๋ก ์์ฐจ์ ์ผ๋ก ์ ๋ณด ์ ๋ฌ
2. Lateral connection๋ฐฉ์์ผ๋ก ๋๊ฐ์ feature merge
3. ๋ ๊ฐ์ feature์ shape์ด ๋ค๋ฅด๊ธฐ ๋๋ฌธ์ bottom-up ๊ณผ์ ์์ ๋์จ feature map์ 1 * 1 conv layer๋ฅผ ํต๊ณผํด channel size๋ฅผ ๋๋ ค ์ค
4. Top-down์์ ๋์จ feature map์ upsampling์ ํตํด width์ height์ ๋์ฌ์ค (Nearest Neighbor Upsampling ๊ธฐ๋ฒ ์ฌ์ฉ)
์ ์ฒด Pipeline
Backbone : ResNet ์ฌ์ฉ
ResNet์๋ ์ด 4๊ฐ์ stage๊ฐ ์์ผ๋ฉฐ, pooling์ผ๋ก w, h๊ฐ ์ ๋ฐ์ผ๋ก ์ค์ด๋ฆ์ต์ข ์ ์ผ๋ก ์ถ๋ ฅ๋ RoI๋ฅผ ๋์์ผ๋ก NMS๋ฅผ ์ํํจ -> 1000๊ฐ์ ROI๋ก ๋ง๋ฆ
๊ฐ ROI๊ฐ ์ด๋ค feature map์์ ๋์จ ๊ฑด์ง ์ ์ ์๊ธฐ ๋๋ฌธ์ Mapping๊ณผ์ ์ด ํ์ํจ
๊ณ์ฐ๋ k๊ฐ์ด ์์ ์๋ก low-level์์ ์๋ฏธ
PANet (Path Aggregation Network)
FPN์์๋ ๋๋ฌด ๋ง์ feature ๊ฐ conv layer๋ฅผ ํต๊ณผํด ์ ๋ณด๊ฐ top์ผ๋ก ์ ๊ฐ ์ ์๋์ง ์๋ฌธ ๋๋ฌธ์ ๋ฑ์ฅ
-> FPN์์์ Top Down ์ดํ ๋ค์ Bottom up ์ํํจ
๊ฒฝ๊ณ์ ์๋ RoI์ ๋ํด์๋ K๊ฐ ๊ณ์ฐ์ด ์ ๋๋ก ๋์์ด ์๋จ
- FPN : ํ๋์ stage์์ ROI projection & Pooling
- Adapted Feature Pooling : ๋ชจ๋ stage์์ ROI projection & Pooling
DetectoRS
: ๊ฐ์ ๊ฒ์ ๋ ๋ฒ์ฉ ๋ฐ๋ณต์ ์ผ๋ก ๋ณด๋ฉด ์ฑ๋ฅ์ด ์ข์์ง๋ ์ง ํ์ธํ ๋ชจ๋ธ
Recursive Feature Pyramid (RFP)
backbone์ ํตํด FPN ๋ ๊ฒฐ๊ณผ๋ฌผ์ ๋ค์ Backbone์ ํ์ต์ํด
ํ์ต์๋๊ฐ ๋งค์ฐ ๋๋ฆผ (ํ๋ฒ Neck์ ํต๊ณผํ stage๋ค์ ASPP๋ฅผ ๊ฑฐ์ณ์ ๋ค์ ํ๋ฒ feature map๋ค๊ณผ ํฉ์ณ์ง)
ASPP
Receptive field๋ฅผ ๋๋ฆฌ๋ ๋ฐฉ๋ฒ์ผ๋ก ํ๋์ feature map์์ pooling์ ์งํํ ๋ diliation rate๋ฅผ ๋ณํ์์ผ๊ฐ๋ฉฐ receptive field๋ฅผ ํค์๋๊ฐ๋ฉฐ pooling
BiFPN (Bi-directional Feature Pyramid)
๊ธฐ์กด์ PANet์ ๊ฐ์ํ ํ ๋ชจ๋ธ๋ก ํจ์จ์ฑ์ ์ํด feature map์ด ํ ๊ณณ์์๋ง ์ค๋ ๋ ธ๋๋ค์ ์ ๊ฑฐ
- FPN๊ณผ ๊ฐ์ด ๋จ์ํ๊ฒ summation์ ํ๋ ๊ฒ ์๋ ๊ฐ feature ๋ณ๋ก ๊ฐ์ค์น ๋ถ์ฌ ํ summation
- ๋ชจ๋ธ ์ฌ์ด์ฆ๋ ๊ฑฐ์ ์ฆ๊ฐํ์ง ์์
- feature ๋ณ ๊ฐ์ค์น๋ฅผ ํตํด ์ค์ํ feature๋ฅผ ๊ฐ์กฐํด ์ฑ๋ฅ์ด ํฅ์๋จ
NASFPN
๊ธฐ์กด FPN, PANet์ ๋ฌธ์ ์ ์ธ top-down, bottom-up ์ ์ ํด์ง pathway๋ก feature map์ ํฉ์น๋ ๊ฒ์ ํด๊ฒฐํ ๋ชจ๋ธ
NAS (neural architecture search)๋ฅผ ํตํด์ ์ต์ ์ FPN architecture๋ฅผ ์ฐพ์ผ๋ ค๊ณ ์๋
๋จ์
- COCO dataset, ResNet ๊ธฐ์ค์ผ๋ก ์ฐพ์ architecture๋ก ๋ฒ์ฉ์ ์ด์ง ๋ชปํจ (๋ฐ์ดํฐ์ ์ด๋ backbone์ด ๋ฐ๋๋ฉด ๋ค์ ํ์ตํด์ผํจ)
- High cost
AugFPN
high level feature๋ low level๋ก ๊ฐ๊ธฐ ์ํด์ channel์ ์๋ฅผ ์ค์ด๋ ์ฐ์ฐ๋ง ์ํํ๊ธฐ ๋๋ฌธ์ ์ ๋ณด์์ค ๋ฐ์ํ๋๋ฐ 1๊ฐ์ feature map์์ RoI๋ฅผ ์์ฑํ๋ ๊ฒ์ผ๋ก ์ด ๋ฌธ์ ๋ฅผ ์ด๋ ์ ๋ ํด๊ฒฐํจ
Residual Feature Augmentation
Ratio - invariant Adatpive Pooling : ๋ค์ํ scale์ feature map ์์ฑ (256 channel)
๋์ผํ scale๋ก upsamplig ํ ๋ค ๊ฐ์ค์น๋ฅผ ๋๊ณ ํฉ์นจ
'๐ฅ๏ธ Computer Vision > Object Detection' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[CV] Object Detection library (1) - Detectron 2 (0) | 2023.05.28 |
---|---|
[CV] Object Detection 1stage detectors (0) | 2023.05.22 |
[CV] Object Detection 2 Stage Detectors (R-CNN, Fast-RCNN, Faster-RCNN) ์ ๋ฆฌ (0) | 2023.05.21 |
[CV] Object Detection Overview (evaluation ๋ฐฉ๋ฒ) (0) | 2023.05.18 |