[CV] Object Detection Overview (evaluation ๋ฐฉ๋ฒ)
๋ณธ ํฌ์คํ ์ Naver Boostcamp AI Tech 5๊ธฐ Object Detection ๊ฐ์ ์๋ฃ๋ฅผ ๋ฐํ์ผ๋ก ์์ฑ๋์์ต๋๋ค.
0. Object Detection์ด๋
ํ ๋ฌผ์ฒด (single object)๊ฐ ์๋ ์ฌ๋ฌ ๋ฌผ์ฒด์ ๋ํด ์ด๋ค ๋ฌผ์ฒด์ธ์ง ํด๋ ์ค๋ฅผ ๋ถ๋ฅํ๋ classification ๋ฌธ์ ์ ๊ทธ ๋ฌผ์ฒด๊ฐ ์ด๋์ ์๋์ง๋ฅผ Bounding box๋ฅผ ํตํด ์์น ์ ๋ณด๋ฅผ ๋ํ๋ด๋ Localization ๋ฌธ์ ๋ฅผ ๋ชจ๋ ํฌํจํ๋ค.
1. History
2. Evaluation
: Object Detection์์์ ์ ํ๋ ์ธก์ ์ Ground Truth์ Prediction๊ฐ์ ๋น๊ต๋ฅผ ํตํด ์ด๋ฃจ์ด์ง
์ด๋ฏธ์ง ๋ด์ ๊ฐ์ฒด๊ฐ ์ด๋์ ์กด์ฌํ๋ ์ง bounding box๋ก ์ฐพ๊ณ , ์ฐพ์ ์์น์ ํด๋นํ๋ ๋ฐ์ค ๋ด๋ถ์ ๊ฐ์ฒด๊ฐ ์ค์ GT์ ์๋ ํด๋์ค์ ์ผ์นํ๋ ์ง ์ฌ๋ถ๋ฅผ ๋น๊ตํจ
1) Confusion matrix
Precision (์ ๋ฐ๋)
: ๊ฒ์ธก๋ ๊ฒ๋ค ์ค ์ ๋ต์ ๋ง์ถ ๊ฒ์ ๋น์จ์ด ์ด๋ ์ ๋ ์ธ์ง -> ๊ฒ์ถ ๊ฒฐ๊ณผ๊ฐ ์ผ๋ง๋ ์ ํํ์ง ์ ์ ์์
Recall (์ฌํ์จ)
: GT ์ค์์ ์ผ๋ง๋ ์ ๋ต์ ๋ง์ถ์๋์ง -> ๊ฒ์ถ๋์ด์ผ ํ ๊ฐ์ฒด ์ค ์ ๋๋ก ๊ฒ์ถ๋์๋ ์ง
2 ) PR Curve
์ ๋ฐ๋์ ์ฌํ์จ์ ๋ฐ๋น๋ก ๊ด๊ณ
์ ๋ฐ๋์ ์ฌํ์จ ๊ฐ๊ฐ์ผ๋ก ์ฑ๋ฅ์ ํ๊ฐํ๋ ๊ฒ์ ์ ์ ํ์ง ์์ผ๋ฉฐ, ๋ ๊ฐ์ ๋ฐ๋น๋ก ๊ด๊ณ์ด๊ธฐ ๋๋ฌธ์ ๋ชจ๋ ๊ณ ๋ คํ์ฌ ์ ํ๋๋ฅผ ํ๊ฐํด์ผ ํจ
3) AP (Average Precision) & mAP (mean Average Precision)
- Average Precision์ ๊ณ์ฐ์ Recall์ 0๋ถํฐ 0.1๋จ์๋ก ์ฆ๊ฐ์ํค๋ฉฐ ๊ฐ ๋จ์์ Precision ๊ฐ์ ๊ณ์ฐํด ํ๊ท ์ ๋ธ ๋ค ๊ณ์ฐํ๋ค.
- 11๋จ์์ Recall ๊ฐ์ ๋ฐ๋ฅธ Precision ๊ฐ๋ค์ ํ๊ท ์ ์๋ฏธํ๋ค.
- ์ ์ฒด ํด๋์ค ๊ฐ์์ AP ๊ณ์ฐ ํ ํ๊ท ๋ธ ๊ฐ์ด mAP
3 ) IOU (Interaction Over Union)
: GT์ Prediction์ ๊ฒน์น๋ ์์ญ์ ์๋ฏธํจ
์ฃผ๋ก mAP 50 (IOU > 0.5์ธ ๊ฒฝ์ฐ True) ์ฌ์ฉ
4) FPS (Frames Per Second)
: 1์ด๋น ์ฒ๋ฆฌ ๊ฐ๋ฅํ frame ์ซ์๋ก ๋์ ์๋ก ์ข์
5) FLOPS (Floating Point Operations)
: Model์ด ์ผ๋ง๋ ๋น ๋ฅด๊ฒ ๋์ํ๋ ์ง ์ธก์ ํ๋ metric์ผ๋ก ์ฐ์ฐ๋ ํ์๋ฅผ ์๋ฏธํจ