| ์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
- bf16
- multi-query
- ํ์ฑํํจ์
- Cross Entropy Error
- ๋ฅ๋ฌ๋
- ํ์ฑํ ํจ์
- ํ์ธํ๋
- rag-fusion
- ๋ฐ์ดํฐ ํ์ฑ
- fp32
- fine tuning
- Mean squared error
- fp16
- qlora
- ์ค์ฐจ์ญ์ ํ
- pdf parsing
- LLaVA
- rrf
- ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง
- ์ด์ํ์ง
- visual instruction tuning
- anomaly detection
- rag parsing
- Nested Learning
- gemma3
- Time Series
- deep learning
- LLM ํจ๋ฌ๋ค์
- Non-Maximum Suppression
- LLM
- Today
- Total
Attention, Please!!!
[Object Detection] Slide Window & Selective Search ๊ฐ๋ ๋ณธ๋ฌธ
๐ก Sliding Window & Regional Proposal
Object Detection์ ์ฌ๋ฌ ๊ฐ์ฒด์ ๋ํ ์์น์ ํด๋์ค๋ฅผ ๋ถ๋ฅํ๋๋ฐ, ๋ณต์กํ Feature Map์ด ๋์ถ๋๊ธฐ์ ๊ฐ์ฒด๋ฅผ ๋ถ๋ฅํ๋๋ฐ ์ด๋ ค์์ด ์์ต๋๋ค. ๊ทธ๋ผ Feature Map๋ฅผ ๊ฐ๋จํ๊ฒ ๋ง๋ค๊ธฐ ์ํด์๋ ์ด๋ป๊ฒ ํด์ผํ ๊น์? ์๊ฐ๋ณด๋ค ๋จ์ํฉ๋๋ค. ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ผ์ ํ ํฌ๊ธฐ์ ๊ฐ๊ฒฉ์ผ๋ก ๋๋๊ณ , ๊ฐ๊ฐ์ ๋๋ ์์ญ์์ ๊ฐ์ฒด๋ฅผ ์ฐพ๋๋ค๋ฉด ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์ Sliding Window๋ผ๊ณ ํฉ๋๋ค.

์ฆ, Sliding Window๋ ์ผ์ ํฌ๊ธฐ์ Window(๋ ธ๋์ ์์)๋ฅผ ์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ์ผ๋ก ์์ง์ด๋ฉด์, ๊ฐ๊ฐ์ Window ๋ด์ Feature Map๋ฅผ ๋์ถํ์ฌ ๊ฐ์ฒด๋ฅผ ์ธ์ํ๋ ๋ฐฉ์์ ๋๋ค.
๊ทธ๋ ๋ค๋ฉด ๋ง์ฝ ์ผ์ ํฌ๊ธฐ์ Window๊ฐ ๊ฐ์ฒด์ ํฌ๊ธฐ ๋ณด๋ค ํจ์ฌ ํฌ๋ค๋ฉด, ๊ฐ์ฒด๋ฅผ ์ธ์ํ์ง ๋ชปํ ๊ฒ ์ ๋๋ค. ์๋์ ์ฌ์ง๊ณผ ๊ฐ์ด ๊ธฐ๋ฆฐ์ด๋ผ๋ ๊ฐ์ฒด๋ ์ธ๋ก๋ก ๊ธธ์ญํ๋ฐ, ์ ์ฌ๊ฐํ ๋ชจ์์ Window๋ก ์ฐพ๊ธฐ๋ ํฐ ์ด๋ ค์์ด ์์ต๋๋ค.

์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด์๋, ์๋์ GIF์ ๊ฐ์ด Window ํฌ๊ธฐ๋ฅผ ๊ณ ์ ํ๋ ์ ๋ ฅ ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ๋ณ๊ฒฝํ๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.

"๋จ์"๋ผ๋ ๊ฐ์ฒด๋ฅผ ์ฐพ๊ธฐ ์ํด Sliding Window๊ฐ ์ง์์ ์ผ๋ก ์ข์ฐ๋ก ์์ง์ด๋ฉฐ, ์ ์ฒด์ ์ผ๋ก ํ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ฌ๊ธฐ์์ ๋ฌธ์ ์ ์ ๋ฐ๋ท๊ฐ/๋/๊ฑด์ถ๋ฌผ ๋ฑ ๋ค์ํ ๋ค์ค๊ฐ์ฒด์ ๋ํด ํ์ํ๊ณ ์์ผ๋ฉฐ, ๊ณ์ฐ๋์ด ์๋นํ ๋ง์์ง๋ ๊ฒ์ ์์์ฑ ์ ์์ต๋๋ค. ๋ง์ฝ ์ด๋ฌํ Sliding Window์ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด, ์ถ์ ํด๋ณด๋ฉด ์ด๋จ๊น์??
์ฆ, ์ผ์ผ์ด ์ด๋ฏธ์ง๋ฅผ ์ ์ฒด์ ์ผ๋ก ํ๋ ๊ฒ์ด ์๋๋ผ, ์ ๋ ฅ ์ด๋ฏธ์ง์ ์ ์ฌํ ํน์ฑ์ ๊ฐ์ง๊ณ ์๋๊ณณ์ ๊ฐ์ฒด๊ฐ ์์๊ฑฐ ๊ฐ๋ค ๋ผ๋ ์ถ์ ์ ํ๋ ๊ฒ์ด Regional Proposal ์ด๋ผ๊ณ ํฉ๋๋ค. Regional Proposal ๋ฐฉ์์ Sliding Window์ ๋นํด ๋น ๋ฅด๋ค๋ ์ฅ์ ์ด ์์ผ๋ฏ๋ก, Sliding Window๋ ๊ฑฐ์ ์ฌ์ฉ๋๊ณ ์์ง ์์ต๋๋ค. Regional Proposal ๋ฐฉ์์ ํ์ฉํ๋ ๋ํ์ ์ธ ๋ชจ๋ธ์ธ Selective Search์ด๋ฉฐ, ์ด์ ๋ํด์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๐ก Selective Search(์ ํ์ ํ์)

Selection Search๊ฐ ์กด์ฌํ๊ธฐ์ ์๋ ํ๋ณด๊ฐ ๋ ๋งํ ๋์์ ํฌ๊ธฐ ๋ฐ ๋น์จ์ด ๋ชจ๋ ๋ค๋ฅธ ์ํฉ์ ๊ณ ๋ คํ์ฌ ํ๋ณด ์์ญ์ ์ฐพ๋ ๊ธฐ๋ฒ์ธ ์์ ํ์(Exhaustive Search) ๋ฐฉ๋ฒ์ด ์์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์์ Segmentation(ํฝ์ ๋จ์ ํ์ง)์ ๊ฒฐํฉํ์ฌ ๊ฐ์ ํ ๊ฒ์ด Selection Search์ ๋๋ค. ์ ํ์ ํ์์ ์๋์ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์งํ๋ฉ๋๋ค.
1. ์ด๊ธฐ ์์ญ ์์ฑ : ์ ๋ ฅ๋ ์ด๋ฏธ์ง์ ์กด์ฌํ๋ ๊ฐ๊ฐ์ ๊ฐ์ฒด(ํฐ๋น/์ฌ๋ ๋ฑ)๊ฐ ์์ญ ํ ๊ฐ์ ํ ๋น๋ ์ ์๋๋ก Segmentation์ ์งํํ๊ฒ ๋ฉ๋๋ค. ์ด๋ฅผ ํตํด ์ด๋ฏธ์ง์ ๊ฐ ๋ถ๋ถ์ด ์ด๋ป๊ฒ ์๋ก ์ฐ๊ด๋์ด ์๋์ง ํ์ ํ๋๋ฐ ๋์์ ์ค๋๋ค.
2. ์์ญ๋ค์ ํตํฉ : ์๋ก ์ฐ๊ด๋์ด ์๋ ์กฐ๊ทธ๋งํ ๊ทธ๋ฃนํํ์ฌ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ด๋ ํ์(Greedy) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ ํฐ์์ญ์ด ๋ ๋ ๊น์ง ๋ฐ๋ณต์ ํ๋๋ฐ, ์ด๋ ๊ฐ์ฒด์ ์ ์ฌ์ ์ธ ์์น๋ฅผ ํํํ๊ฒ ๋ฉ๋๋ค.
3. ์ ์ฌ์ฑ ๊ณ์ฐ : ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก 2๋จ๊ณ์์ ์งํํ์๋ ๊ฒ ์ฒ๋ผ, ์ ์ฌํ ์์ญ๋ค์ ๋ณํฉํ์ฌ ์กฐ๊ธ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ดํ, ํ๋ณด์์ญ(๋ฐ์ด๋ฉ ๋ฐ์ค)์ ์ถ์ถํ์ฌ, ๊ฐ์ฒด๋ฅผ ํ์งํ๊ฒ ๋ฉ๋๋ค.
'Computer Vision' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| [Object Detection] NMS(Non-Maximum Suppression) (0) | 2024.03.23 |
|---|---|
| [Object Detection] mAP(Mean Average Precision) ํ๊ฐ์งํ (0) | 2024.03.20 |
| [Object Detection] ๊ฐ๋ ์ ๋ฆฌ (0) | 2024.03.15 |
| [Image Classification] ๊ฐ๋ ๊ณผ ์๊ณ ๋ฆฌ์ฆ(LeNet5~ResNet) ์ดํดํ๊ธฐ (1) | 2024.03.07 |
| [๋ฅ๋ฌ๋ ๋ชจ๋ธ] CNN im2col ์ดํดํ๊ธฐ (0) | 2024.02.23 |