| ์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
- ํ์ฑํํจ์
- rag parsing
- qlora
- Non-Maximum Suppression
- rag-fusion
- ์ด์ํ์ง
- LLM
- visual instruction tuning
- fine tuning
- ํ์ฑํ ํจ์
- deep learning
- fp16
- ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง
- bf16
- multi-query
- Cross Entropy Error
- LLM ํจ๋ฌ๋ค์
- fp32
- Mean squared error
- Time Series
- gemma3
- rrf
- anomaly detection
- Nested Learning
- ํ์ธํ๋
- ๋ฅ๋ฌ๋
- pdf parsing
- ์ค์ฐจ์ญ์ ํ
- ๋ฐ์ดํฐ ํ์ฑ
- LLaVA
- Today
- Total
Attention, Please!!!
[Object Detection] Slide Window & Selective Search ๊ฐ๋ ๋ณธ๋ฌธ
๐ก Sliding Window & Regional Proposal
Object Detection์ ์ฌ๋ฌ ๊ฐ์ฒด์ ๋ํ ์์น์ ํด๋์ค๋ฅผ ๋ถ๋ฅํ๋๋ฐ, ๋ณต์กํ Feature Map์ด ๋์ถ๋๊ธฐ์ ๊ฐ์ฒด๋ฅผ ๋ถ๋ฅํ๋๋ฐ ์ด๋ ค์์ด ์์ต๋๋ค. ๊ทธ๋ผ Feature Map๋ฅผ ๊ฐ๋จํ๊ฒ ๋ง๋ค๊ธฐ ์ํด์๋ ์ด๋ป๊ฒ ํด์ผํ ๊น์? ์๊ฐ๋ณด๋ค ๋จ์ํฉ๋๋ค. ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ผ์ ํ ํฌ๊ธฐ์ ๊ฐ๊ฒฉ์ผ๋ก ๋๋๊ณ , ๊ฐ๊ฐ์ ๋๋ ์์ญ์์ ๊ฐ์ฒด๋ฅผ ์ฐพ๋๋ค๋ฉด ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์ Sliding Window๋ผ๊ณ ํฉ๋๋ค.

์ฆ, Sliding Window๋ ์ผ์ ํฌ๊ธฐ์ Window(๋ ธ๋์ ์์)๋ฅผ ์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ์ผ๋ก ์์ง์ด๋ฉด์, ๊ฐ๊ฐ์ Window ๋ด์ Feature Map๋ฅผ ๋์ถํ์ฌ ๊ฐ์ฒด๋ฅผ ์ธ์ํ๋ ๋ฐฉ์์ ๋๋ค.
๊ทธ๋ ๋ค๋ฉด ๋ง์ฝ ์ผ์ ํฌ๊ธฐ์ Window๊ฐ ๊ฐ์ฒด์ ํฌ๊ธฐ ๋ณด๋ค ํจ์ฌ ํฌ๋ค๋ฉด, ๊ฐ์ฒด๋ฅผ ์ธ์ํ์ง ๋ชปํ ๊ฒ ์ ๋๋ค. ์๋์ ์ฌ์ง๊ณผ ๊ฐ์ด ๊ธฐ๋ฆฐ์ด๋ผ๋ ๊ฐ์ฒด๋ ์ธ๋ก๋ก ๊ธธ์ญํ๋ฐ, ์ ์ฌ๊ฐํ ๋ชจ์์ Window๋ก ์ฐพ๊ธฐ๋ ํฐ ์ด๋ ค์์ด ์์ต๋๋ค.

์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด์๋, ์๋์ GIF์ ๊ฐ์ด Window ํฌ๊ธฐ๋ฅผ ๊ณ ์ ํ๋ ์ ๋ ฅ ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ๋ณ๊ฒฝํ๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.

"๋จ์"๋ผ๋ ๊ฐ์ฒด๋ฅผ ์ฐพ๊ธฐ ์ํด Sliding Window๊ฐ ์ง์์ ์ผ๋ก ์ข์ฐ๋ก ์์ง์ด๋ฉฐ, ์ ์ฒด์ ์ผ๋ก ํ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ฌ๊ธฐ์์ ๋ฌธ์ ์ ์ ๋ฐ๋ท๊ฐ/๋/๊ฑด์ถ๋ฌผ ๋ฑ ๋ค์ํ ๋ค์ค๊ฐ์ฒด์ ๋ํด ํ์ํ๊ณ ์์ผ๋ฉฐ, ๊ณ์ฐ๋์ด ์๋นํ ๋ง์์ง๋ ๊ฒ์ ์์์ฑ ์ ์์ต๋๋ค. ๋ง์ฝ ์ด๋ฌํ Sliding Window์ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด, ์ถ์ ํด๋ณด๋ฉด ์ด๋จ๊น์??
์ฆ, ์ผ์ผ์ด ์ด๋ฏธ์ง๋ฅผ ์ ์ฒด์ ์ผ๋ก ํ๋ ๊ฒ์ด ์๋๋ผ, ์ ๋ ฅ ์ด๋ฏธ์ง์ ์ ์ฌํ ํน์ฑ์ ๊ฐ์ง๊ณ ์๋๊ณณ์ ๊ฐ์ฒด๊ฐ ์์๊ฑฐ ๊ฐ๋ค ๋ผ๋ ์ถ์ ์ ํ๋ ๊ฒ์ด Regional Proposal ์ด๋ผ๊ณ ํฉ๋๋ค. Regional Proposal ๋ฐฉ์์ Sliding Window์ ๋นํด ๋น ๋ฅด๋ค๋ ์ฅ์ ์ด ์์ผ๋ฏ๋ก, Sliding Window๋ ๊ฑฐ์ ์ฌ์ฉ๋๊ณ ์์ง ์์ต๋๋ค. Regional Proposal ๋ฐฉ์์ ํ์ฉํ๋ ๋ํ์ ์ธ ๋ชจ๋ธ์ธ Selective Search์ด๋ฉฐ, ์ด์ ๋ํด์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๐ก Selective Search(์ ํ์ ํ์)

Selection Search๊ฐ ์กด์ฌํ๊ธฐ์ ์๋ ํ๋ณด๊ฐ ๋ ๋งํ ๋์์ ํฌ๊ธฐ ๋ฐ ๋น์จ์ด ๋ชจ๋ ๋ค๋ฅธ ์ํฉ์ ๊ณ ๋ คํ์ฌ ํ๋ณด ์์ญ์ ์ฐพ๋ ๊ธฐ๋ฒ์ธ ์์ ํ์(Exhaustive Search) ๋ฐฉ๋ฒ์ด ์์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์์ Segmentation(ํฝ์ ๋จ์ ํ์ง)์ ๊ฒฐํฉํ์ฌ ๊ฐ์ ํ ๊ฒ์ด Selection Search์ ๋๋ค. ์ ํ์ ํ์์ ์๋์ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์งํ๋ฉ๋๋ค.
1. ์ด๊ธฐ ์์ญ ์์ฑ : ์ ๋ ฅ๋ ์ด๋ฏธ์ง์ ์กด์ฌํ๋ ๊ฐ๊ฐ์ ๊ฐ์ฒด(ํฐ๋น/์ฌ๋ ๋ฑ)๊ฐ ์์ญ ํ ๊ฐ์ ํ ๋น๋ ์ ์๋๋ก Segmentation์ ์งํํ๊ฒ ๋ฉ๋๋ค. ์ด๋ฅผ ํตํด ์ด๋ฏธ์ง์ ๊ฐ ๋ถ๋ถ์ด ์ด๋ป๊ฒ ์๋ก ์ฐ๊ด๋์ด ์๋์ง ํ์ ํ๋๋ฐ ๋์์ ์ค๋๋ค.
2. ์์ญ๋ค์ ํตํฉ : ์๋ก ์ฐ๊ด๋์ด ์๋ ์กฐ๊ทธ๋งํ ๊ทธ๋ฃนํํ์ฌ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ด๋ ํ์(Greedy) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ ํฐ์์ญ์ด ๋ ๋ ๊น์ง ๋ฐ๋ณต์ ํ๋๋ฐ, ์ด๋ ๊ฐ์ฒด์ ์ ์ฌ์ ์ธ ์์น๋ฅผ ํํํ๊ฒ ๋ฉ๋๋ค.
3. ์ ์ฌ์ฑ ๊ณ์ฐ : ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก 2๋จ๊ณ์์ ์งํํ์๋ ๊ฒ ์ฒ๋ผ, ์ ์ฌํ ์์ญ๋ค์ ๋ณํฉํ์ฌ ์กฐ๊ธ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ดํ, ํ๋ณด์์ญ(๋ฐ์ด๋ฉ ๋ฐ์ค)์ ์ถ์ถํ์ฌ, ๊ฐ์ฒด๋ฅผ ํ์งํ๊ฒ ๋ฉ๋๋ค.
'Computer Vision' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| [Object Detection] NMS(Non-Maximum Suppression) (0) | 2024.03.23 |
|---|---|
| [Object Detection] mAP(Mean Average Precision) ํ๊ฐ์งํ (0) | 2024.03.20 |
| [Object Detection] ๊ฐ๋ ์ ๋ฆฌ (0) | 2024.03.15 |
| [Image Classification] ๊ฐ๋ ๊ณผ ์๊ณ ๋ฆฌ์ฆ(LeNet5~ResNet) ์ดํดํ๊ธฐ (1) | 2024.03.07 |
| [๋ฅ๋ฌ๋ ๋ชจ๋ธ] CNN im2col ์ดํดํ๊ธฐ (0) | 2024.02.23 |