| ์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- LLM ํจ๋ฌ๋ค์
- fp32
- fine tuning
- LLaVA
- ๋ฐ์ดํฐ ํ์ฑ
- ํ์ฑํํจ์
- bf16
- ์ด์ํ์ง
- fp16
- rrf
- ๋ฅ๋ฌ๋
- rag-fusion
- ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง
- ์ค์ฐจ์ญ์ ํ
- LLM
- pdf parsing
- Cross Entropy Error
- Time Series
- multi-query
- Mean squared error
- rag parsing
- anomaly detection
- visual instruction tuning
- ํ์ฑํ ํจ์
- qlora
- ํ์ธํ๋
- gemma3
- deep learning
- Non-Maximum Suppression
- Nested Learning
- Today
- Total
Attention, Please!!!
[Object Detection] Slide Window & Selective Search ๊ฐ๋ ๋ณธ๋ฌธ
๐ก Sliding Window & Regional Proposal
Object Detection์ ์ฌ๋ฌ ๊ฐ์ฒด์ ๋ํ ์์น์ ํด๋์ค๋ฅผ ๋ถ๋ฅํ๋๋ฐ, ๋ณต์กํ Feature Map์ด ๋์ถ๋๊ธฐ์ ๊ฐ์ฒด๋ฅผ ๋ถ๋ฅํ๋๋ฐ ์ด๋ ค์์ด ์์ต๋๋ค. ๊ทธ๋ผ Feature Map๋ฅผ ๊ฐ๋จํ๊ฒ ๋ง๋ค๊ธฐ ์ํด์๋ ์ด๋ป๊ฒ ํด์ผํ ๊น์? ์๊ฐ๋ณด๋ค ๋จ์ํฉ๋๋ค. ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ผ์ ํ ํฌ๊ธฐ์ ๊ฐ๊ฒฉ์ผ๋ก ๋๋๊ณ , ๊ฐ๊ฐ์ ๋๋ ์์ญ์์ ๊ฐ์ฒด๋ฅผ ์ฐพ๋๋ค๋ฉด ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์ Sliding Window๋ผ๊ณ ํฉ๋๋ค.

์ฆ, Sliding Window๋ ์ผ์ ํฌ๊ธฐ์ Window(๋ ธ๋์ ์์)๋ฅผ ์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ์ผ๋ก ์์ง์ด๋ฉด์, ๊ฐ๊ฐ์ Window ๋ด์ Feature Map๋ฅผ ๋์ถํ์ฌ ๊ฐ์ฒด๋ฅผ ์ธ์ํ๋ ๋ฐฉ์์ ๋๋ค.
๊ทธ๋ ๋ค๋ฉด ๋ง์ฝ ์ผ์ ํฌ๊ธฐ์ Window๊ฐ ๊ฐ์ฒด์ ํฌ๊ธฐ ๋ณด๋ค ํจ์ฌ ํฌ๋ค๋ฉด, ๊ฐ์ฒด๋ฅผ ์ธ์ํ์ง ๋ชปํ ๊ฒ ์ ๋๋ค. ์๋์ ์ฌ์ง๊ณผ ๊ฐ์ด ๊ธฐ๋ฆฐ์ด๋ผ๋ ๊ฐ์ฒด๋ ์ธ๋ก๋ก ๊ธธ์ญํ๋ฐ, ์ ์ฌ๊ฐํ ๋ชจ์์ Window๋ก ์ฐพ๊ธฐ๋ ํฐ ์ด๋ ค์์ด ์์ต๋๋ค.

์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด์๋, ์๋์ GIF์ ๊ฐ์ด Window ํฌ๊ธฐ๋ฅผ ๊ณ ์ ํ๋ ์ ๋ ฅ ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ๋ณ๊ฒฝํ๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.

"๋จ์"๋ผ๋ ๊ฐ์ฒด๋ฅผ ์ฐพ๊ธฐ ์ํด Sliding Window๊ฐ ์ง์์ ์ผ๋ก ์ข์ฐ๋ก ์์ง์ด๋ฉฐ, ์ ์ฒด์ ์ผ๋ก ํ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ฌ๊ธฐ์์ ๋ฌธ์ ์ ์ ๋ฐ๋ท๊ฐ/๋/๊ฑด์ถ๋ฌผ ๋ฑ ๋ค์ํ ๋ค์ค๊ฐ์ฒด์ ๋ํด ํ์ํ๊ณ ์์ผ๋ฉฐ, ๊ณ์ฐ๋์ด ์๋นํ ๋ง์์ง๋ ๊ฒ์ ์์์ฑ ์ ์์ต๋๋ค. ๋ง์ฝ ์ด๋ฌํ Sliding Window์ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด, ์ถ์ ํด๋ณด๋ฉด ์ด๋จ๊น์??
์ฆ, ์ผ์ผ์ด ์ด๋ฏธ์ง๋ฅผ ์ ์ฒด์ ์ผ๋ก ํ๋ ๊ฒ์ด ์๋๋ผ, ์ ๋ ฅ ์ด๋ฏธ์ง์ ์ ์ฌํ ํน์ฑ์ ๊ฐ์ง๊ณ ์๋๊ณณ์ ๊ฐ์ฒด๊ฐ ์์๊ฑฐ ๊ฐ๋ค ๋ผ๋ ์ถ์ ์ ํ๋ ๊ฒ์ด Regional Proposal ์ด๋ผ๊ณ ํฉ๋๋ค. Regional Proposal ๋ฐฉ์์ Sliding Window์ ๋นํด ๋น ๋ฅด๋ค๋ ์ฅ์ ์ด ์์ผ๋ฏ๋ก, Sliding Window๋ ๊ฑฐ์ ์ฌ์ฉ๋๊ณ ์์ง ์์ต๋๋ค. Regional Proposal ๋ฐฉ์์ ํ์ฉํ๋ ๋ํ์ ์ธ ๋ชจ๋ธ์ธ Selective Search์ด๋ฉฐ, ์ด์ ๋ํด์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๐ก Selective Search(์ ํ์ ํ์)

Selection Search๊ฐ ์กด์ฌํ๊ธฐ์ ์๋ ํ๋ณด๊ฐ ๋ ๋งํ ๋์์ ํฌ๊ธฐ ๋ฐ ๋น์จ์ด ๋ชจ๋ ๋ค๋ฅธ ์ํฉ์ ๊ณ ๋ คํ์ฌ ํ๋ณด ์์ญ์ ์ฐพ๋ ๊ธฐ๋ฒ์ธ ์์ ํ์(Exhaustive Search) ๋ฐฉ๋ฒ์ด ์์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์์ Segmentation(ํฝ์ ๋จ์ ํ์ง)์ ๊ฒฐํฉํ์ฌ ๊ฐ์ ํ ๊ฒ์ด Selection Search์ ๋๋ค. ์ ํ์ ํ์์ ์๋์ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์งํ๋ฉ๋๋ค.
1. ์ด๊ธฐ ์์ญ ์์ฑ : ์ ๋ ฅ๋ ์ด๋ฏธ์ง์ ์กด์ฌํ๋ ๊ฐ๊ฐ์ ๊ฐ์ฒด(ํฐ๋น/์ฌ๋ ๋ฑ)๊ฐ ์์ญ ํ ๊ฐ์ ํ ๋น๋ ์ ์๋๋ก Segmentation์ ์งํํ๊ฒ ๋ฉ๋๋ค. ์ด๋ฅผ ํตํด ์ด๋ฏธ์ง์ ๊ฐ ๋ถ๋ถ์ด ์ด๋ป๊ฒ ์๋ก ์ฐ๊ด๋์ด ์๋์ง ํ์ ํ๋๋ฐ ๋์์ ์ค๋๋ค.
2. ์์ญ๋ค์ ํตํฉ : ์๋ก ์ฐ๊ด๋์ด ์๋ ์กฐ๊ทธ๋งํ ๊ทธ๋ฃนํํ์ฌ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ด๋ ํ์(Greedy) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ ํฐ์์ญ์ด ๋ ๋ ๊น์ง ๋ฐ๋ณต์ ํ๋๋ฐ, ์ด๋ ๊ฐ์ฒด์ ์ ์ฌ์ ์ธ ์์น๋ฅผ ํํํ๊ฒ ๋ฉ๋๋ค.
3. ์ ์ฌ์ฑ ๊ณ์ฐ : ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก 2๋จ๊ณ์์ ์งํํ์๋ ๊ฒ ์ฒ๋ผ, ์ ์ฌํ ์์ญ๋ค์ ๋ณํฉํ์ฌ ์กฐ๊ธ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ดํ, ํ๋ณด์์ญ(๋ฐ์ด๋ฉ ๋ฐ์ค)์ ์ถ์ถํ์ฌ, ๊ฐ์ฒด๋ฅผ ํ์งํ๊ฒ ๋ฉ๋๋ค.
'Computer Vision' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| [Object Detection] NMS(Non-Maximum Suppression) (0) | 2024.03.23 |
|---|---|
| [Object Detection] mAP(Mean Average Precision) ํ๊ฐ์งํ (0) | 2024.03.20 |
| [Object Detection] ๊ฐ๋ ์ ๋ฆฌ (0) | 2024.03.15 |
| [Image Classification] ๊ฐ๋ ๊ณผ ์๊ณ ๋ฆฌ์ฆ(LeNet5~ResNet) ์ดํดํ๊ธฐ (1) | 2024.03.07 |
| [๋ฅ๋ฌ๋ ๋ชจ๋ธ] CNN im2col ์ดํดํ๊ธฐ (0) | 2024.02.23 |