์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- ์์คํจ์
- multi-query
- Cross Entropy Error
- rrf
- Non-Maximum Suppression
- pdf parsing
- deep learning
- leetcode
- LLM
- ํ์ธํ๋
- rag parsing
- anomaly detection
- LLaVA
- nlp
- Mean squared error
- ์ค์ฐจ์ญ์ ํ
- gemma3
- ๋ฐ์ดํฐ ํ์ฑ
- ์ด์ํ์ง
- ํผ์ ํธ๋ก
- visual instruction tuning
- ๋ฅ๋ฌ๋
- qlora
- ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง
- ํ์ฑํ ํจ์
- Time Series
- ์๊ณ์ด
- rag-fusion
- ํ์ฑํํจ์
- fine tuning
- Today
- Total
Attention, Please!!!
[Object Detection] Slide Window & Selective Search ๊ฐ๋ ๋ณธ๋ฌธ
๐ก Sliding Window & Regional Proposal
Object Detection์ ์ฌ๋ฌ ๊ฐ์ฒด์ ๋ํ ์์น์ ํด๋์ค๋ฅผ ๋ถ๋ฅํ๋๋ฐ, ๋ณต์กํ Feature Map์ด ๋์ถ๋๊ธฐ์ ๊ฐ์ฒด๋ฅผ ๋ถ๋ฅํ๋๋ฐ ์ด๋ ค์์ด ์์ต๋๋ค. ๊ทธ๋ผ Feature Map๋ฅผ ๊ฐ๋จํ๊ฒ ๋ง๋ค๊ธฐ ์ํด์๋ ์ด๋ป๊ฒ ํด์ผํ ๊น์? ์๊ฐ๋ณด๋ค ๋จ์ํฉ๋๋ค. ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ผ์ ํ ํฌ๊ธฐ์ ๊ฐ๊ฒฉ์ผ๋ก ๋๋๊ณ , ๊ฐ๊ฐ์ ๋๋ ์์ญ์์ ๊ฐ์ฒด๋ฅผ ์ฐพ๋๋ค๋ฉด ํด๊ฒฐํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์ Sliding Window๋ผ๊ณ ํฉ๋๋ค.
์ฆ, Sliding Window๋ ์ผ์ ํฌ๊ธฐ์ Window(๋ ธ๋์ ์์)๋ฅผ ์ผ์ชฝ์์ ์ค๋ฅธ์ชฝ์ผ๋ก ์์ง์ด๋ฉด์, ๊ฐ๊ฐ์ Window ๋ด์ Feature Map๋ฅผ ๋์ถํ์ฌ ๊ฐ์ฒด๋ฅผ ์ธ์ํ๋ ๋ฐฉ์์ ๋๋ค.
๊ทธ๋ ๋ค๋ฉด ๋ง์ฝ ์ผ์ ํฌ๊ธฐ์ Window๊ฐ ๊ฐ์ฒด์ ํฌ๊ธฐ ๋ณด๋ค ํจ์ฌ ํฌ๋ค๋ฉด, ๊ฐ์ฒด๋ฅผ ์ธ์ํ์ง ๋ชปํ ๊ฒ ์ ๋๋ค. ์๋์ ์ฌ์ง๊ณผ ๊ฐ์ด ๊ธฐ๋ฆฐ์ด๋ผ๋ ๊ฐ์ฒด๋ ์ธ๋ก๋ก ๊ธธ์ญํ๋ฐ, ์ ์ฌ๊ฐํ ๋ชจ์์ Window๋ก ์ฐพ๊ธฐ๋ ํฐ ์ด๋ ค์์ด ์์ต๋๋ค.
์ด๋ฌํ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด์๋, ์๋์ GIF์ ๊ฐ์ด Window ํฌ๊ธฐ๋ฅผ ๊ณ ์ ํ๋ ์ ๋ ฅ ์ด๋ฏธ์ง์ ํฌ๊ธฐ๋ฅผ ๋ณ๊ฒฝํ๋ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.
"๋จ์"๋ผ๋ ๊ฐ์ฒด๋ฅผ ์ฐพ๊ธฐ ์ํด Sliding Window๊ฐ ์ง์์ ์ผ๋ก ์ข์ฐ๋ก ์์ง์ด๋ฉฐ, ์ ์ฒด์ ์ผ๋ก ํ๊ณ ์์ต๋๋ค. ํ์ง๋ง ์ฌ๊ธฐ์์ ๋ฌธ์ ์ ์ ๋ฐ๋ท๊ฐ/๋/๊ฑด์ถ๋ฌผ ๋ฑ ๋ค์ํ ๋ค์ค๊ฐ์ฒด์ ๋ํด ํ์ํ๊ณ ์์ผ๋ฉฐ, ๊ณ์ฐ๋์ด ์๋นํ ๋ง์์ง๋ ๊ฒ์ ์์์ฑ ์ ์์ต๋๋ค. ๋ง์ฝ ์ด๋ฌํ Sliding Window์ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด, ์ถ์ ํด๋ณด๋ฉด ์ด๋จ๊น์??
์ฆ, ์ผ์ผ์ด ์ด๋ฏธ์ง๋ฅผ ์ ์ฒด์ ์ผ๋ก ํ๋ ๊ฒ์ด ์๋๋ผ, ์ ๋ ฅ ์ด๋ฏธ์ง์ ์ ์ฌํ ํน์ฑ์ ๊ฐ์ง๊ณ ์๋๊ณณ์ ๊ฐ์ฒด๊ฐ ์์๊ฑฐ ๊ฐ๋ค ๋ผ๋ ์ถ์ ์ ํ๋ ๊ฒ์ด Regional Proposal ์ด๋ผ๊ณ ํฉ๋๋ค. Regional Proposal ๋ฐฉ์์ Sliding Window์ ๋นํด ๋น ๋ฅด๋ค๋ ์ฅ์ ์ด ์์ผ๋ฏ๋ก, Sliding Window๋ ๊ฑฐ์ ์ฌ์ฉ๋๊ณ ์์ง ์์ต๋๋ค. Regional Proposal ๋ฐฉ์์ ํ์ฉํ๋ ๋ํ์ ์ธ ๋ชจ๋ธ์ธ Selective Search์ด๋ฉฐ, ์ด์ ๋ํด์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.
๐ก Selective Search(์ ํ์ ํ์)
Selection Search๊ฐ ์กด์ฌํ๊ธฐ์ ์๋ ํ๋ณด๊ฐ ๋ ๋งํ ๋์์ ํฌ๊ธฐ ๋ฐ ๋น์จ์ด ๋ชจ๋ ๋ค๋ฅธ ์ํฉ์ ๊ณ ๋ คํ์ฌ ํ๋ณด ์์ญ์ ์ฐพ๋ ๊ธฐ๋ฒ์ธ ์์ ํ์(Exhaustive Search) ๋ฐฉ๋ฒ์ด ์์์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ์์์ Segmentation(ํฝ์ ๋จ์ ํ์ง)์ ๊ฒฐํฉํ์ฌ ๊ฐ์ ํ ๊ฒ์ด Selection Search์ ๋๋ค. ์ ํ์ ํ์์ ์๋์ ๊ฐ์ ๋ฐฉ์์ผ๋ก ์งํ๋ฉ๋๋ค.
1. ์ด๊ธฐ ์์ญ ์์ฑ : ์ ๋ ฅ๋ ์ด๋ฏธ์ง์ ์กด์ฌํ๋ ๊ฐ๊ฐ์ ๊ฐ์ฒด(ํฐ๋น/์ฌ๋ ๋ฑ)๊ฐ ์์ญ ํ ๊ฐ์ ํ ๋น๋ ์ ์๋๋ก Segmentation์ ์งํํ๊ฒ ๋ฉ๋๋ค. ์ด๋ฅผ ํตํด ์ด๋ฏธ์ง์ ๊ฐ ๋ถ๋ถ์ด ์ด๋ป๊ฒ ์๋ก ์ฐ๊ด๋์ด ์๋์ง ํ์ ํ๋๋ฐ ๋์์ ์ค๋๋ค.
2. ์์ญ๋ค์ ํตํฉ : ์๋ก ์ฐ๊ด๋์ด ์๋ ์กฐ๊ทธ๋งํ ๊ทธ๋ฃนํํ์ฌ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ด๋ ํ์(Greedy) ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ ํฐ์์ญ์ด ๋ ๋ ๊น์ง ๋ฐ๋ณต์ ํ๋๋ฐ, ์ด๋ ๊ฐ์ฒด์ ์ ์ฌ์ ์ธ ์์น๋ฅผ ํํํ๊ฒ ๋ฉ๋๋ค.
3. ์ ์ฌ์ฑ ๊ณ์ฐ : ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก 2๋จ๊ณ์์ ์งํํ์๋ ๊ฒ ์ฒ๋ผ, ์ ์ฌํ ์์ญ๋ค์ ๋ณํฉํ์ฌ ์กฐ๊ธ ๋ ํฐ ์์ญ์ ํ์ฑํ๊ฒ ๋ฉ๋๋ค. ์ดํ, ํ๋ณด์์ญ(๋ฐ์ด๋ฉ ๋ฐ์ค)์ ์ถ์ถํ์ฌ, ๊ฐ์ฒด๋ฅผ ํ์งํ๊ฒ ๋ฉ๋๋ค.
'Computer Vision' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Object Detection] NMS(Non-Maximum Suppression) (0) | 2024.03.23 |
---|---|
[Object Detection] mAP(Mean Average Precision) ํ๊ฐ์งํ (0) | 2024.03.20 |
[Object Detection] ๊ฐ๋ ์ ๋ฆฌ (0) | 2024.03.15 |
[Image Classification] ๊ฐ๋ ๊ณผ ์๊ณ ๋ฆฌ์ฆ(LeNet5~ResNet) ์ดํดํ๊ธฐ (1) | 2024.03.07 |
[๋ฅ๋ฌ๋ ๋ชจ๋ธ] CNN im2col ์ดํดํ๊ธฐ (0) | 2024.02.23 |