Attention, Please!!!

[Object Detection] NMS(Non-Maximum Suppression) ๋ณธ๋ฌธ

Computer Vision

[Object Detection] NMS(Non-Maximum Suppression)

G3LU 2024. 3. 23. 04:18

๐Ÿ’ก Non-Max Suppression์ด๋ž€,

์ž…๋ ฅ ์ด๋ฏธ์ง€์— Object Detection ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์˜ํ•ด bounding box regression์ด ์ ์šฉ๋˜๋ฉด, ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ๊ฐ์ฒด์— ์—ฌ๋Ÿฌ ๊ฐœ์˜ bboxr๊ฐ€ ๊ทธ๋ ค์ง€๋ฉฐ ๋ฌผ์ฒด์˜ ํ™•๋ฅ  ๊ฐ’์„ ๊ฐ€์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ ๊ฐœ์˜ bbox ์ค‘ ๊ฐ€์žฅ ์Šค์ฝ”์–ด๊ฐ€ ๋†’์€ ๋ฐ•์Šค๋งŒ ๋‚จ๊ธฐ๊ณ  ๋‚˜๋จธ์ง€๋ฅผ ์ œ๊ฑฐํ•˜๋Š” ๊ฒƒ์ด Non-Maximum Suppression ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์„ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ํ•˜๊ณ  ์ค‘๋ถ๋œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ฑฐํ•จ์œผ๋กœ์จ ์ •ํ™•ํ•œ ๊ฐ์ฒด ํƒ์ง€๋ฅผ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 

 

๐Ÿ“Œ  ๋™์ž‘ ์›๋ฆฌ

โ‘  Object Detection ํ›„๋ณด๊ตฐ ์ถ”์ถœ : ๊ฐ์ฒดํƒ์ง€ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ž…๋ ฅ ์ด๋ฏธ์ง€์—์„œ ๊ฐ์ฒด ํ›„๋ณด๊ตฐ์„ ์ถ”์ถœํ•ฉ๋‹ˆ๋‹ค. ์ด์— ๊ฐ ํ›„๋ณด ๊ฐ์ฒด์— ๋Œ€ํ•œ ์ถ”์ƒ์ ์ธ ์œ„์น˜์™€ ํ•ด๋‹น ๊ฐ์ฒด๊ฐ€ ์–ด๋–ค ํด๋ž˜์Šค์— ์†ํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ํ™•๋ฅ  ๊ฐ’์„ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, Confidence ๊ฐ’์„ ์ถ”์ถœํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•˜์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค.

 

โ‘ก IoU(Intersection over Union) ๊ณ„์‚ฐ ๋ฐ ์ •๋ ฌ : ๋ฐ•์Šค ๊ฐ„์˜ ๊ฒน์น˜๋Š” ์˜์—ญ์„ ์ธก์ •ํ•˜๋Š” ์ง€ํ‘œ์ด๋ฉฐ, ๊ณ„์‚ฐ๋œ IoU ๊ฐ’์— ๋”ฐ๋ผ ํ›„๋ณด ๊ฐ์ฒด๋“ค์„ ๋†’์€ ์ˆœ์„œ๋Œ€๋กœ ์ •๋ ฌํ•ฉ๋‹ˆ๋‹ค. ์ฃผ๋กœ IoU๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๊ฐ์ฒด๋ฅผ ์„ ํƒํ•˜๊ณ , ์ตœ์ข… ๊ฐ์ฒด๋กœ ์„ค์ •ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด๋Š” ๋‹ค๋ฅธ ๊ฐ์ฒด์™€ ๊ฒน์น˜๋Š” ๋ถ€๋ถ„์ด ์žˆ์„ ์ˆ˜๋„ ์žˆ์–ด, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋‹จ๊ณ„๋ฅผ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค.

 

โ‘ข ์ž„๊ณ„๊ฐ’(threshold) ์ ์šฉ : ์ผ์ • IoU ์ž„๊ณ„๊ฐ’(์ฃผ๋กœ 0.5)์œผ๋กœ ์„ค์ •ํ•˜์—ฌ, ์ด ์ž„๊ณ„๊ฐ’ ์ด์ƒ์œผ๋กœ ๊ฒน์น˜๋Š” ๊ฐ์ฒด๋“ค์„ ์ œ๊ฑฐํ•ฉ๋‹ˆ๋‹ค. 

 

โ‘ฃ ๋ฐ˜๋ณต ๋ฐ ์ตœ์ข… ๊ฐ์ฒด ๊ฒฐ์ • : ๋งŒ์•ฝ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋‹ค์ค‘ ํด๋ž˜์Šค๊ฐ€ ์กด์žฌํ•œ๋‹ค๋ฉด, (1)~(3) ๋‹จ๊ณ„๋ฅผ ๋ฐ˜๋ณตํ•ฉ๋‹ˆ๋‹ค.


๐Ÿ’ก Soft NMS๋ž€, 

 

๊ธฐ์กด NMS๋Š” ๊ฐ€์žฅ ๋†’์€ Confidence ๊ฐ’์„ ๊ฐ€์ง€๋Š” bbox๋ฅผ ์ฐพ๊ณ , ๊ฐ™์€ ํด๋ž˜์Šค์ธ bbox๋“ค ์ค‘ ๊ฒน์น˜๋Š” ์˜์—ญ์˜ ์ž„๊ณ„๊ฐ’์ด ์ด์ƒ์ด๋ผ๋ฉด ์ œ๊ฑฐํ•˜๋Š” ๊ฒƒ ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด์™€ ๊ฐ™์ด ์ž„๊ณ„๊ฐ’์„ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์€ ๋งค์šฐ ๋ณต์žกํ•˜๊ณ  ๊นŒ๋‹ค๋กœ์šฐ๋ฉฐ mAP๊ฐ€ ๋‚ฎ์•„์ง€๋Š” ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์˜ˆ์‹œ๋กœ ์œ„ ๊ทธ๋ฆผ์—์„œ Blueberry๋ฅผ ๊ฒ€์ถœํ•˜๊ธฐ ์œ„ํ•ด 0.53 ~ 0.92 Confidence ๊ฐ’์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๋†’์€ 0.92์˜ Blueberry๋ฅผ ์ œ์™ธํ•˜๊ณ , ๋‚˜๋จธ์ง€๋Š” ์‚ฌ๋ผ์ง€๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ์ ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด์„œ Soft-NMS๊ฐ€ ๊ณ ์•ˆ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. 

 

Soft-NMS์˜ ์•„์ด๋””์–ด๋Š” ์ƒ๊ฐ๋ณด๋‹ค ๋‹จ์ˆœํ•ฉ๋‹ˆ๋‹ค. ๋†’์€ IOU์™€ ๋†’์€ confidence score๋ฅผ ๊ฐ€์ง„ propsal์„ ์™„์ „ํžˆ ์ œ๊ฑฐํ•˜์ง€ ์•Š๊ณ  IOU์˜ ๊ฐ’์— ๋น„๋ก€ํ•˜์—ฌ proposal์˜ confidence๋ฅผ ์ค„์ธ๋‹ค.