ํค์๋
- Segmentation(Semantic / Instance)
- Transpose Convolution
- Object Detection/Recognition
Image Segmentation
- ํ๋์ ์ด๋ฏธ์ง์์ ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ฌผ์ฒด๋ฅผ ๋จ์๋ก ๊ตฌ๋ถํด๋ด๋ Task
- ์ด๋ฏธ์ง ๋ถ๋ฅ : ์ด๋ฏธ์ง ์์ฒด๋ฅผ ํ๋์ label๋ก ์์ธก(๋๋ฌด ์ฌ์ง์ ๋๋ฌด๋ก ์์ธก)
- ์ด๋ฏธ์ง ๋ถํ : ์ด๋ฏธ์ง ๋ด์ ์ฌ๋ฌ ์ฌ๋ฌผ๋ค์ ์๋ฏธ์๋ ๋จ์๋ก ๊ตฌ๋ถ -> ํฝ์ ๋จ์๋ก label ์์ธก
[Segmentation] Semantic VS (semantic) Instance
- Semantic : ์์์์ ๊ฐ์ด ์๋ฏธ์๋ ๋จ์๋ก ๋ฌผ์ฒด๋ฅผ ๊ตฌ๋ถ ex) ์ฌ๋ -> ์ฌ๋, ๊ฐ์์ง -> ๊ฐ์์ง
- Semantic Instance : ๊ฐ ๊ฐ์ฒด ๋ณ๋ก ๊ตฌ๋ถ ex) ์ฌ๋1, ์ฌ๋2, ์ฌ๋3 (์ฆ, ์ฌ๋์ด์ด๋ ๋ค ๋ค๋ฅธ ์ฌ๋์ ๊ตฌ๋ถ)
Segmentation Model
[Model] FCN(Fully Convolutional Networks)
- ์ด๋ฏธ์ง ๋ถ๋ฅ๋ฅผ ์ํ CCN์์ ๋ถ๋ฅ๊ธฐ ๋ถ๋ถ(์์ ์ฐ๊ฒฐ ์ ๊ฒฝ๋ง ๋ถ๋ถ)์ ํฉ์ฑ๊ณฑ ์ธต(Convolutional Layer)๋ก ๋์ฒดํ ๋ชจ๋ธ
- ์ด๋ฏธ์ง ๋ถํ ํน์ฑ ์, ์ด๋ฏธ์ง์ ํฝ์ ๋จ์๋ก ๋ถ๋ฅ๊ฐ ์ด๋ฃจ์ด์ง๊ธฐ์ ํฝ์ ์ ์์น ์ ๋ณด๋ฅผ ๋๊น์ง ๋ณด์กดํด์ผํฉ๋๋ค.
- ์๋ ๊ทธ๋ฆผ์์ ์ด๋ฏธ์ง์ ํฌ๊ธฐ๊ฐ ์ปค์ง๋ ๋ถ๋ถ์ด ํฝ์
์ ์์น ์ ๋ณด๋ฅผ ๋ณด์กดํ๊ธฐ ์ํด input๊ณผ ๋น์ทํ ํฌ๊ธฐ๋ก ํค์์ฃผ๋ ๊ณผ์ ์ผ๋ก ์ด๋ฅผ
Upsampling
์ด๋ผ๊ณ ํฉ๋๋ค.
[FCN] Upsampling
- CNN์์ Convolution๊ณผ Pooling์ ํตํด ์ด๋ฏธ์ง์ ํน์ง์ ์ถ์ถํ๋ ๊ณผ์ ์
Downsampling
์ด๋ผ๊ณ ํฉ๋๋ค. - ์ด์ ๋ฐ๋๋ก FCN์์ ํน์ง ์ถ์ถ ํ ์ด๋ฏธ์ง๋ฅผ ๋ค์ ์๋ ํฌ๊ธฐ๋ก ๋ณต์ํ๋ ๊ณผ์ ์
Upsampling
์ด๋ผ๊ณ ํฉ๋๋ค. - Upsampling์๋ Transpose Convolution๊ณผ Unpooling๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ์ด ์์ต๋๋ค. Convolution๊ณผ Pooling์ ๊ณผ์ ์ ๊ฑฐ๊พธ๋ก ํฉ๋๋ค.
[Model] U-net
- ์ด๋ฏธ์ง ๋ถํ ์ ์ํ ๋ํ์ ์ธ ๋ชจ๋ธ ์ค ํ๋๋ก End-to-End ๋ฐฉ์์ FCN ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋๋ค.
- ํฌ๊ฒ
Downsampling
๊ณผUpsampling
๋ถ๋ถ์ผ๋ก ๋๋์ด์ง๋๋ค. - Downsampling์ Convolution ๋ฐ Pooling ๊ณผ์ ์ ํตํด ์ด๋ฏธ์ง์ ํน์ง์ ์ถ์ถํฉ๋๋ค.
- Upsampling์ ๊ฒฝ์ฐ Convolution ๋ฐ Transpose Convolution ๊ณผ์ ์ ํตํด ์๋ณธ๊ณผ ๋น์ทํ ํฌ๊ธฐ๋ก ๋ณต์ํฉ๋๋ค.
- ๋ํ, Downsampling ๊ฐ level์์์ output์ธ feature map์ ์ ๋นํ ํฌ๊ธฐ๋ก ๋ง๋ค์ด ๊ฐ์ level์์์ Upsampling input์ concatํ์ฌ ์ฌ์ฉํฉ๋๋ค. (skip-connetion๊ณผ ๊ฐ์ด ์์ค๋๋ ์ ๋ณด๋ฅผ ์ด๋ ์ ๋ ๋ณด์กดํด์ฃผ๋ ์ญํ ์ ํฉ๋๋ค.)
Object Detection/Recognition
- ์ ์ฒด ์ด๋ฏธ์ง์์ ๋ ์ด๋ธ์ ๋ง๋ ๊ฐ์ฒด๋ฅผ ์ฐพ์๋ด๋ Task
- ๊ฐ์ฒด์ ๊ฒฝ๊ณ์ Bounding Box๋ผ๋ ์ฌ๊ฐํ ๋ฐ์ค๋ฅผ ๋ถ์ฌ ํ, ๋ฐ์ค ๋ด์ ๊ฐ์ฒด๊ฐ ์ํ๋ ํด๋์ค๋ฅผ ๋ถ๋ฅํฉ๋๋ค.
[Object Detection] IoU(Intersection over Union)
- ๊ฐ์ฒด ํ์ง์ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๋ ์งํ
- $IoU = \frac{์์ธก ์์ญ \cap ์ค์ ์์ญ}{์์ธก ์์ญ \cup ์ค์ ์์ญ}$
- ์ฆ, IoU๊ฐ 1์ ๊ฐ๊น์ธ์๋ก ์ฑ๋ฅ์ด ์ข์์ ๋ปํฉ๋๋ค.
[Object Detection] Model mechanism
- Two Stage Detector : ๋จผ์ ๊ฐ์ฒด๊ฐ ์์ ๋งํ ์์น๋ฅผ ์ถ์ฒ ๋ฐ์ ํ(Region Proposal), ์ถ์ฒ ๋ฐ์ ์ง์ญ(Region of Interest ; RoI)์ ๋ํด ๋ถ๋ฅ๋ฅผ ์งํํ๋ ๋ฐฉ์, ์๋์ ์ผ๋ก ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฌ๊ณ ๋น๊ต์ ์ฑ๋ฅ์ด ์ข์ต๋๋ค.
- One Stage Detector : ํน์ ์ง์ญ์ ์ถ์ฒ๋ฐ๋ ๊ฒ ์๋, ์ ๋ ฅ ์ด๋ฏธ์ง๋ฅผ grid์ ๊ฐ์ ์์ ๊ณต๊ฐ์ผ๋ก ๋๋ ๋ค ํด๋น ๊ณต๊ฐ์ ํ์ํ๋ฉฐ ๋ถ๋ฅ๋ฅผ ์งํํ๋ ๋ฐฉ์, ์๋์ ์ผ๋ก ์๊ฐ์ด ์งง๊ฒ ๊ฑธ๋ฆฌ๊ณ ๋น๊ต์ ์ฑ๋ฅ์ด ๋จ์ด์ง๋๋ค.
'๐ฟ Data > ๋ถํธ์บ ํ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[TIL] 85. GAN(Generative Adversarial Networks) (0) | 2022.03.15 |
---|---|
[TIL] 84. AutoEncoder (0) | 2022.03.14 |
[TIL] 82. ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(CNN) ๋ฐ ์ ์ด ํ์ต(Transfer Learning) (0) | 2022.03.10 |
[TIL] 81. Section4 Sprint2 (0) | 2022.03.09 |
[TIL] 80. Transformer (0) | 2022.03.09 |