ํฉ์ฑ๊ณฑ ์ธต(Convolution layer)
- ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง์ ํน์ง์ ์ถ์ถํ๋ ์ธต ์ค ํ๋์
๋๋ค.
- ์ผ์ ๊ฒฉ์ ํํ๋ฅผ ๊ฐ์ง ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ๋ณด๋ค ์๊ฑฐ๋ ๊ฐ์ ๊ฒฉ์์ ํํฐ๋ก ์ ํด์ง stride(ํํฐ๊ฐ ์์ง์ด๋ ๊ฐ๊ฒฉ)์ ๋ฐ๋ผ ํฉ์ฑ๊ณฑ์ ์งํํฉ๋๋ค.
- ํฉ์ฑ๊ณฑ์ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ (0, 0)๋ถํฐ (-1, -1)๊น์ง ํํฐ์ ๊ฒฉ์์ ํด๋นํ๋ ๊ฐ๊ณผ ๊ณฑํ์ฌ ๋ชจ๋ ๋ํ๋ ๊ณผ์ ์
๋๋ค.
ํจ๋ฉ(Padding)
- ํฉ์ฑ๊ณฑ ๊ณผ์ ์์ output์ shape์ input๊ณผ ๋ง์ถ๊ธฐ ์ํด ์ฌ์ฉํฉ๋๋ค.
- ๋ํ, ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ ๊ฐ ๊ฒฉ์๊ฐ์ ๊ฐ๋ฅํ ๊ท ํ์๊ฒ ์ฌ์ฉํ๊ธฐ ์ํด ํด์ฃผ๋ ์์
์
๋๋ค.
- ์ผ๋ฐ์ ์ผ๋ก ์ด๋ฏธ์ง ๊ฒฉ์์ ํ
๋๋ฆฌ์ 0 ๊ฐ์ผ๋ก ๋๋ฌ์ฃผ๋ ์์
์ ํ๊ฒ ๋ฉ๋๋ค.
์คํธ๋ผ์ด๋(Stride)
- ํฉ์ฑ๊ณฑ ๊ณผ์ ์์ ํํฐ๊ฐ slideํ ๋ ์์ง์ด๋ ๊ฐ๊ฒฉ๊ฐ์
๋๋ค.
- stride๊ฐ ์์์๋ก ๋ ์ธ์ธํ๊ฒ ๋ฐ์ดํฐ์ ๊ฐ ๊ฒฉ์๊ฐ์ ๋ฐ์ํ๋ ๋ฐ๋ฉด, ํด์๋ก ๋ roughํ๊ฒ ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ํ๊ฒ ๋ฉ๋๋ค.
ํ๋ง(Pooling)
- ํฉ์ฑ๊ณฑ ๊ณผ์ ํ output์ธ
feature map
์ ์ ์ฉํ๋ ๊ณผ์ ์
๋๋ค.
- ํํฐ์ ๋น์ทํ์ง๋ง ์ ํด์ง shape์์ ๊ฐ์ฅ ํฐ ๊ฐ์ ๊ณ ๋ฅธ๋ค๋ ๊ฐ(Max Pooling) shape ๋ด์ ๊ฐ์ ํ๊ท ํ๋ค๋ ๊ฐ(Average Pooling)์ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.
- ์ผ๋ฐ์ ์ผ๋ก ๊ฒฉ์์ ํฌ๊ธฐ์ stride ๊ฐ์ ๊ฐ๊ฒ ํ์ฌ ์ต๋ํ ๋ฐ์ดํฐ๊ฐ ์ค๋ณต๋์ง ์๊ฒํฉ๋๋ค.
- ํฉ์ฑ๊ณฑ ํํฐ๋ง๊ณผ ๋ค๋ฅด๊ฒ ๊ฐ์ค์น๊ฐ ์๊ณ ์ฑ๋ ์์ ๋ณํ๋ฅผ ์ฃผ์ง ์๋๋ค๋ ํน์ง์ด ์์ต๋๋ค.
์ ์ด ํ์ต(Transfer Learning)
- ์ฌ์ ํ์ต ๋ ๋ชจ๋ธ(์์ฃผ ํฐ ๋ฐ์ดํฐ๋ฅผ ์ด๋ฏธ ํ์ตํ ๋ชจ๋ธ)์ ๊ฐ์ค์น๋ฅผ ๊ทธ๋๋ก ๊ฐ์ ธ์ ์ ๊ฒฝ๋ง์ ๋ท๋จ์ธ ์์ ์ฐ๊ฒฐ ์ ๊ฒฝ๋ง ๋ถ๋ถ๋ง ์ถ๊ฐ๋ก ์ค๊ณํ์ฌ ํ์ต์ํค๋ ๋ฐฉ๋ฒ์
๋๋ค.
- ์๋ฌด๋๋ ์ฌ์ ์ ์ ํ์ต๋ ๋ชจ๋ธ์ ๊ฐ์ค์น๋ฅผ ๊ฐ์ ธ์ค๊ธฐ ๋๋ฌธ์, ๋ฐ์ดํฐ ์์ง/๋ชจ๋ธ ๊ตฌ์ถ ๋ฑ์ ์๊ฐ์์ ํจ์จ์ ์ธ ๋ฉด์ด ์์ต๋๋ค.
- ๋ํ์ ์ผ๋ก VGG, GoogLeNet, ResNet ๋ฑ์ด ์์ต๋๋ค.
[๋ฅ๋ฌ๋, CV] ์คํ ์ธ์ฝ๋, ์ ์ฌ ๋ฒกํฐ, ์ด์์น ํ์ง, ๋
ธ์ด์ฆ ์ ๊ฑฐ (0) |
2022.03.14 |
[๋ฅ๋ฌ๋, CV] FCN, ๊ฐ์ฒด ํ์ง/์ธ์ (0) |
2022.03.11 |
[๋ฅ๋ฌ๋, NLP] ๋ค์ํ ํ
์คํธ ์ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ (0) |
2022.03.09 |
[๋ฅ๋ฌ๋, NLP] Transformer(Positional encoding, Attention) (0) |
2022.03.07 |
[๋ฅ๋ฌ๋, NLP] RNN, LSTM, GRU (0) |
2022.03.06 |