
๐ฟ Data/๋ถํธ์บ ํ
[TIL] 83. Image Segmentation, Object Detection/Recognition
ํค์๋ Segmentation(Semantic / Instance) Transpose Convolution Object Detection/Recognition Image Segmentation ํ๋์ ์ด๋ฏธ์ง์์ ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ฌผ์ฒด๋ฅผ ๋จ์๋ก ๊ตฌ๋ถํด๋ด๋ Task ์ด๋ฏธ์ง ๋ถ๋ฅ : ์ด๋ฏธ์ง ์์ฒด๋ฅผ ํ๋์ label๋ก ์์ธก(๋๋ฌด ์ฌ์ง์ ๋๋ฌด๋ก ์์ธก) ์ด๋ฏธ์ง ๋ถํ : ์ด๋ฏธ์ง ๋ด์ ์ฌ๋ฌ ์ฌ๋ฌผ๋ค์ ์๋ฏธ์๋ ๋จ์๋ก ๊ตฌ๋ถ -> ํฝ์ ๋จ์๋ก label ์์ธก [Segmentation] Semantic VS (semantic) Instance Semantic : ์์์์ ๊ฐ์ด ์๋ฏธ์๋ ๋จ์๋ก ๋ฌผ์ฒด๋ฅผ ๊ตฌ๋ถ ex) ์ฌ๋ -> ์ฌ๋, ๊ฐ์์ง -> ๊ฐ์์ง Semantic Instance : ๊ฐ ๊ฐ์ฒด ๋ณ๋ก ๊ตฌ๋ถ ex) ์ฌ๋1, ์ฌ๋2..
[TIL] 82. ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(CNN) ๋ฐ ์ ์ด ํ์ต(Transfer Learning)
ํค์๋ CNN(Convolutional Neural Network) padding, stride, filter Pooling Transfer Learning Image Data Augmentation CNN(Convolutional Neural Network ; ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง) ์ปดํจํฐ ๋น์ ์์ ์์ฃผ ์ฌ์ฉ๋๋ ์ ๊ฒฝ๋ง ์ด๋ฏธ์ง์ ๊ณต๊ฐ์ ์ธ ํน์ฑ์ ์ต๋ํ ๋ณด์กดํ๋ฉฐ ํ์ตํ๊ธฐ์ ์ข์ [CNN]๊ตฌ์กฐ ํฌ๊ฒ ํน์ง ์ถ์ถ ๋ถ๋ถ ๊ณผ ๋ถ๋ฅ๋ฅผ ์ํ ์ ๊ฒฝ๋ง ๋ถ๋ถ์ผ๋ก ๋๋ ์ ์์ต๋๋ค. [CNN] ํน์ง ์ถ์ถ ๋ถ๋ถ [CNN] ํฉ์ฑ๊ณฑ(Convolution) ๊ฒฉ์ ํํ๋ฅผ ๊ฐ์ง ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ํน์ ๊ฒฉ์์ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง ํํฐ๋ฅผ ํตํด ํฉ์ฑ๊ณฑ์ ์งํํด๋์๊ฐ๋๋ค. ํํฐ์ ๊ฒฉ์ ๊ฐฏ์๊ฐ ๊ณง ๊ฐ์ค์น๋ค์ด ๋ฉ๋๋ค. ex) ํํฐ (5, 5), ํํฐ ๊ฐฏ์ 3,..
[TIL] 81. Section4 Sprint2
์์ฐ์ด์ฒ๋ฆฌ(Natural Language Processing)์ ๋ํด์ ๋ฐฐ์ ๋ ์คํ๋ฆฐํธ ์ถํ์ ๋ฅ๋ฌ๋ ํํธ์ ๋ํด ๋ ๊ณต๋ถํ๊ฒ ๋๋ค๋ฉด ๊ฐ์ฅ ๊ด์ฌ ๊ฐ๋ ๋ถ์ผ์ฌ์ ๋ง์ด ๊ธฐ๋ํ๋ ์คํ๋ฆฐํธ์ด๊ธฐ๋ ํ๋ค. :) - ์์ฐ์ด ์ฒ๋ฆฌ๋ก ํ ์ ์๋ ์ผ๋ค ๋ถ๋ฅ, ๋ฒ์ญ, ์์ฝ, ์ฑ๋ด, ์ด๋ฏธ์ง ์บก์ ๋ฑ๋ฑ - ํ ์คํธ์ ๋ํ ์ ์ฒ๋ฆฌ ๊ณผ์ ๋ด์ฅ๋ฉ์๋ ์ด์ฉ, ์ ๊ท ํํ์, ๋ถ์ฉ์ด ์ฒ๋ฆฌ, ํต๊ณ์ ํธ๋ฆฌ๋ฐ, ์ด๊ฐ/ํ์ ์ด ์ถ์ถ - ํ ์คํธ์ ๋ฒกํฐํ(์ปดํจํฐ๊ฐ ์ดํดํ๊ธฐ ์ข๊ฒ) ํ์ซ ๊ธฐ๋ฐ ๋จ์ด ํํ(TF, TF-IDF) ๋ถํฌ ๊ธฐ๋ฐ ๋จ์ด ํํ(Word2Vec) (์๋ฒ ๋ฉ ๋ฐฉ๋ฒ ์ค ํ๋) - ์์ฐ์ด ๋ชจ๋ธ๋ง with ์ํ ์ ๊ฒฝ๋ง(RNN) ์ฐ์ํ ๋ฐ์ดํฐ(sequential data), ๋ณ๋ ฌํ ๋ถ๊ฐ/๊ธฐ์ธ๊ธฐ ์์ค(์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ ) LSTM, GRU ๋ฑ์ฅ, A..
[TIL] 80. Transformer
Transformer ๊ธฐ๊ณ ๋ฒ์ญ์ ์ํ ์๋ก์ด ๋ชจ๋ธ Attention ๋ฉ์ปค๋์ฆ์ ๊ทน๋ํํ ๋ชจ๋ธ ๊ตฌ์กฐ์ ๋จ์ด๊ฐ ์์ฐจ์ ์ผ๋ก ๋ค์ด์ค๋ RNN ๋ชจ๋ธ์ ๋จ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฑ์ฅํ ๋ชจ๋ธ ๋ชจ๋ ํ ํฐ(๋จ์ด)๋ฅผ ๋์์ ์ ๋ ฅ๋ฐ์ ๋ณ๋ ฌ ์ฒ๋ฆฌํ๊ธฐ๋๋ฌธ์ GPU ์ฐ์ฐ์ ์ต์ ํ(์๊ฐ์ด ๋น ๋ฆ) 2017๋ ๊ตฌ๊ธ์ด ๋ฐํํ "Attention is all you need"์์ ๋ฑ์ฅํ ๋ชจ๋ธ ๊ธฐ์กด์ seq2seq์ ๊ตฌ์กฐ์ธ ์ธ์ฝ๋-๋์ฝ๋ ๊ตฌ์กฐ๋ฅผ ๋ฐ๋ฅด๋ฉด์ RNN์ ์ฌ์ฉํ์ง ์๊ณ Attention๋ง์ผ๋ก ๊ตฌํํ ๋ชจ๋ธ Positional Encoding(์์น ์ธ์ฝ๋ฉ) RNN๊ณผ ๋ค๋ฅด๊ฒ ์์ฐจ์ ์ผ๋ก ํ ํฐ์ ์ ๋ ฅ๋ฐ์ง ์๊ธฐ ๋๋ฌธ์, ํ ํฐ์ ์์น ์ ๋ณด์ ๋ํ ๋ฒกํฐ๋ฅผ ๋ฐ๋ก ์ ๊ณตํด์ฃผ๋ ๋จ๊ณ์ ๋๋ค. Self-Attention(์ ํ-์ดํ ์ ) - ์ธ์ฝ๋์ ์์น The..
[TIL] 79. ์ธ์ฝ๋-๋์ฝ๋, Attention
์ธ์ฝ๋-๋์ฝ๋ RNN์ ๋ค๋์ผ(many to one) ๊ตฌ์กฐ๋ ์ฃผ๋ก ๋ถ๋ฅ ๋ฌธ์ ์ ์ฌ์ฉ๋ฉ๋๋ค.(๋ฌธ์ฅ์ด ๋ค์ด์ค๋ฉด ๊ธ์ ์ธ์ง ๋ถ์ ์ธ ํ๋จํ๋ ๊ฐ์ฑ๋ถ์ ๋ฑ) ๋ค๋๋ค(many to many) ๊ตฌ์กฐ๋ ์ฃผ๋ก ๊ฐ์ฒด๋ช ์ธ์, ํ์ฌ ํ๊น ๊ณผ ๊ฐ์ ๋ฌธ์ ๋ฅผ ํ๊ฒ๋ฉ๋๋ค. ์ธ์ฝ๋-๋์ฝ๋์ ๊ตฌ์กฐ๋ ํ๋์ RNN์ ์ธ์ฝ๋, ๋ ๋ค๋ฅธ ํ๋์ RNN์ ๋์ฝ๋๋ก ๋๋ ๊ตฌ์กฐ ๋๊ฐ์ RNN์ ์ฐ๊ฒฐํด์ ์ฌ์ฉํฉ๋๋ค. ์ธ์ฝ๋-๋์ฝ๋ ๊ตฌ์กฐ๋ ์ฃผ๋ก ์ ๋ ต ๋ฌธ์ฅ๊ณผ ์ถ๋ ฅ ๋ฌธ์ฅ์ ๊ธธ์ด๊ฐ ๋ค๋ฅผ ๋ ์ฌ์ฉํฉ๋๋ค. ๋ํ์ ์ผ๋ก ๋ฒ์ญ๊ธฐ, ํ ์คํธ ์์ฝ ๋ฑ์ด ์์ต๋๋ค. seq2seq(Sequence to Sequence) ์ ๋ ฅ๋ ์ํ์ค๋ก๋ถํฐ ๋ค๋ฅธ ๋๋ฉ์ธ์ ์ํ์ค๋ฅผ ์ถ๋ ฅํ๋ ๋ชจ๋ธ ์ฑ๋ด, ๊ธฐ๊ณ ๋ฒ์ญ ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ํ์ฉ๋๊ณ ์์ต๋๋ค. ์ ๋ ฅ ์ํ์ค๋ฅผ ์ง๋ฌธ, ์ถ๋ ฅ ์ํ์ค๋ฅผ ๋๋ต ..