๐ฟ Data
[TIL] 83. Image Segmentation, Object Detection/Recognition
ํค์๋ Segmentation(Semantic / Instance) Transpose Convolution Object Detection/Recognition Image Segmentation ํ๋์ ์ด๋ฏธ์ง์์ ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ์ง ๋ฌผ์ฒด๋ฅผ ๋จ์๋ก ๊ตฌ๋ถํด๋ด๋ Task ์ด๋ฏธ์ง ๋ถ๋ฅ : ์ด๋ฏธ์ง ์์ฒด๋ฅผ ํ๋์ label๋ก ์์ธก(๋๋ฌด ์ฌ์ง์ ๋๋ฌด๋ก ์์ธก) ์ด๋ฏธ์ง ๋ถํ : ์ด๋ฏธ์ง ๋ด์ ์ฌ๋ฌ ์ฌ๋ฌผ๋ค์ ์๋ฏธ์๋ ๋จ์๋ก ๊ตฌ๋ถ -> ํฝ์ ๋จ์๋ก label ์์ธก [Segmentation] Semantic VS (semantic) Instance Semantic : ์์์์ ๊ฐ์ด ์๋ฏธ์๋ ๋จ์๋ก ๋ฌผ์ฒด๋ฅผ ๊ตฌ๋ถ ex) ์ฌ๋ -> ์ฌ๋, ๊ฐ์์ง -> ๊ฐ์์ง Semantic Instance : ๊ฐ ๊ฐ์ฒด ๋ณ๋ก ๊ตฌ๋ถ ex) ์ฌ๋1, ์ฌ๋2..
[๋ฅ๋ฌ๋, CV] FCN, ๊ฐ์ฒด ํ์ง/์ธ์
Semantic Segmentation(์๋ฏธ๋ก ์ ๋ถํ ) ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๊ฐ์ฒด์ ์๊ด์์ด ๊ฐ์ ์๋ฏธ๋ฅผ ๊ฐ๋ ๋จ์๋ก ๋ถํ ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. U-net ์ด๋ฏธ์ง ๋ถํ ์ ์ํ ๋ํ์ ์ธ ๋ชจ๋ธ ์ค ํ๋๋ก End-to-End ๋ฐฉ์์ FCN ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋๋ค. ํฌ๊ฒ Downsampling๊ณผ Upsampling ๋ถ๋ถ์ผ๋ก ๋๋์ด์ง๋๋ค. Downsampling์ Convolution ๋ฐ Pooling ๊ณผ์ ์ ํตํด ์ด๋ฏธ์ง์ ํน์ง์ ์ถ์ถํฉ๋๋ค. Upsampling์ ๊ฒฝ์ฐ Convolution ๋ฐ Transpose Convolution ๊ณผ์ ์ ํตํด ์๋ณธ๊ณผ ๋น์ทํ ํฌ๊ธฐ๋ก ๋ณต์ํฉ๋๋ค. ๋ํ, Downsampling ๊ฐ level์์์ output์ธ feature map์ ์ ๋นํ ํฌ๊ธฐ๋ก ๋ง๋ค์ด ๊ฐ์ level์์์ Upsampling in..
[TIL] 82. ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(CNN) ๋ฐ ์ ์ด ํ์ต(Transfer Learning)
ํค์๋ CNN(Convolutional Neural Network) padding, stride, filter Pooling Transfer Learning Image Data Augmentation CNN(Convolutional Neural Network ; ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง) ์ปดํจํฐ ๋น์ ์์ ์์ฃผ ์ฌ์ฉ๋๋ ์ ๊ฒฝ๋ง ์ด๋ฏธ์ง์ ๊ณต๊ฐ์ ์ธ ํน์ฑ์ ์ต๋ํ ๋ณด์กดํ๋ฉฐ ํ์ตํ๊ธฐ์ ์ข์ [CNN]๊ตฌ์กฐ ํฌ๊ฒ ํน์ง ์ถ์ถ ๋ถ๋ถ ๊ณผ ๋ถ๋ฅ๋ฅผ ์ํ ์ ๊ฒฝ๋ง ๋ถ๋ถ์ผ๋ก ๋๋ ์ ์์ต๋๋ค. [CNN] ํน์ง ์ถ์ถ ๋ถ๋ถ [CNN] ํฉ์ฑ๊ณฑ(Convolution) ๊ฒฉ์ ํํ๋ฅผ ๊ฐ์ง ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ํน์ ๊ฒฉ์์ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง ํํฐ๋ฅผ ํตํด ํฉ์ฑ๊ณฑ์ ์งํํด๋์๊ฐ๋๋ค. ํํฐ์ ๊ฒฉ์ ๊ฐฏ์๊ฐ ๊ณง ๊ฐ์ค์น๋ค์ด ๋ฉ๋๋ค. ex) ํํฐ (5, 5), ํํฐ ๊ฐฏ์ 3,..
[๋ฅ๋ฌ๋, CV] CNN ๊ธฐ๋ณธ, ์ ์ด ํ์ต ๊ฐ๋
ํฉ์ฑ๊ณฑ ์ธต(Convolution layer) ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง์ ํน์ง์ ์ถ์ถํ๋ ์ธต ์ค ํ๋์ ๋๋ค. ์ผ์ ๊ฒฉ์ ํํ๋ฅผ ๊ฐ์ง ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ๋ณด๋ค ์๊ฑฐ๋ ๊ฐ์ ๊ฒฉ์์ ํํฐ๋ก ์ ํด์ง stride(ํํฐ๊ฐ ์์ง์ด๋ ๊ฐ๊ฒฉ)์ ๋ฐ๋ผ ํฉ์ฑ๊ณฑ์ ์งํํฉ๋๋ค. ํฉ์ฑ๊ณฑ์ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ (0, 0)๋ถํฐ (-1, -1)๊น์ง ํํฐ์ ๊ฒฉ์์ ํด๋นํ๋ ๊ฐ๊ณผ ๊ณฑํ์ฌ ๋ชจ๋ ๋ํ๋ ๊ณผ์ ์ ๋๋ค. ํจ๋ฉ(Padding) ํฉ์ฑ๊ณฑ ๊ณผ์ ์์ output์ shape์ input๊ณผ ๋ง์ถ๊ธฐ ์ํด ์ฌ์ฉํฉ๋๋ค. ๋ํ, ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ ๊ฐ ๊ฒฉ์๊ฐ์ ๊ฐ๋ฅํ ๊ท ํ์๊ฒ ์ฌ์ฉํ๊ธฐ ์ํด ํด์ฃผ๋ ์์ ์ ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์ด๋ฏธ์ง ๊ฒฉ์์ ํ ๋๋ฆฌ์ 0 ๊ฐ์ผ๋ก ๋๋ฌ์ฃผ๋ ์์ ์ ํ๊ฒ ๋ฉ๋๋ค. ์คํธ๋ผ์ด๋(Stride) ํฉ์ฑ๊ณฑ ๊ณผ์ ์์ ํํฐ๊ฐ slideํ ๋ ์์ง์ด๋ ๊ฐ๊ฒฉ๊ฐ์ ๋๋ค. ..
[๋ฅ๋ฌ๋, NLP] ๋ค์ํ ํ ์คํธ ์ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ
1. ํ ์คํธ ์ ์ฒ๋ฆฌ 1-1. ๋จ์ ํ ํฐํ exam = ["I want to be a superman. Sometimes, I imagine that i have a super power and fly to the sky without anything. Someone says 'it's not possible', but i trust myself.", "I feel better than anytime."] import spacy from spacy.tokenizer import Tokenizer nlp = spacy.load("en_core_web_sm") tok = Tokenizer(nlp.vocab) exam_token = [] for doc in tok.pipe(exam): do..