์ค์ค๋ก ์ฉ์ด ์ ๋ฆฌํด๋ณด๊ธฐ
Neuron: ์ ๊ฒฝ๊ณ๋ฅผ ์ด๋ฃจ๋ ๊ธฐ๋ณธ ๋จ์. ์ ๊ฒฝ ์ธํฌ์ ์ ๊ฒฝ ์กฐ์ง์ ์ด๋ฃจ๊ณ ์์ผ๋ฉฐ ์ธ๊ณต ์ ๊ฒฝ๋ง(Neural Network) ๋์ ์๋ฆฌ์ ๊ธฐ์ด๊ฐ ๋ฉ๋๋ค.
Input Layer: ์ธ๊ณต ์ ๊ฒฝ๋ง์์ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ๋ฐ๋ ์ธต. ๋ฐ์ดํฐ์ ํน์ฑ ๊ฐฏ์๊ฐ ๊ณง ์ ๋ ฅ์ธต์ ๋ ธ๋ ์๊ฐ ๋ฉ๋๋ค. ๋ํ, ๋ค๋ฅธ ์ธต๊ณผ ๋ฌ๋ฆฌ ์ ๋ ฅ์ธต์ ๋ง๊ทธ๋๋ก '๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ๋ฐ๋ ์ญํ '๋ก๋ง ์์ฉํฉ๋๋ค.
Hidden Layer: ์๋์ธต. ์ ๋ ฅ์ธต๊ณผ ์ถ๋ ฅ์ธต ์ฌ์ด์ ์๋ ๋ชจ๋ ์ธต์ ์๋์ธต์ด๋ผ ๋ถ๋ฆ ๋๋ค. ํผ์ ํธ๋ก ์ ๊ธฐ๋ณธ ๊ตฌ์กฐ์ธ '๊ฐ์คํฉ ์ฐ์ฐ' ๋ฐ 'ํ์ฑํ ํจ์'๋ก ๊ตฌ์ฑ๋์ด์์ต๋๋ค. ๋ ธ๋ ์๋ ์ฐ๋ฆฌ๊ฐ ์์๋ก ์ค์ ๊ฐ๋ฅํ๋ฉฐ ์ฃผ๋ก 'relu'๊ฐ ํ์ฑํ ํจ์๋ก ์ฌ์ฉ๋ฉ๋๋ค. ๋ ธ๋์์ ์ผ์ด๋๋ ๋ณต์กํ ๊ณ์ฐ ๊ณผ์ ์ ์๊ธฐ ์ด๋ ต๊ธฐ ๋๋ฌธ์ ์๋์ธต์ด๋ผ ๋ถ๋ฆ ๋๋ค. ์๋์ธต์ด 2๊ฐ ์ด์์ธ ๊ฒฝ์ฐ๋ฅผ '๋ฅ๋ฌ๋'์ด๋ผ ํํํฉ๋๋ค.
Output Layer: ์ถ๋ ฅ์ธต. ์ ๋ ฅ์ธต๊ณผ ์๋์ธต์ ํตํด ์ด๋ ํ ๊ณ์ฐ์ ๋ง์น๊ณ ์ต์ข ์ ์ผ๋ก ๊ณ์ฐ๋๋ ์์ธก๊ฐ์ด ๋์ค๋ ์ธต. ์ด์ง ๋ถ๋ฅ์ ๊ฒฝ์ฐ, ๋ ธ๋ ์๋ 1๊ฐ/ํ์ฑํ ํจ์๋ ์ฃผ๋ก 'sigmoid' ์ฌ์ฉ. ๋ค์ค ๋ถ๋ฅ์ ๊ฒฝ์ฐ, ๋ ธ๋ ์๋ ํ๊ฒ์ ํด๋์ ๊ฐฏ์/ํ์ฑํ ํจ์๋ ์ฃผ๋ก 'softmax' ์ฌ์ฉ. ํ๊ท์ ๊ฒฝ์ฐ, ๋ ธ๋ ์๋ ์ถ๋ ฅ๊ฐ์ ํน์ฑ ์(๊ตฌํ๊ณ ์ ํ๋ ํ๊ฒ์ ๊ฐฏ์)/ํ์ฑํ ํจ์๋ ๋ฐ๋ก ์ง์ ํ์ง ์์ต๋๋ค.
Activation Function: ํ์ฑํ ํจ์. ๊ฐ๊ฐ์ ๊ณ์ฐ๋ ๊ฐ์คํฉ์ ์ด๋ ์ ๋์ ์ ํธ๋ก ์ถ๋ ฅํ ์ง ๊ฒฐ์ ํ๋ ํจ์.
Back Propagation: ์ญ์ ํ. ์ธ๊ณต ์ ๊ฒฝ๋ง์ ํ์ต๊ณผ์ (์์ ํ, ์์ค ๊ณ์ฐ, ์ญ์ ํ) ์ค ํ๋๋ก ์์ค ๊ณ์ฐ(์์ธก๊ฐ๊ณผ ํ๊ฒ๊ฐ ์ฌ์ด์ ๋น๊ต)์ ํตํด ๊ฐ์ค์น๋ฅผ ์ ๋นํ ๊ฐ์ผ๋ก ์์ ํ๋ ๊ณผ์
ํผ์ผํธ๋ก ๊ตฌ์กฐ: ์ ๋ ฅ์ธต์ ํตํด ๋ฐ์ดํฐ๊ฐ ๋ค์ด์ค๊ฒ ๋๊ณ ๊ฐ๊ฐ์ ์๋์ธต์ผ๋ก ์ ๋ฌ๋ ๋ ๋ฐ์์จ ๋ฐ์ดํฐ์ ์์์ ๊ฐ์ค์น ๋ฐ ํธํฅ ๊ณ์ฐ์ด ์ ์ฉ๋ฉ๋๋ค.(๊ฐ์คํฉ ๋จ๊ณ) ์ดํ ๊ฐ ์๋์ธต์ ๋ ธ๋์์ ํ์ฑํ ํจ์๋ฅผ ํตํด ๊ฒฐ์ ๋ ๊ฐ์ด ์ถ๋ ฅ์ธต์ผ๋ก ์ ๋ฌ๋๊ณ ์ถ๋ ฅ์ธต์์ ์ต์ข ์ ์ผ๋ก ์์ธก๋ ๊ฐ๊ณผ ์ค์ ํ๊ฒ๊ฐ(ํ๋ จ ๋ฐ์ดํฐ ์ ์์์)๊ณผ ๋น๊ต ํ(์์ค ๊ณ์ฐ) ๋ค์ ์ด ์์ค ๊ณ์ฐ์ ๋ํ ๊ฐ์ค์น ๋ฏธ๋ถ(๊ธฐ์ธ๊ธฐ)๊ฐ์ ์ด์ฉํด ์ด์ ๊ณผ์ ๋ค์์ ์ ์ฉ๋์๋ ๊ฐ์ค์น๋ค์ ์ ๋นํ ๊ฐ์ผ๋ก(์์ค์ ์ค์ด๊ธฐ ์ํ ; ์์ธก๊ฐ์ ํ๊ฒ๊ฐ๊ณผ ๊ฐ๊น๊ฒ ํ๊ธฐ ์ํ) ์์ ํฉ๋๋ค.
ํน์ฑ ์ถ์ถ์ ๊ด๋ จํด์ ๋ค์ธต ํผ์ ํธ๋ก ๊ตฌ์กฐ์ ํน์ง
๊ธฐ์กด ๋จธ์ ๋ฌ๋์ ๊ด์ ์์ , ์ฐ๋ฆฌ๊ฐ ์ค์ค๋ก ํน์ง(ํน์ฑ; feature)๊ณผ ํ๊ฒ์ ๊ด๊ณ๋ฅผ ์ถ์ธกํ๊ณ ์์ธก ํน์ ์ด๋ค engineering์ ํตํด ์ ๋ณํ์์ต๋๋ค. ํ๋ ๋ฅ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๊ฒฝ์ฐ, ๋ค์ธต ํผ์ ํธ๋ก ์ ๊ตฌ์กฐ๋ก '์ญ์ ํ' ๊ฐ๋ ์ ํตํด ๋ชจ๋ธ ์์ฒด๊ฐ ๊ฐ์ค์น๋ฅผ ์กฐ์ ํ๊ฒ ๋๊ณ ์ด๋ ๊ณณ ์ ๋ ฅ๊ฐ๋ค์ ๋ํ ์ค์๋๋ฅผ ์ผ๋ง๋ ์ค์ง๋ฅผ ๊ฒฐ์ ํ๋ ๊ณผ์ ์ด๋ผ ๋ณผ ์ ์์ต๋๋ค. ์ฆ, ๊ฐ์ค์น๋ฅผ ์กฐ์ ํจ์ ๋ง์น ์ฐ๋ฆฌ๊ฐ ๋จธ์ ๋ฌ๋์์ ์ง์ ์งํํ๋ ๋ฐ์ดํฐ ์ถ์ถ ๊ณผ์ ์ ๋ชจ๋ธ์ด ์์์ ํ์ตํ๊ฒ ๋๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ์ด๋ฅผ ๋ค์ ํ๋ฒ ์๊ฐํด๋ณด๋ฉด, ์ผ๋ฐ์ ์ผ๋ก ๋ฅ๋ฌ๋์ด ๋จธ์ ๋ฌ๋๋ณด๋ค ์ฐ์ํ ์ ํ๋๋ฅผ ๋ํ๋์ ๋ ์ด๋ ๊ณง ์ฐ๋ฆฌ์ ํน์ฑ ์ถ์ถ์ด ๋ชจ๋ธ์ ๊ฐ์ค์น ์กฐ์ ์ ํตํ ํน์ฑ ์ถ์ถ๋ณด๋ค ๋ชปํ๋ค๋ ์๋ฏธ์ ๋๋ค. ์ฆ, ์ฐ๋ฆฌ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ถฉ๋ถํ ์ดํดํ์ง ๋ชปํ๋ ๊ฒ์ ์ค๋ช ํด์ฃผ๊ธฐ๋ ํฉ๋๋ค.
'๐ฟ Data > ๋ถํธ์บ ํ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[TIL]77. ๋จ์ด ๋ถ์ฐ ํํ(Distributed Representation) (0) | 2022.03.03 |
---|---|
[TIL]76. NLP(Natural Language Processing) (0) | 2022.03.02 |
[TIL]74. ์ ๊ฒฝ๋ง - Hyper parameter (0) | 2022.02.25 |
[TIL]73. ๋ ๋์ ์ ๊ฒฝ๋ง ํ์ต์ ์ํ ๋ฐฉ๋ฒ (0) | 2022.02.24 |
[TIL]72. ์ ๊ฒฝ๋ง ํ์ต (0) | 2022.02.23 |