์์ค ํจ์๋
์์ค ํจ์ = ๋น์ฉ ํจ์(cost function ; cost)
- ์ ๋ ฅ๊ฐ(x)๋ฅผ F(w)๋ผ๋ ๋ชจ๋ธ์ ํต๊ณผ์์ผฐ์ ๋ ๋์ค๋ ๊ฐ์ ์ถ๋ ฅ๊ฐ(y_pred; ์์ธก๊ฐ)์ ๋๋ค.
- ๋ชจ๋ธ์ ์ต์ข ๋ชฉ์ ์ ์ค์ ๊ฐ(y_true; ์ฐธ๊ฐ, ๊ด์ธก๊ฐ)์ ์ต๋ํ ๊ฐ๊น์ด ์์ธก๊ฐ์ ์ป๋ ๊ฒ์ ๋๋ค.
- ์ด ๋, ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ์
์ฐจ์ด
๋ฅผ ํ์ธํ๋ ํจ์๊ฐ์์คํจ์
์ ๋๋ค. - ๋ค์ ๋งํด, ์ฐ๋ฆฌ๊ฐ ์ค๊ณํ ๋ชจ๋ธ์ด ์ ๋ ฅ๊ฐ์ ํ ๋๋ก ์ผ๋ง๋ ์ ๋ง์ถ์๋์ง๋ฅผ ๋ํ๋ด๋ ์งํ๋ผ๊ณ ํ ์ ์์ต๋๋ค.
- ์ด๋์๋ ์ด๋๋ง๋ค ๋ค๋ฅธ ๊ท์น์ด ์ ์ฉ๋๋ฏ, ์ฐ๋ฆฌ๊ฐ ์ค๊ณํ ๋ชจ๋ธ(์ ํํ๋ ์ฐ๋ฆฌ๊ฐ ํ๊ณ ์ ํ๋ ๋ฌธ์ ์ ์ข ๋ฅ)์ ๋ฐ๋ผ ๋ค์ํ ์์คํจ์๋ฅผ ์ฌ์ฉํฉ๋๋ค.
์์ค ํจ์์ ์ข ๋ฅ
์ฐ๋ฆฌ๊ฐ ๋ค๋ฃจ๊ฒ ๋ ๋ฌธ์ ๋ ํฌ๊ฒ 3๊ฐ์ง๋ก ๋๋ ์ ์์ต๋๋ค. 1) ํ๊ท, 2) ์ด์ง ๋ถ๋ฅ, 3) ๋ค์ค ๋ถ๋ฅ ๊ฐ ๋ํ์ ์ธ ๋ฌธ์ ์ข
๋ฅ์
๋๋ค.
๋ํ, ๋ฌธ์ ์ ์ข
๋ฅ์ ๋ฐ๋ผ ์ฐ๋ฆฌ๋ ์ ์ ํ ์์ค ํจ์๋ฅผ ์ ํํด์ผํฉ๋๋ค.
1. ํ๊ท
ํ๊ท๋ ์ฐ๋ฆฌ๊ฐ ์ฐ์์ ์ธ ๊ฐ์ ์์ธกํ๊ณ ์ ํ๋ ๊ฒฝ์ฐ์ ๋๋ค. ex) ๋ถ๋์ฐ ๊ฐ๊ฒฉ์ด ์ผ๋ง์ผ์ง ์์ธก, ์ ์์์ ํค/๋ชธ๋ฌด๊ฒ ์์ธก ๋ฑ
- MSE(Mean Squared Error; ํ๊ท ์ ๊ณฑ ์ค์ฐจ)
- ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ ์์ค ํจ์ ์ค ํ๋๋ก ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ ์ฌ์ด์ ์ฐจ์ด๋ฅผ ์ ๊ณฑํ์ฌ ํ๊ท ์ ๋ธ ๊ฐ์ ๋๋ค.
- ์ฐจ์ด๊ฐ ์ปค์ง์๋ก ์ ๊ณฑ ์ฐ์ฐ์ ์ํด ๊ทธ ๊ฐ์ด ๋ ๋๋ ทํด์ง๊ฒ ๋ฉ๋๋ค.(๋ค๋ฅธ ์๊ฐ์์ ๋ณด๋ฉด ์ด์์น ๋ํ ๋ ์ปค์ง๊ธฐ ๋๋ฌธ์ ๋จ์ ์ด ๋๊ธฐ๋ ํฉ๋๋ค.)
- MAE(ํ๊ท ์ ๋ ์ค์ฐจ)์ ๋ค๋ฅด๊ฒ ์ต์ ๊ฐ์ ๊ฐ๊น์์ง์๋ก ๊ทธ ๋ณํ๋์ด ๋ฌ๋ผ์ง๊ธฐ ๋๋ฌธ์, ์ต์ ๊ฐ์ ์๋ ดํ๊ธฐ ๋ ์ฉ์ดํฉ๋๋ค.
(์ผ์ชฝ : MAE, ์ค๋ฅธ์ชฝ : MSE)
- RMSE(Root Mean Squared Error; ํ๊ท ์ ๊ณฑ๊ทผ ์ค์ฐจ)
- MSE์ ์ ๊ณฑ๊ทผ์ ์ทจํ ์งํ๋ก ์ ๋ฐ์ ์ธ ์ฅ๋จ์ ์ MSE์ ์ ์ฌํฉ๋๋ค.
- MSE์์ ์ ๊ณฑ์ ํ์ฌ ๋ฐ์ํ๋ ๋ฐ์ดํฐ์ ์๊ณก์ ๋ณด์ํ ์ ์์ต๋๋ค.
- ๋ํ, ์ ๊ณฑ ํ ์ ๊ณฑ๊ทผ์ ์ทจํด์ค์ผ๋ก์จ ์ค๋ฅ๊ฐ์ ๋จ์๊ฐ ์ค์ ๊ฐ์ ๋จ์์ ๊ฐ์์ง๊ธฐ ๋๋ฌธ์ ์ง๊ด์ ์ผ๋ก ์ค๋ฅ๋ฅผ ํด์ํ ์ ์์ต๋๋ค.
2. ์ด์ง ๋ถ๋ฅ
์ด์ง ๋ถ๋ฅ๋ ๋ง๊ทธ๋๋ก ์ฐ๋ฆฌ๊ฐ ์์ธกํ๋ ค๋ ๊ฒฐ๊ณผ๊ฐ '๋ชจ ์๋๋ฉด ๋' ์ฆ, 0๊ณผ 1์ ๋๊ฐ์ง๋ก ๊ตฌ๋ถ๋ ๋์ ๋ฌธ์ ์ ํ์
๋๋ค.
ex) ๋น๊ฐ ์ฌ๊น/์์ฌ๊น, ๋ถ๋์ฐ ๊ฐ๊ฒฉ์ด ์์นํ ๊น/ํ๋ฝํ ๊น ๋ฑ
Cross Entropy์ ๊ฐ๋จํ ๊ฐ๋
์ค์ ๋ถํฌ q(์ค์ ๊ฐ)์ ๋ํด์ ์์ง ๋ชปํ๋ ์ํ์์, ์ฐ๋ฆฌ๊ฐ ๋ง๋ ๋ชจ๋ธ์ ํตํด ์ป์ ๋ถํฌ p(์์ธก๊ฐ)์ผ๋ก ์ด๋ฃจ์ด์ง ๊ฐ๋
์
๋๋ค.
์์ ์์ค ํจ์๋ค์ฒ๋ผ Entropy ๋ํ ๊ฐ์ด ๋ฎ์์ผ ์์ธก๊ฐ์ด ์ค์ ๊ฐ์ ๊ฐ๊น๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
- Binary Cross Entropy(BCE)
๋ณต์กํด๋ณด์ผ ์ ์์ง๋ง ์ต๋ํ ๊ฐ๋จํ๊ฒ ์ค๋ช ํด๋ณด๊ฒ ์ต๋๋ค. (y๋ ์ค์ ๊ฐ, y^์ ์์ธก๊ฐ)- y=1์ธ ๊ฒฝ์ฐ(์ค์ ๊ฐ์ด 1), BCE = -log(y^)์ด๋ฏ๋ก, -log ๊ทธ๋ํ๋ฅผ ์๊ฐํด๋ณด์๋ฉด 0๊ณผ 1 ์ฌ์ด์์ y^์ด ์ฆ๊ฐํ ์๋ก BCE์ 0๊ณผ ๊ฐ๊น์์ง๋๋ค.(์ฆ, ์ค์ ๊ฐ์ด 1์ผ ๋, y^์ ๊ฐ์ด ์ปค์ง๋ฉด ์์คํจ์๋ 0์ ์๋ ด-> ์์คํจ์๊ฐ ์์์ผ ์์ธก์ ์ํ๋ค๋ ์๋ฏธ)
- y=0์ธ ๊ฒฝ์ฐ(์ค์ ๊ฐ์ด 0), BCE = -log(1-y^)์ด๋ฏ๋ก, ์์ ๋ฐ๋๋ก y^์ด ์ฆ๊ฐํ ์๋ก(1์ ๊ฐ๊น์์ง์๋ก) 1-y^์ ์์์ง๊ฒ ๋๊ณ BCE๊ฐ์ ์ปค์ง๊ฒ ๋ฉ๋๋ค.(์ฆ, ์ค์ ๊ฐ์ด 0์ผ ๋, y^์ ๊ฐ์ด ์ปค์ง๋ฉด ์์คํจ์๋ ์ ์ ์ปค์ง-> ์์คํจ์๊ฐ ์ปค์ง๋ ๊ฒ์ด๋ฏ๋ก ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ์ด ๋ค๋ฅด๋ค๋ ์๋ฏธ)
์์ ๊ฐ์ ๊ณผ์ ์ผ๋ก BCE ํจ์๋ฅผ ํตํด, ์์ธก๊ฐ์ด ์ค์ ๊ฐ์ ์ ๋ง์ถ์๋์ง ์ ์ ์์ต๋๋ค.
3. ๋ค์ค ๋ถ๋ฅ
- Categorical Cross Entropy(CCE)
- BCE๋ ์ด์ง ๋ถ๋ฅ(0๊ณผ 1) ์ด๋ผ๋ฉด CCE๋ ์ธ๊ฐ์ง ์ด์์ ๋ถ๋ฅ ๋ฌธ์ ์ ์ ์ฉ๋๋ ์์คํจ์์ ๋๋ค.
- ํ๊ฒ๊ฐ์ด one-hot ํํ๋ก ์ ๊ณต๋ ๋ ์ฌ์ฉ๋ฉ๋๋ค.
- ์ฌ๊ธฐ์ ๊ตณ์ด one-hot์ผ๋ก ์ ๊ณต๋๋ค๋ ๋๋๋ณด๋จ, ์์ ์ด์ง๋ถ๋ฅ ๋ 0๊ณผ 1 ๋ก ์ฃผ์ด์ก์ ๋ ํจ์๊ฐ 2๊ฐ๋ก ์ ์ฉ๋๋ ๊ฒ์ฒ๋ผ, ๋ง์ฐฌ๊ฐ์ง๋ก BCE์ ์ฐ์ฅ์ ์์ ๋ถ๋ฅ ํด๋์ค๋ง ๋์๊ธฐ ๋๋ฌธ์ ํด๋์ค๊ฐ 0๊ณผ 1๋ก ์ฃผ์ด์ก์ ๋ ์ฌ์ฉํ๋ค๊ณ ์ดํดํ์๋ฉด ์ข๋ ํธํ ๊ฒ ๊ฐ์ต๋๋ค.
- ํ๊ฒ๊ฐ์ด one-hot ๋ฐฉ์์ด๋ฏ๋ก ์ํ์ด ๋์์ ์ฌ๋ฌ๊ฐ์ class์ ์ํ ๋๋ ์ฌ์ฉํ ์ ์์ต๋๋ค.
- Sparse Categorical Cross Entropy(SCCE)
- CCE์ ๊ฐ๋ ์ ๋์ผํฉ๋๋ค.
- ๋ค๋ง, ํ๊ฒ๊ฐ์ด 0๊ณผ 1๋ก ์ด๋ฃจ์ด์ง ๊ฒ ์๋, ์ ์๋ก ์ฃผ์ด์ก์ ๋ ์ฌ์ฉํ๊ฒ ๋ฉ๋๋ค.
- 3๊ฐ์ง์ ํด๋์ค๊ฐ ์์ ๋, CCE๋ (1, 0, 0)/(0, 1, 0)/(0, 0, 1)๋ก ํํ๋๋ ๋ฐ๋ฉด SCCE๋ 0/1/2๋ก ํํ๋ฉ๋๋ค.
- SCCE๋ ๋ฑ ์ ํํ ์ ์๋ก ํํ๋๋ฏ๋ก ์ํ์ด ๋ช ํํ ํ๋์ class์ ์ํ ๋ ์ฌ์ฉํฉ๋๋ค.
์ถ๊ฐ) SVM loss๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋ Hinge loss์ ๋ํด ๊ฐ๋จํ๊ฒ ์ฝ์ด๋ณด์๋ฉด ์ข์ ๊ฒ ๊ฐ์ ๋งํฌ ์ฒจ๋ถํ๊ฒ ์ต๋๋ค. :)
SVM Loss(Hinge Loss)
์ด์์ ๋๋ค. ์ฝ์ด์ฃผ์ ์ ๊ฐ์ฌํฉ๋๋ค!
์ฐธ๊ณ 1 : Loss function
์ฐธ๊ณ 2 : Binary Cross Entropy
์ฐธ๊ณ 3 : CCE, SCCE, Multi-hot SCCE
์ฐธ๊ณ 4 : CCE vs SCCE
์ฐธ๊ณ 5 : ๊ณต์๋ฌธ์ ๊ฐ
'๐ฟ Data > ์ด๋ชจ์ ๋ชจ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฅ๋ฌ๋]๊ฐ๋จ ์ ๊ฒฝ๋ง ๋ฐ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ง, ์ฑ๋ฅ ๋น๊ต (0) | 2022.02.26 |
---|---|
[๋ฅ๋ฌ๋]์ตํฐ๋ง์ด์ (Optimizer) (0) | 2022.02.24 |
[๋ฅ๋ฌ๋]์ญ์ ํ ์๊ณ ๋ฆฌ์ฆ (0) | 2022.02.23 |
[๋ฅ๋ฌ๋]ํผ์ ํธ๋ก , ์ ๋ ฅ์ธต/์๋์ธต/์ถ๋ ฅ์ธต, ํ์ฑํ ํจ์ ๊ฐ๋ ์ ๋ฆฌ (0) | 2022.02.22 |
MySQL_WITH RECURSIVE(์ฌ๊ท ์ฟผ๋ฆฌ) (0) | 2022.02.01 |