๋จ์์ ํํ๊ท๋ฅผ ์ด์ฉํ์ฌ Binary Classification Prediction์ ํ๊ณ ์ ํ๋ค๋ฉด,
๋จ์์ ํ๋ผ์ธ์ ์ด๋ ํ ๋ณํ๋ฅผ ์ฃผ๋ฉด ๋ ๊น์?Binary classification pred๋ฅผ ํ๋ค๋ ๋ง์, ์ฆ ๊ฒฐ๊ณผ๊ฐ์ด 0๊ณผ 1๋ก ๊ตฌ๋ถ๋๋ ๊ฒ์ ๋ํ ๋ถ๋ฅ ์์ธก์ ํ๋ ๊ฒ
๊ทธ๋ฌ๋ ๋จ์์ ํํ๊ท
$$y=wx+b$$
๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ์์ธก๊ฐ์ด ์ค์์ด๊ธฐ ๋๋ฌธ์ ์ข ์๋ณ์์ ๋ฒ์๊ฐ ์ค์, ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ์ข ์๋ณ์๋ binaryํ 0๊ณผ 1์ด๋ค.
์ด ๋, ์ฐ๋ฆฌ๋ ํ์ฑํ ํจ์๋ก Logistic Regression์ ์ฌ์ฉํด์ผํ๋ค.
์ด๋ ๊ฒ ๋๋ฉด $$wx+b$$์ ๋ํด์ 0๊ณผ 1 ์ฌ์ด์์ ๊ฐ์ด ๋์จ๋ค. ์ด ๋, ๊ฐ์ด 0.5๋ณด๋ค ํฌ๋ฉด 1, ์์ผ๋ฉด 0์ผ๋ก ๋ณด๋ด๋ ๊ฒ์ผ๋ก binary ๋ถ๋ฅ๊ฐ ๊ฐ๋ฅํ๋ค.sigmoid ํจ์์ Chain rule์ ๊ด๊ณ๋ฅผ ์ค๋ช ํด์ฃผ์ธ์ !
์์ ๊ฒฐ๊ณผ์์ ์ฐ๋ฆฌ๊ฐ ๊ธฐ์กด ๋จ์์ ํํ๊ท๋ฅผ f(x)๋ผ ํ๊ณ sigmoid ํจ์๋ฅผ g(x)๋ผ ํ์ ๋
$$F(x)=g(f(x))$$ ๋ก ๊ฒฐ๊ตญ ์ฐ๋ฆฌ๊ฐ loss fuction์ ์ต์ํํ ๋, chain rule ์ ์ ์ฉํ์ฌ F(x)์ ๋ํจ์๋ฅผ ๊ตฌํด์ผํ๋ค.์ฐ๋ฆฌ๊ฐ ๊ฐ์ง๊ณ ์๋ cost funcion์ ๋ชจ์์ด convex function์ผ ๋, ์ด๋ป๊ฒ gradient descent๊ฐ ๋ฏธ๋ถ์ ํตํด ์ต์๊ฐ์ ์ฐพ์๊น์? ์ด๋ฅผ ๋ฏธ๋ถ์ ํตํด ์ป์ ๊ธฐ์ธ๊ธฐ์ ๊ด๋ จํด ์ค๋ช ํด๋ณด์ธ์.
๐ก ๋ณด๊ธฐ)
convex function์ผ ๋ ๊ธฐ์ธ๊ธฐ(๋ํจ์)๊ฐ์ด 0์ด ๋๋ ์ง์ ์์ ์ํจ์๊ฐ ์ต์๊ฐ์ ๊ฐ๊ฒ ๋๊ธฐ ๋๋ฌธ์
๋๋ค.
๋จ, ๋ณด๊ธฐ2์ ๊ฐ์ด ๊ทน์์ ์ด ์ฌ๋ฌ๊ฐ์ผ ๊ฒฝ์ฐ, ์ค์ ํ ํ๋ผ๋ฏธํฐ์ ๋ฐ๋ผ ์๋ ดํ๊ฒ ๋๋ ์ง์ ์ด ๋ฌ๋ผ์ ธ '์ง์ง' ์ต์๊ฐ์ ์ฐพ์ง ๋ชปํ ์ ์์ต๋๋ค. ์ด ๋๋, ๋ค์ํ optimizer๋ฅผ ์ด์ฉํ๊ฒ ๋ฉ๋๋ค.
'๐ฟ Data > ์ด๋ชจ์ ๋ชจ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Hypothesis Test(๊ฐ์ค ๊ฒ์ ) 2 (0) | 2021.11.29 |
---|---|
Hypothesis Test(๊ฐ์ค๊ฒ์ ) (0) | 2021.11.28 |
EDA(Exploratory Confirmatory Analysis; ํ์์ ์๋ฃ ๋ถ์) (1) | 2021.11.28 |
PCA(Principal Component Analysis) (0) | 2021.11.15 |
KNN(K-Nearest Neighbors) (0) | 2021.11.09 |