- Bayesian statistics์ Frequentist statistics์ ์ฐจ์ด์ ์ ๋ํด ์๊ฐํด๋ณด๊ณ , ๋ฐ์ดํฐ ๋ถ์ ์ ์ธ์ , ์ด๋ ๊ฒ์ ์ฌ์ฉํด์ผ ํจ์จ์ ์ธ์ง ๋ ผํด๋ณด์ธ์.
1. ๋ฒ ์ด์ฆ์ฃผ์
์กฐ๊ฑด๋ถ ํ๋ฅ ์ ์ด์ฉํ์ฌ
$$ P(A|B) = P(B|A) * P(A) / P(B) $$
์ฌ๊ธฐ์ A๋ฅผ H(๊ฐ์ค), B๋ฅผ ์๋ก์ด ๋ฐ์ดํฐ D๋ผ๊ณ ๊ฐ์
$$ P(H|D) = P(D|B) * P(H) / P(E) $$
์ ๊ฐ์ ์์ด ๋์จ๋ค.
์ฌ๊ธฐ์ $$P(H)$$ ๋ ์ฌ์ ํ๋ฅ ๋ก D๋ผ๋ ๋ฐ์ดํฐ๋ฅผ ์๊ธฐ ์ ๊ฐ์ค์ ๋ํ ํ๋ฅ ๊ฐ(ํํ ํต๋
์ ์ผ๋ก ์ ์ฉ๋๋ ๊ฐ)
$$P(D|H)$$๋ ๊ฐ๋ฅ๋(Likelihood ; ์ฐ๋)๋ก ํด์ํ์๋ฉด '์ด๋ค ๊ฐ์ค H๊ฐ ๋ง๋ค๊ณ ๊ฐ์ ํ์ ๋, ๋ฐ์ดํฐ D๊ฐ ๋์ฌ ํ๋ฅ '์
๋๋ค.
์ฆ, ์ฐ๋ฆฌ๊ฐ ์ฌ์ ํ๋ฅ ๋ฐ ๊ฐ๋ฅ๋๋ฅผ ์๋ฉด $$P(H|D)$$ ์ฌํ ํ๋ฅ ์ ๊ณ์ฐํ ์ ์์ต๋๋ค.
- ๊ฐ์ค๊ณผ ๋ฐ์ดํฐ์ ๋ํ ํ๋ฅ ์ ๋ชจ๋ ์ฌ์ฉ
- ๊ด์ฐฐ๋ ๋ฐ์ดํฐ์ ๊ฐ๋ฅ๋ ๋ฐ ์ฌ์ ํ๋ฅ ์ ์์กดํ๋ค.
- ์ฌ์ ํ๋ฅ ์ ์ผ๋ฐ์ ์ธ ํต๋ ์ด ์ ์ฉ๋ ์๋ ์์ง๋ง, ๊ทธ๋ ์ง ์์ ๊ฒฝ์ฐ ์ฃผ๊ด์ ์ผ๋ก ์ค๊ณ๋ ์ ์๋ค.
- ์ ์ฐจ ๋ฐ์ดํฐ์ ์์ด ๋์ด๋๊ณ ์ด๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ํ๋์จ์ด ๋ฐ ์ํํธ์จ์ด๊ฐ ๋ฐ๋ฌํจ์ ๋ฐ๋ผ 'ํต๋ ์ ์ผ๋ก ์ ์ฉํ๋ ์ฌ์ ํ๋ฅ ๋ถํฌ'๋ฅผ ์ถ์ถํด๋ผ ์ ์๊ฒ ๋๋ฉด์ ๋จธ์ ๋ฌ๋ ๋ฐ ๋ฅ๋ฌ๋์์ ๊ต์ฅํ ์ ์ฐ์ด๊ณ ์์ต๋๋ค.
๊ธฐ์ ์ ์ผ๋ก '์ฌ์ ๊ฐ์ค'(prior)๊ณผ '๊ฐ๋ฅ๋'(likelihood)(๋ฐ์ดํฐ๊ฐ; ๊ด์ธก๊ฐ)๋ฅผ ์ฌ์ฉํ๋ค.
2. ๋น๋์ฃผ์
๋น๋์ฃผ์๋ ์ข๋ ๊ฐ๋จํ๊ฒ ์ค๋ช
ํ์๋ฉด ์์ ๋ฒ ์ด์ฆ์ฃผ์์ ๋ค๋ฅด๊ฒ ๊ธฐ์ ์ ์ผ๋ก ๊ฐ๋ฅ๋ ๋ง์ ๋ฐ์ง๋ค.
๋จ์ํ๊ฒ ์ฐ๋ฆฌ๊ฐ ์ก๋ฉด์ฒด ์ฃผ์ฌ์๋ฅผ ๊ณ์ ๋ฐ๋ณต์ ์ผ๋ก ๋์ง๋ฉด์ ๊ฐ ์ซ์๊ฐ ๋์ฌ ํ๋ฅ ์ 1/6์ด๋ผ๊ณ ์๊ฐํ๋ ๊ฒ
๊ธฐ์ ์ ์ผ๋ก '๊ฐ๋ฅ๋'(likelihood)(๋ฐ์ดํฐ๊ฐ; ๊ด์ธก๊ฐ))์๋ง ์์กดํ๋ค.
๋ฒ ์ด์ฆ์ฃผ์๋ ๋น๋์ฃผ์๋ฅผ ๋ณด์ํ ์ ์๋ค๊ณ ์๋ ค์ ธ์๋ค. ๋ค๋ง, ์์ฆ๊ฐ์ด ๋ฐ์ดํฐ์ ํ๋ณด๊ฐ ๋น๊ต์ ์ฉ์ดํ๊ณ ๋ฐ์ดํฐ์ ๊ท๋ชจ๊ฐ ์ปค์ง ์ธ์์์ ์ฌ์ค์ ๋ฒ ์ด์ฆ์ฃผ์์ ๋น๋์ฃผ์์ ๊ฐ์ด ํฌ๊ฒ ์ฐจ์ด๋์ง ์๋๋ค.
์๋ํ๋ฉด ๋ฐ์ดํฐ์ ๊ท๋ชจ๊ฐ ์ปค์ง์๋ก ๋ฒ ์ด์ฆ์ฃผ์๊ฐ ๋ฐ์ง๋ '์ฌ์ ๊ฐ์ค'์ ์ํฅ์ด ์ ์ด์ง๊ธฐ ๋๋ฌธ์ด๋ค.
์ด ๋ง์ ๋ค์ํ๋ฉด, ๋ฐ์ดํฐ๊ฐ ์ ์ ๋๋ ๋น๋์ฃผ์ ๋ฐฉ๋ฒ์ด ์ ์ฉํ๊ธฐ ์ด๋ ค์ธ ์ ์๋ค.
์๋ฅผ ๋ค์ด, ์ฃผ์ฌ์๋ฅผ ๋จ ํ๋ฒ๋ง ๋์ง ์ ์๋ค๋ฉด ์ฐ๋ฆฌ๋ ์ ํํ ๋น๋์ฃผ์์ ์ผ๋ก ํ๋ฅ ์ด 1/6์ด๋ผ๊ณ ๋งํ ์ ์์ ๊ฒ์ด๋ค.
์ด ๋, ๋ฒ ์ด์ฆ์ฃผ์๋ ์ฌ์ ๊ฐ์ค์ ๋ํด(์ด ๋ ์ฌ์ ๊ฐ์ค์ '์ฃผ์ฌ์๋ ์ ํํ ์ก๋ฉด์ฒด๋ฅผ ๊ฐ์ง๋ค' ๋ฑ์ ํต๋ ์ด ๋ ๊ฒ) ๊ทธ๋ฌ๋ฉด ์ฐ๋ฆฌ๊ฐ ๋ง์ด ๊ตด๋ ค๋ณด์ง์์๋ '์ ํ๋ฅ ์ด 1/6์ด๊ฒ ๊ตฌ๋' ์ ์ ์๋ ๊ฒ!
์ด๋ก ์ ์ ๊ฐํด์ ๊ทน๋จ์ ์ผ๋ก ๋ ํํ์ ๋ฐ์์ ๋น๊ตํด๋ณด๋ฉด
์ฃผ์ฌ์๋ฅผ 10๋ฒ ๊ตด๋ ธ๋๋ฐ ๊ณ์ 1์ด ๋์จ ๊ฒฝ์ฐ
- ๋ฒ ์ด์ฆ์ฃผ์ : ์ด์ฐจํผ ์ฃผ์ฌ์๋ ์๋ฒฝํ ์ก๋ฉด์ฒด๋๊น ์ด์ฐจํผ ํ๋ฅ ์ 1/6์ด์ผ~ 1 ์ฐ์ 10๋ฒ ๋์๋ ๊ด์ฐฎ์~
- ๋น๋์ฃผ์ : ์ด ๋ญ์ง ์ 10๋ฒํ๋๋ฐ ๊ณ์ 1์ด ๋์ค์ง...?(๋ถ์) ๋ ํด๋ด์ผํด!!! ๊ณ์ ๊ตด๋ ค๋ณด์!!
์ด๋ฐ ๋๋์ ์ฐจ์ด๋ผ๊ณ ์ดํดํ๋ฉด ๊ทธ๋๋ง ๋์ ์ฐจ์ด์ ๋ํ ๋๋์ด ์ค๋ ๊ฑฐ ๊ฐ๋ค.
'๐ฟ Data > ์ด๋ชจ์ ๋ชจ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Linear Algebra + (Cov ;๊ณต๋ถ์ฐ, Cor ; ์๊ด๊ณ์) (0) | 2021.12.02 |
---|---|
Verctor, Matrix, DataFrame (0) | 2021.12.01 |
ANOVA ์์ (0) | 2021.11.29 |
Hypothesis Test(๊ฐ์ค ๊ฒ์ ) 2 (0) | 2021.11.29 |
Hypothesis Test(๊ฐ์ค๊ฒ์ ) (0) | 2021.11.28 |