Jayden`s
Hypothesis Test(๊ฐ์ค๊ฒ์ )
T-test๋ฅผ ์ฌ์ฉํ ์ ์๋ ์ํฉ์ ๋ํด ์ค๋ช ํ๊ณ , ๊ทธ ์ํฉ์์ ์ด๋ป๊ฒ ๊ฐ์ค์ ์ธ์ฐ๋์ง T-test์ ์ ์ฒด์ ์ธ ์์๋ฅผ ํ๋ ์ค๋ช ํด์ฃผ์ธ์. ์ด๋ ํ ๊ฐ์ค์ ์ธ์ ๋์ง ์ ์ด๋ฌํ ๊ฐ์ค์ ์ธ์ฐ๊ฒ ๋์๋์ง ์ T-test๋ฅผ ์ ํํ๋์ง NBA์ NBA G(๋ง์ด๋๋ฆฌ๊ทธ)์ ๋๊ตฌ์ ์๋ค์ ํค๋ฅผ ๋น๊ตํด๋ณด๊ณ ์ถ์ต๋๋ค. ๊ท๋ฌด๊ฐ์ค(H0) : NBA ๋ฉ์ด์ ๋ฆฌ๊ทธ ์ ์๋ค์ ํค์ ๋ง์ด๋ ๋ฆฌ๊ทธ ์ ์๋ค์ ํค ํ๊ท ์ ์ฐจ์ด๊ฐ ์๋ค. ๋๋ฆฝ๊ฐ์ค(H1) : NBA ๋ฉ์ด์ ๋ฆฌ๊ทธ ์ ์๋ค์ ํค์ ๋ง์ด๋ ๋ฆฌ๊ทธ ์ ์๋ค์ ํค ํ๊ท ์ ์ฐจ์ด๊ฐ ์๋ค. ์ผ๋จ ํค ์์ฒด๋ ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๊ณ , ๋๊ตฌ์ ์๋ค์ ํค์ ๋ฐ๋ฅธ ์ํฅ์ ๋น๊ตํด๋ณด๊ณ ์ถ์์ต๋๋ค. ๋ณด๊ธฐ์ ์ํฉ์ ์ฝ๊ณ , A/B Test์ ๋ํด์ ์๊ฐํด ๋ณด์ธ์. ๐ก ๋ณด๊ธฐ) ์ฌ๋ฌ๋ถ์ ๊ทธ๋ก์ค ํดํนํ์ DA๋ก ์ทจ์งํ์์ต๋๋ค. ๋ง์ฝ ..

Basic Derivative(์ถ๊ฐ)
๋จ์์ ํํ๊ท๋ฅผ ์ด์ฉํ์ฌ Binary Classification Prediction์ ํ๊ณ ์ ํ๋ค๋ฉด, ๋จ์์ ํ๋ผ์ธ์ ์ด๋ ํ ๋ณํ๋ฅผ ์ฃผ๋ฉด ๋ ๊น์? Binary classification pred๋ฅผ ํ๋ค๋ ๋ง์, ์ฆ ๊ฒฐ๊ณผ๊ฐ์ด 0๊ณผ 1๋ก ๊ตฌ๋ถ๋๋ ๊ฒ์ ๋ํ ๋ถ๋ฅ ์์ธก์ ํ๋ ๊ฒ ๊ทธ๋ฌ๋ ๋จ์์ ํํ๊ท $$y=wx+b$$ ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ์์ธก๊ฐ์ด ์ค์์ด๊ธฐ ๋๋ฌธ์ ์ข ์๋ณ์์ ๋ฒ์๊ฐ ์ค์, ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ์ข ์๋ณ์๋ binaryํ 0๊ณผ 1์ด๋ค. ์ด ๋, ์ฐ๋ฆฌ๋ ํ์ฑํ ํจ์๋ก Logistic Regression์ ์ฌ์ฉํด์ผํ๋ค. ์ด๋ ๊ฒ ๋๋ฉด $$wx+b$$์ ๋ํด์ 0๊ณผ 1 ์ฌ์ด์์ ๊ฐ์ด ๋์จ๋ค. ์ด ๋, ๊ฐ์ด 0.5๋ณด๋ค ํฌ๋ฉด 1, ์์ผ๋ฉด 0์ผ๋ก ๋ณด๋ด๋ ๊ฒ์ผ๋ก binary ๋ถ๋ฅ๊ฐ ๊ฐ๋ฅํ๋ค. sigmoid ํจ์์ Ch..
EDA(Exploratory Confirmatory Analysis; ํ์์ ์๋ฃ ๋ถ์)
๋ค์ ๋งํฌ๋ ๋ค์ํ ์๊ฐํ ๋ฐฉ๋ฒ๋ค์ด ๋์์๋ Seaborn๊ณผ Matplotlib ์ ๊ณต์๋ฌธ์์ ๋๋ค. ๋งํฌ ์์ ์๊ฐํ ๋ฐฉ๋ฒ ์ค ํ๋๋ฅผ ์ ํํ์ฌ, ๊ณ ๋ฅธ ์ด์ ์ ํด๋น ์๊ฐํ ๋ฐฉ๋ฒ์ ์ฅ์ ์ ์๊ฐํด ์ฃผ์ธ์. ์ ๋ seaborn์ violinplot์ ์ ํํ์ต๋๋ค! ๋จผ์ violinplot์ boxplot๊ณผ ๋์ผํ๊ฒ ์ผ๋ณ๋, ์ฐ์ํ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ค๋ช ํ๊ธฐ ์ํ ๊ทธ๋ํ์ ๋๋ค. ๋ด์ฉ ์์ฒด๋ boxplot๊ณผ ๊ฐ์ผ๋ ์ปค๋ ๋ฐ๋ ๊ณก์ ์ ๋ํด, ์นดํ ๊ณ ๋ฆฌ๊ฐ์ ๋ฐ๋ฅธ ๊ฐ ๋ถํฌ์ ์ค์ ๋ฐ์ดํฐ ๋๋ ์ ์ฒด ํ์์ ๋ณด์ฌ์ค๋ค๋ ์ฅ์ ์ด ์์ต๋๋ค. ํ์ฆ์ ๋ฐ์ดํฐ ๋ถ์(CDA: Confirmatory Data Analysis)๊ณผ ํ์์ ์๋ฃ ๋ถ์(EDA: Exploratory Data Analysis)์ ์ฐจ์ด์ ์ ์ค๋ช ํ๊ณ ,๊ฐ๊ฐ ์ด๋ค ๊ฒฝ์ฐ์ ..
[TIL]4.Basic Derivative
๋ชฉํ ์ต์ ์์ ๋ฏธ๋ถ์ ๊ด๊ณ ๋ฏธ๋ถ, ํธ๋ฏธ๋ถ, Chain Rule์ ์ฐจ์ด๋ฅผ ์ดํด ๋ํจ์(๋ฏธ๋ถ)์ ํ์ด์ฌ์ผ๋ก ์ง์ ๊ตฌํ ๋ฐ scipy ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉ ๋ฏธ๋ถ(Derivative) ๊ทธ๋ฆผ์ ๋ณด๋ฉด ์ฐ๋ฆฌ๊ฐ ๊ณ์ฐํ๊ณ ์ ํ๋ ๊ฒ์ Δx๊ฐ ํ์์ด 0์ ๊ฐ๊น์์ง ๋์ ๊ธฐ์ธ๊ธฐ ํน์ ํ ํ๋ผ๋ฏธํฐ ๊ฐ (input, x)์ ๋ํด์ ๋์ค๋ ๊ฒฐ๊ณผ๊ฐ(output, y)์ด ๋ณํํ๋ ์ ๋๋ฅผ (0์ ๊ฐ๊น์ด ๋ถ๋ถ์ ์ฐพ๊ธฐ ์ํด) ๊ณ์ฐํ๋ ๊ฒ. ๋ฏธ๋ถ๊ณผ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค๋ ๋ฌด์จ ์๊ด์ด ์๋? ์๋์ ๊ฐ์ ๋ฐ์ดํฐ ๋ถํฌ๊ฐ ์์ ๋, ๊ทธ ๋ถํฌ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํด์ฃผ๋ ํ๋์ ์ ์ ๊ทธ๋ฆฐ๋ค๊ณ ์๊ฐํด๋ณด์. y-hat=b+aX (a:๊ธฐ์ธ๊ธฐ, b:y์ ํธ, y-hat:์์ธก๊ฐ, x:๋ฐ์ดํฐ) cf) ๋ณดํต ์ค์ ๊ฐ์ ๊ทธ๋ฅ y๋ก ํํํ๋ค. ์ฃผ์ด์ง ๋ฐ์ดํฐ X๋ฅผ ๋ฃ์์ ๋, ๋ชจ๋ธ์ด ..
[TIL]3.Data Manipulation(๊ฐ์ธ์ ์ผ๋ก ์ ์์์ผ ๋๋ค๊ณ ๋๊ผ๋ ๋ถ๋ถ)
๋ชฉํ pandas๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ concat/mergeํ๊ธฐ tidy ๋ฐ์ดํฐ์ ๋ํ ๊ฐ๋ ์ดํด melt์ pivot/pivot_table ํจ์๋ฅผ ์ฌ์ฉํ์ฌ wide์ tidy ํํ์ ๋ฐ์ดํฐ๋ฅผ ์๋ก ๋ณํํ ์ ์๋ค. Pandas๋ก ๋ฐ์ดํฐ ํฉ์น๊ธฐ ์ฃผ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์๋ก ๋ค๋ฉด, ์ข ๋ชฉ๋ณ ๋ฐ์ดํฐ์ ์ด๋ค ๋ฐ์ดํฐ๊ฐ ์ด๋ค ์ข ๋ชฉ์ ์๋ฏธํ๋์ง ์ค๋ช ํ๋ description ๋ฐ์ดํฐ๋ก ๋๋์ด ์ง ์ ์๋ค. ํจ๊ณผ์ ์ผ๋ก ๋ฐ์ดํฐ ๋ถ์์ ํ๊ธฐ์ํด์๋ ์ฌ๋ฌ ๊ฐ์ ํ์ผ์ ํ๋๋ก ํฉ์ณ์ผํ๋ค!!! ์ฌ๋ฌ ๊ฐ์ง ๋ฐฉ๋ฒ ์ค 2๊ฐ์ง๋ฅผ ์๊ฐํด๋ณด๊ฒ ๋น Concat(concatenate) ๊ฐ๋จํ๊ฒ '๋ํ๋ค' ํน์ '๋ถ์ธ๋ค'๋ผ๋ ์๋ฏธ๋ก ์๊ฐํ๋ฉด ์ดํด๊ฐ ํธํ๋ค. ๋ฌธ์ํ ๋ถ์ด๋ ๋๋ '๋ฌธ์๋ฅผ' + '๋ถ์ฌ์' == '๋ฌธ์๋ฅผ๋ถ์ฌ์' ๋ฌ๊ธ์์ง๋ง ๋ฌธ์ํ์ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒ์ ์ฌ..