Jayden`s
Simple Linear Regression(๋จ์์ ํํ๊ท)
1. ๋จ์์ ํํ๊ท๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด ์ ์ ๋์ด์ผ ํ๋ ์กฐ๊ฑด๋ค์ ๋ํด ์ฐพ์๋ณด์๊ณ ๋ ผํด๋ณด์ธ์. ๋ ๋ณ์๊ฐ ์ ํ๊ด๊ณ์ ์์ด์ผ ํฉ๋๋ค. ํ๋ณธ ์ถ์ถ์ด ๋ฌด์์๋ก ์ด๋ค์ ธ์ผ ํฉ๋๋ค. ์ง์ ์ ๊ทธ๋ฆฌ๊ธฐ ์ํด ์ต์ 2๊ฐ ์ด์์ ๋ฐ์ดํฐ๊ฐ ์์ด์ผํฉ๋๋ค. ์ฃผ์ด์ง X๊ฐ์์ ์ค์ฐจ์ ํ๊ท ์ 0์ ๋ง์กฑํฉ๋๋ค.(Zero-conditional mean) ์ฃผ์ด์ง X๊ฐ์์ ์ค์ฐจ๋ค์ ์ ๊ท๋ถํฌ๋ฅผ ์ด๋ค์ผ ํฉ๋๋ค.(Normality ; ์ ๊ท์ฑ) ์ฃผ์ด์ง X๊ฐ์์ ์ค์ฐจ๋ค์ด ๊ฐ์ ์ ๋๋ก ํผ์ ธ ์์ด์ผ ํฉ๋๋ค.(homoscedasticity ; ๋ฑ๋ถ์ฐ์ฑ) ์ฃผ์ด์ง X๊ฐ์์ ์ค์ฐจํญ๋ค๋ผ๋ฆฌ๋ ๋ ๋ฆฝ์ด์ด์ผ ํฉ๋๋ค.(Independence ; ๋ ๋ฆฝ์ฑ) ์์ ์ ์ ๋ฅผ ์กฐ๊ธ ๋ ์์ธํ ์ดํด๋ณด์๋ฉด ์์ ๊ฐ์ ๊ทธ๋ฆผ์์ ๋ชจ๋ ์ ์ ์ง๋๋ ์ง์ ์ ๊ทธ์ ์๋ ์์ง๋ง ์ด๋ค ์ง์ ์ ๊ธฐ์ค์ผ๋ก ..
[TIL]22.Section Challenge ๋ฐ ๋ณต์ต
ํท๊ฐ๋ฆฌ๊ฑฐ๋ ์์ธํ ์๊ณ ์ถ์ ๋ด์ฉ ํค์๋ ๋ณ๋ก ์ ๋ฆฌํด์ ๋ธ๋ก๊น ํ๊ธฐ
[TIL]21.Session ๋ณต์ต
ํํํ ๋ณต์ตํ๋ค๊ณ ์๊ฐํ๋๋ฐ ์ง๊ด์ ์ผ๋ก ์ฝ๊ฒ ์ค๋ช ์ด ์๋๋ ๊ฐ๋ ๋ค์ด ์๊ทผ ์๋ค. Sprint1 ์ฒดํฌํ ๊ฒ EDA : ์์น(Statistics)์ ๊ทธ๋ฆผ(์๊ฐํ)๋ฅผ ๊ผญ ๊ฐ์ด ๋ณด๋ฉด์ ๋ฐ์ดํฐ ํ์ธํ ๊ฒ Feature engineering Data manipulation Basic Derivative(๋ฏธ๋ถ) : ๋ชจ๋ธ์ด cost function์ ์ต์๊ฐ์ ์ฐพ์ ๋ ์ฌ์ฉ(๋ํจ์=0) Sprint2 ์ฒดํฌํ ๊ฒ ๊ฐ์ค๊ฒ์ : ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด์ ๊ฒ์ ์งํ -> ๋จ, ๋ฐ์ดํฐ๋ sample์ ์ฆ, ๊ฐ์ค๊ฒ์ ์ 'sample์ด population์ ๋๋ณํ ์ ์๋๋'๋ฅผ ๋ณด๋ ๊ฒ P-value ์ ๋ขฐ๊ตฌ๊ฐ(Confident Interval) ๋ฒ ์ด์ง์ : ์ฌ์ ๊ฐ์ค์ ๋ฐ์ดํฐ(๊ด์ธก์น)๋ฅผ ํตํด ์ฌํ๊ฐ์ค๋ก ์ ๋ฐ์ดํธ Sprint3 ..
๋ฒ ์ด์ง์ ์์ ํ์ด(Bayesian Problem example)
1๋ฒ At a certain stage of a criminal investigation, the inspector in charge is 60% convinced of the guilty of a certain suspect. Suppose now that a new piece of evidence that shows that the criminal has a left-handedness is uncovered. If 20% of population possesses this characteristic, how certain of the guilt of the suspect should the inspector now be if it turns out that the suspect is among th..
ํฐ ์์ ๋ฒ์น, ์ค์ฌ๊ทนํ์ ๋ฆฌ ์ฝ๋๋ก ๊ตฌํ
1. ํฐ ์์ ๋ฒ์น df3.describe() # ๋๋ต์ ์ธ ๋ฐ์ดํฐ์ ๋ชจ์๋ฅผ ํ์ธํฉ๋๋ค. ๋๋ต 5000๊ฐ๋ง ๊ฐ๋ ๊ฐ์ด ๋น์ทํด์ง๋ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. dat = [] np.random.seed(42) for i in np.arange(start = 0, stop = 18000, step = 100) : s = np.random.choice(df3, i) dat.append(s.var()) dat (pd .DataFrame(dat) .plot .line(color = '#4000c7') .axhline(y = 192, color = '#00da75') ); ํ๋ณธ์ ์๊ฐ ๋ง์์ง์๋ก ์ ์ฐจ ๋ถ์ฐ๊ฐ์ด ์๋ ดํ๋ ๋ชจ์ต์ ํ์ธํ์์ต๋๋ค. 2. ์ค์ฌ๊ทนํ์ ๋ฆฌ sample_means = []..