
๐ฟ Data/๋ถํธ์บ ํ
[TIL]13.High Dimensional Data
๋ชฉํ Vector Transformation ์ดํด Eigenvector / Eigenvalue์ ๋ํ ์ดํด ๋ฐ์ดํฐ์ feature ์(์ฐจ์ ์)๊ฐ ๋์ด๋๋ฉด ์๊ธฐ๋ ๋ฌธ์ ์ ๋ฐ ์ด๋ฅผ handlingํ๊ธฐ ์ํ ๋ฐฉ๋ฒ PCA์ ๊ธฐ๋ณธ ์๋ฆฌ์ ๋ชฉ์ ์ ๋ํ ์ดํด Vector transformation R^2 ๊ณต๊ฐ์์ ๋ฒกํฐ๋ฅผ ๋ณํ ์ฆ, ์ ํ ๋ณํ์ ์์์ ๋ ๋ฒกํฐ๋ฅผ ๋ํ๊ฑฐ๋ ํน์ ์ค์นผ๋ผ๊ฐ์ ๊ณฑํ๋ ๊ฒ $$T(u+v)=T(u)+T(v)$$ $$T(cu)=cT(u)$$ ๋ฒกํฐ๋ณํ์ผ๋ก์์ '๋งคํธ๋ฆญ์ค์ ๋ฒกํฐ์ ๊ณฑ' f๋ผ๋ transformation์ ์ฌ์ฉํ์ฌ ์์์ ๋ฒกํฐ [x1, x2]์ ๋ํด [2x1 + x2, x1 - 3x2]๋ก ๋ณํ์ ํ๋ค. \begin{align} f(\begin{bmatrix}x_1 \\ x_2 \end..
[TIL]12.Linear Algebra +
๋ชฉํ ๊ณต๋ถ์ฐ, ์๊ด๊ณ์์ ๊ณตํต์ ๋ฐ ์ฐจ์ด์ ๋ฒกํฐ์ ์ง๊ต ๊ทธ๋ฆฌ๊ณ ๊ทธ ์กฐ๊ฑด ๋จ์ ๋ฒกํฐ, ๋จ์ ๋ฒกํฐ๋ก์ ๊ตฌ๋ถ span, basis, rank์ ๊ฐ๋ ์ดํด ๊ฐ์ฐ์์ ์๊ฑฐ๋ฒ(Gaussian elemination) ์ดํด linear projection์ ๋ํ ์ดํด Variancce(๋ถ์ฐ) ๊ฐ ๊ฐ๋ค์ ํ๊ท ์ผ๋ก๋ถํฐ์ ์ฐจ์ด์ ์ ๊ณฑ ํ๊ท ๋ฐ์ดํฐ๊ฐ ํ๊ท ์ผ๋ก๋ถํฐ ์ผ๋ง๋ ํผ์ ธ์๋๊ฐ ๋ชจ์ง๋จ์ ๋ถ์ฐ์ ๊ตฌํ ๋ ddof=0, ํ๋ณธ์ง๋จ์ ๋ถ์ฐ์ ๊ตฌํ ๋ ddof=1 (ddof ๋ delta degrees of freedom์ผ๋ก ์์ ๋์์ ์ผ๋ง๋ ๋นผ์ผํ๋๊ฐ๋ฅผ ์๋ฏธ) ์ฆ, ๋ชจ์ง๋จ์ ๋ถ์ฐ์ n์ผ๋ก ๋๋๊ณ ํ๋ณธ์ง๋จ์ ๋ถ์ฐ์ n-1 ๋ก ๋๋๋ค. Covariance(๊ณต๋ถ์ฐ) 1๊ฐ์ ๋ณ์๊ฐ ๋ณํํ ๋, ๋ค๋ฅธ ๋ณ์๋ ์ด๋ ํ ์ฐ๊ด์ฑ์ ๋ณด์ด๋ฉฐ ๋ณํ๋์ง..
[TIL]11.Vector and Matrix
๋ชฉํ ๋ฐ์ดํฐ์ฌ์ด์ธ์ค์ ์ ํ๋์ ๋ฒกํฐ์ ๋ํ ๊ธฐ๋ณธ ๊ณ์ฐ ๋งคํธ๋ฆญ์ค์ ๋ํ ๊ธฐ๋ณธ ๊ณ์ฐ ๋จ์ํ๋ ฌ๊ฐ์ ํน๋ณํ ๋งคํธ๋ฆญ์ค๋ฅผ ์ดํดํ๊ณ , ํ๋ ฌ์(determinant)๋ ์ญํ๋ ฌ(inverse)๋ฅผ ๊ณ์ฐ Numpy๋ฅผ ์ฌ์ฉํ์ฌ ๊ธฐ๋ณธ ์ ํ๋์ ๊ณ์ฐ ๊ฐ์ ์์ ๋ด์ฉ์ linear regression์ผ๋ก ํ ์ ์๋ค. numpy, pandas, scikitlearn ๋ฑ๊ณผ ๊ฐ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํตํด ๊ณ์ฐํ ์ ์๋ค. ๊ทธ๋ ๋ค๋ฉด ๊ณผ์ฐ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ python์์ ํํํ๊ณ , ์ ์ฅํ๊ณ , ๊ณ์ฐํ ๊ฒ์ธ๊ฐ Data Structure(๋ฐ์ดํฐ๋ฅผ ๋ด๋ ๊ตฌ์กฐ) 1D(1-dimension) ๋ฒกํฐ ๋ฐ์ดํฐ์ ์์(order)๋ ์ ์ง๋์ด์ผํ๋ค. list๊ฐ ๋ํ์ ์ด๋ฉฐ ์์๊ฐ ์๊ด์๋ ๊ฒฝ์ฐ๋ set๊ฐ ์๋ค. 2D(2-dimension) ๋งคํธ๋ฆญ์ค ์ฐ๋ฆฌ๊ฐ ์์ฃผ ์ฐ๋..
[TIL]10.์คํ๋ฆฐํธ ์ฑ๋ฆฐ์ง
๋ฐ์ดํฐ๋ฅผ ์ ๋ฆฌํ๋ ๊ฒ ํนํ datetime ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ ๊ฒ ์์ง ์ต์์น ์์๋ค. ๊ฐ์ค ๊ฒ์ ํ๋ ํํธ๊ฐ ์๊ฐ๋ณด๋ค ๋ด๊ฐ ๊ทธ ๊ฒ์ ์ ๋์์ธํ๋ ๊ฒ ์ด๋ ต๋ค. ์ ๋๋ฉ์ธ ์ง์์ด ์ค์ํ๋ค๊ณ ํ๋์ง ์ ๊ฒ๋ ๊ฐ์๋ค. ์ด๋์ ๋ ๋๋ฉ์ธ์ด ์์ด์ผ ๊ฐ์ค ๊ฒ์ ์ ํ ๋๋ ๋ญ๋ ๋ญ์ ๋ํด ์ด๋ป๊ฒ ๊ฐ์ค ๊ฒ์ ํ ์ง ๊ฐ์ด ์ฌ๋ฏํ๋ค. ์๊ฐํํ๋ ํํธ๋ฅผ ๋ณด์ํด์ผ๊ฒ ๋ค. seaborn์์ melt ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ๋ ๊ฒ ์ด์ melt์ ๋ํด์ ์ด๋์ ๋ ์๊ฒ ๋ค. ์ฒ์ฒํ ๋ฐฐ์๋๊ฐ๋ฉด ๋๋ค. ํ ์ ์๋ค.
[TIL]9.Bayesian Inference
๋ชฉํ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ๋ํ ์ดํด ๋ฒ ์ด์ง์ ํต๊ณ์ ๊ฐ๋ ๋ฒ ์ด์ง์์ ํต์ฌ์ '๊ธฐ์กด ๊ฐ์ค'์ '์๋ก์ด ์ ๋ณด'๋ฅผ ํ ๋๋ก '์ ๋ฐ์ดํธ' ํ๋ค๋ ์ ๋ชฌํฐํ ๋ฌธ 3๊ฐ ๋ค์ ์ผ์ 2๋ง๋ฆฌ, ์ฐจ 1๋. ์ ํ ํ ๋ต์ ์๊ณ ์๋ ์งํ์๊ฐ ๋๋จธ์ง 2๊ฐ ์ค 1๊ฐ์ ๋ค์ ์ผ์๊ฐ ์์์ ๋ณด์ฌ์ค ์ดํ ์ ํ์ ๋ฐ๊ฟ ๊ฒ์ธ์ง ๋ง๊ฒ์ธ์ง. ๋น์ฐํ ๋ฐ๊พธ๋ ๊ฒ ๊ฐ์ด๋ ์ด ํ๋ฅ ์ ๋ฒ์น(The Law of Total Probability) A๋ผ๋ ํน์ ํ๋ฅ ๋ณ์์ ๋ํด, ๋ชจ๋ ๊ฐ๋ฅํ ์ด๋ฒคํธ์ ์ด ํ๋ฅ ์ 1์ด๋ค. $$P(A)=โP(An)=1$$ ์กฐ๊ฑด๋ถ ํ๋ฅ (The Law of Cinditional Probability) ๋ค๋ฅธ ์ด๋ฒคํธ๊ฐ ์ผ์ด๋ ์ํฉ์์์ ํ๋ฅ $$P(A|B) = {P(AโฉB) \over P(B)}$$ ์ ์ฒด ์ฌ๊ฐํ์ด ๋ชจ๋ ๊ฐ๋ฅํ ํ๋ฅ ๊ณต๊ฐ์ด..