๐Ÿ’ฟ Data/๋ถ€ํŠธ์บ ํ”„

๐Ÿ’ฟ Data/๋ถ€ํŠธ์บ ํ”„

    [TIL]13.High Dimensional Data

    ๋ชฉํ‘œ Vector Transformation ์ดํ•ด Eigenvector / Eigenvalue์— ๋Œ€ํ•œ ์ดํ•ด ๋ฐ์ดํ„ฐ์˜ feature ์ˆ˜(์ฐจ์› ์ˆ˜)๊ฐ€ ๋Š˜์–ด๋‚˜๋ฉด ์ƒ๊ธฐ๋Š” ๋ฌธ์ œ์  ๋ฐ ์ด๋ฅผ handlingํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ• PCA์˜ ๊ธฐ๋ณธ ์›๋ฆฌ์™€ ๋ชฉ์ ์— ๋Œ€ํ•œ ์ดํ•ด Vector transformation R^2 ๊ณต๊ฐ„์—์„œ ๋ฒกํ„ฐ๋ฅผ ๋ณ€ํ™˜ ์ฆ‰, ์„ ํ˜• ๋ณ€ํ™˜์€ ์ž„์˜์˜ ๋‘ ๋ฒกํ„ฐ๋ฅผ ๋”ํ•˜๊ฑฐ๋‚˜ ํ˜น์€ ์Šค์นผ๋ผ๊ฐ’์„ ๊ณฑํ•˜๋Š” ๊ฒƒ $$T(u+v)=T(u)+T(v)$$ $$T(cu)=cT(u)$$ ๋ฒกํ„ฐ๋ณ€ํ™˜์œผ๋กœ์„œ์˜ '๋งคํŠธ๋ฆญ์Šค์™€ ๋ฒกํ„ฐ์˜ ๊ณฑ' f๋ผ๋Š” transformation์„ ์‚ฌ์šฉํ•˜์—ฌ ์ž„์˜์˜ ๋ฒกํ„ฐ [x1, x2]์— ๋Œ€ํ•ด [2x1 + x2, x1 - 3x2]๋กœ ๋ณ€ํ™˜์„ ํ•œ๋‹ค. \begin{align} f(\begin{bmatrix}x_1 \\ x_2 \end..

    [TIL]12.Linear Algebra +

    ๋ชฉํ‘œ ๊ณต๋ถ„์‚ฐ, ์ƒ๊ด€๊ณ„์ˆ˜์˜ ๊ณตํ†ต์  ๋ฐ ์ฐจ์ด์  ๋ฒกํ„ฐ์˜ ์ง๊ต ๊ทธ๋ฆฌ๊ณ  ๊ทธ ์กฐ๊ฑด ๋‹จ์œ„ ๋ฒกํ„ฐ, ๋‹จ์œ„ ๋ฒกํ„ฐ๋กœ์˜ ๊ตฌ๋ถ„ span, basis, rank์˜ ๊ฐœ๋… ์ดํ•ด ๊ฐ€์šฐ์‹œ์•ˆ ์†Œ๊ฑฐ๋ฒ•(Gaussian elemination) ์ดํ•ด linear projection์— ๋Œ€ํ•œ ์ดํ•ด Variancce(๋ถ„์‚ฐ) ๊ฐ ๊ฐ’๋“ค์˜ ํ‰๊ท ์œผ๋กœ๋ถ€ํ„ฐ์˜ ์ฐจ์ด์˜ ์ œ๊ณฑ ํ‰๊ท  ๋ฐ์ดํ„ฐ๊ฐ€ ํ‰๊ท ์œผ๋กœ๋ถ€ํ„ฐ ์–ผ๋งˆ๋‚˜ ํผ์ ธ์žˆ๋Š”๊ฐ€ ๋ชจ์ง‘๋‹จ์˜ ๋ถ„์‚ฐ์„ ๊ตฌํ•  ๋• ddof=0, ํ‘œ๋ณธ์ง‘๋‹จ์˜ ๋ถ„์‚ฐ์„ ๊ตฌํ•  ๋• ddof=1 (ddof ๋ž€ delta degrees of freedom์œผ๋กœ ์ž์œ ๋„์—์„œ ์–ผ๋งˆ๋‚˜ ๋นผ์•ผํ•˜๋Š”๊ฐ€๋ฅผ ์˜๋ฏธ) ์ฆ‰, ๋ชจ์ง‘๋‹จ์˜ ๋ถ„์‚ฐ์€ n์œผ๋กœ ๋‚˜๋ˆ„๊ณ  ํ‘œ๋ณธ์ง‘๋‹จ์˜ ๋ถ„์‚ฐ์€ n-1 ๋กœ ๋‚˜๋ˆˆ๋‹ค. Covariance(๊ณต๋ถ„์‚ฐ) 1๊ฐœ์˜ ๋ณ€์ˆ˜๊ฐ€ ๋ณ€ํ™”ํ•  ๋•Œ, ๋‹ค๋ฅธ ๋ณ€์ˆ˜๋Š” ์–ด๋– ํ•œ ์—ฐ๊ด€์„ฑ์„ ๋ณด์ด๋ฉฐ ๋ณ€ํ•˜๋Š”์ง€..

    [TIL]11.Vector and Matrix

    ๋ชฉํ‘œ ๋ฐ์ดํ„ฐ์‚ฌ์ด์–ธ์Šค์™€ ์„ ํ˜•๋Œ€์ˆ˜ ๋ฒกํ„ฐ์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ๊ณ„์‚ฐ ๋งคํŠธ๋ฆญ์Šค์— ๋Œ€ํ•œ ๊ธฐ๋ณธ ๊ณ„์‚ฐ ๋‹จ์œ„ํ–‰๋ ฌ๊ฐ™์€ ํŠน๋ณ„ํ•œ ๋งคํŠธ๋ฆญ์Šค๋ฅผ ์ดํ•ดํ•˜๊ณ , ํ–‰๋ ฌ์‹(determinant)๋‚˜ ์—ญํ–‰๋ ฌ(inverse)๋ฅผ ๊ณ„์‚ฐ Numpy๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ธฐ๋ณธ ์„ ํ˜•๋Œ€์ˆ˜ ๊ณ„์‚ฐ ๊ฐœ์š” ์œ„์˜ ๋‚ด์šฉ์€ linear regression์œผ๋กœ ํ’€ ์ˆ˜ ์žˆ๋‹ค. numpy, pandas, scikitlearn ๋“ฑ๊ณผ ๊ฐ™์€ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ†ตํ•ด ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ๊ณผ์—ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์–ด๋–ป๊ฒŒ python์—์„œ ํ‘œํ˜„ํ•˜๊ณ , ์ €์žฅํ•˜๊ณ , ๊ณ„์‚ฐํ•  ๊ฒƒ์ธ๊ฐ€ Data Structure(๋ฐ์ดํ„ฐ๋ฅผ ๋‹ด๋Š” ๊ตฌ์กฐ) 1D(1-dimension) ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ์˜ ์ˆœ์„œ(order)๋Š” ์œ ์ง€๋˜์–ด์•ผํ•œ๋‹ค. list๊ฐ€ ๋Œ€ํ‘œ์ ์ด๋ฉฐ ์ˆœ์„œ๊ฐ€ ์ƒ๊ด€์—†๋Š” ๊ฒฝ์šฐ๋Š” set๊ฐ€ ์žˆ๋‹ค. 2D(2-dimension) ๋งคํŠธ๋ฆญ์Šค ์šฐ๋ฆฌ๊ฐ€ ์ž์ฃผ ์“ฐ๋Š”..

    [TIL]10.์Šคํ”„๋ฆฐํŠธ ์ฑŒ๋ฆฐ์ง€

    ๋ฐ์ดํ„ฐ๋ฅผ ์ •๋ฆฌํ•˜๋Š” ๊ฒƒ ํŠนํžˆ datetime ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” ๊ฒŒ ์•„์ง ์ต์ˆ™์น˜ ์•Š์•˜๋‹ค. ๊ฐ€์„ค ๊ฒ€์ •ํ•˜๋Š” ํŒŒํŠธ๊ฐ€ ์ƒ๊ฐ๋ณด๋‹ค ๋‚ด๊ฐ€ ๊ทธ ๊ฒ€์ •์„ ๋””์ž์ธํ•˜๋Š” ๊ฒŒ ์–ด๋ ต๋‹ค. ์™œ ๋„๋ฉ”์ธ ์ง€์‹์ด ์ค‘์š”ํ•˜๋‹ค๊ณ  ํ•˜๋Š”์ง€ ์•Œ ๊ฒƒ๋„ ๊ฐ™์•˜๋‹ค. ์–ด๋А์ •๋„ ๋„๋ฉ”์ธ์ด ์žˆ์–ด์•ผ ๊ฐ€์„ค ๊ฒ€์ •์„ ํ•  ๋•Œ๋„ ๋ญ๋ž‘ ๋ญ์— ๋Œ€ํ•ด ์–ด๋–ป๊ฒŒ ๊ฐ€์„ค ๊ฒ€์ •ํ• ์ง€ ๊ฐ์ด ์˜ฌ๋“ฏํ•˜๋‹ค. ์‹œ๊ฐํ™”ํ•˜๋Š” ํŒŒํŠธ๋ฅผ ๋ณด์™„ํ•ด์•ผ๊ฒ ๋‹ค. seaborn์—์„œ melt ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•˜๋Š” ๊ฒƒ ์ด์ œ melt์— ๋Œ€ํ•ด์„œ ์–ด๋А์ •๋„ ์•Œ๊ฒ ๋‹ค. ์ฒœ์ฒœํžˆ ๋ฐฐ์›Œ๋‚˜๊ฐ€๋ฉด ๋œ๋‹ค. ํ•  ์ˆ˜ ์žˆ๋‹ค.

    [TIL]9.Bayesian Inference

    ๋ชฉํ‘œ ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ์— ๋Œ€ํ•œ ์ดํ•ด ๋ฒ ์ด์ง€์•ˆ ํ†ต๊ณ„์˜ ๊ฐœ๋… ๋ฒ ์ด์ง€์•ˆ์˜ ํ•ต์‹ฌ์€ '๊ธฐ์กด ๊ฐ€์„ค'์— '์ƒˆ๋กœ์šด ์ •๋ณด'๋ฅผ ํ† ๋Œ€๋กœ '์—…๋ฐ์ดํŠธ' ํ•œ๋‹ค๋Š” ์  ๋ชฌํ‹ฐํ™€ ๋ฌธ 3๊ฐœ ๋’ค์— ์—ผ์†Œ 2๋งˆ๋ฆฌ, ์ฐจ 1๋Œ€. ์„ ํƒ ํ›„ ๋‹ต์„ ์•Œ๊ณ  ์žˆ๋Š” ์ง„ํ–‰์ž๊ฐ€ ๋‚˜๋จธ์ง€ 2๊ฐœ ์ค‘ 1๊ฐœ์˜ ๋’ค์— ์—ผ์†Œ๊ฐ€ ์žˆ์Œ์„ ๋ณด์—ฌ์คŒ ์ดํ›„ ์„ ํƒ์„ ๋ฐ”๊ฟ€ ๊ฒƒ์ธ์ง€ ๋ง๊ฒƒ์ธ์ง€. ๋‹น์—ฐํžˆ ๋ฐ”๊พธ๋Š” ๊ฒŒ ๊ฐœ์ด๋“ ์ด ํ™•๋ฅ ์˜ ๋ฒ•์น™(The Law of Total Probability) A๋ผ๋Š” ํŠน์ • ํ™•๋ฅ  ๋ณ€์ˆ˜์— ๋Œ€ํ•ด, ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ ์ด๋ฒคํŠธ์˜ ์ด ํ™•๋ฅ ์€ 1์ด๋‹ค. $$P(A)=โˆ‘P(An)=1$$ ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ (The Law of Cinditional Probability) ๋‹ค๋ฅธ ์ด๋ฒคํŠธ๊ฐ€ ์ผ์–ด๋‚œ ์ƒํ™ฉ์—์„œ์˜ ํ™•๋ฅ  $$P(A|B) = {P(AโˆฉB) \over P(B)}$$ ์ „์ฒด ์‚ฌ๊ฐํ˜•์ด ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ ํ™•๋ฅ  ๊ณต๊ฐ„์ด..