Jayden`s
[TIL]48_DataBase, SQL_Basics(SQLite)
๋ฐ์ดํฐ๋ฒ ์ด์ค IN-Memory : ํ๋ก๊ทธ๋จ์ด ์คํ๋ ๋์๋ง ์กด์ฌํ๋ ๋ฐ์ดํฐ ex) ํ์ด์ฌ์์ ๋ณ์ ์ ์ฅ, ๋ฆฌ์คํธ ์ ์ฅ ๋ฑ File I/O : ํ์ผ์ ์ฝ์ด์ค๋ ๋ฐฉ์์ผ๋ก ์์ ์ํธ, CSV์ ๊ฐ์ ํํ ํ์ผ์ ๋งค๋ฒ ์ฝ์ด์์ผํ๋ฏ๋ก ๋ฒ๊ฑฐ๋กญ๋ค. ๋ํ ํ์ผ ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก ์์ ์ด ๋ฒ๊ฑฐ์์ง๋ค. ํ์ผ์ด ์์๋๊ฑฐ๋ ์ฌ๋ฌ ๊ฐ์ ํ์ผ๋ค์ ๋์์ ๋ค๋ค์ผํ๊ฑฐ๋ ํ๋ ๋ฑ ๋ณต์กํ๊ณ ๋ฐ์ดํฐ๋์ด ๋ง์์ง์๋ก ์ ์ ํ๋ค์ด์ง ๋ฐ์ดํฐ๋ฒ ์ด์ค(๊ด๊ณํ) : ํ๋์ csv ํ์ผ์ด๋ ์์ ์ํธ๋ฅผ ํ ๊ฐ์ 'ํ ์ด๋ธ(์ํฐํฐ)'๋ก ์ ์ฅํ ์ ์์ ํ๋ฒ์ ์ฌ๋ฌ ๊ฐ์ ํ ์ด๋ธ์ ๊ฐ์ง ์ ์๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๊ธฐ ์์ ๋ํ ์ ์ด์ ์์ ์ํธ, CSV ํ์ผ ๋ฑ ํน์ ํํ์ ํ์ผ๋ค์ ๋์ฉ๋์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ธฐ ์ํ ๋ชฉ์ ์ด ์๋ SQL(Struct..
[TIL]47_Git&Github and conda(๊ฐ์ํ๊ฒฝ)
ํฐ๋ฏธ๋๊ณผ CLI ํฐ๋ฏธ๋ : ๋ช ๋ น์ ์ ๋ฌํ ์ ์๋ ์ดํ๋ฆฌ์ผ์ด์ CLI : ๊ธ์ ๊ธฐ๋ฐ์ผ๋ก ๋ช ๋ น์ ์ ๋ฌํ ์ ์๋ ์ธํฐํ์ด์ค(์๋ ์ ๋ง์ฐ์ค ์์ด ํค๋ณด๋๋ก๋ง ์ปดํจํฐ๋ฅผ ๋ค๋ค๋ค.) GUI : ๊ทธ๋ํฝ ๊ธฐ๋ฐ์ผ๋ก ๋ช ๋ น์ ์ ๋ฌํ ์ ์๋ ์ธํฐํ์ด์ค(์ฐ๋ฆฌ๊ฐ ๋ง์ฐ์ค ์ฌ์ฉํ๋ ๊ฒ๋ GUI) CLI๊ฐ ์ค์ํ ์ด์ ์์ง๋์ด๋ง์ ์ํ ๊ฐ๋ฐ ๋๊ตฌ์ ํ๊ฒฝ์ ์ฃผ๋ก CLI๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ง๋ค์ด์ก์ CLI์ Top5 ๊ธฐ๋ณธ ๋ช ๋ น์ด $ pwd : ํ์ฌ ๊ฒฝ๋ก๋ฅผ ๋ํ๋ด๋ ๋ช ๋ น์ด์ ๋๋ค. $ mkdir {ํด๋๋ช }: ํด๋(๋๋ ํ ๋ฆฌ)๋ฅผ ์์ฑํ๋ ๋ช ๋ น์ด์ ๋๋ค. $ cd {ํด๋๋ช } : ํด๋์ ๋ค์ด๊ฐ๋ ๋ช ๋ น์ด์ ๋๋ค. $ ls : ํ์ฌ ๋๋ ํ ๋ฆฌ ์์ ํ์ผ ๋ฐ ํด๋ ๋ชฉ๋ก์ ์ถ๋ ฅํฉ๋๋ค. $ ls -l : ์์ธ์ ๋ณด ์ถ๋ ฅ $ ls -a : ์จ๊ธด ํ์ผ๊น์ง ํ์ $ ls -..
[TIL]46_Section1_review_๋ง๋ฌด๋ฆฌ
Section1_sprint3 ํค์๋ ์์ฃผ๋ก ์ ๋ฆฌ set : list์ ๋น์ท, ๋จ ์ค๋ณต์น ํ์ฉ x ์์ ๊ฐ๋ x Determinant ๋ชจ์ง๋จ : population -> parameter ํ๋ณธ์ง๋จ : sample -> statistic Covariance(๊ณต๋ถ์ฐ) Correlation coefficient(์๊ด๊ณ์) : ๊ณต๋ถ์ฐ์ ์ค์ผ์ผ๋งํ ๊ฒ ๋ณดํต ์ฐ๋ฆฌ๊ฐ ์๋ ์๊ด๊ณ์๊ฐ Pearson Corr์ด๊ณ categorical data์ ์์๋ฅผ ๋ถ์ฌํ๊ณ ์ด๋ฅผ ํ ๋๋ก corr์ ๊ตฌํ๋ ๊ฒ Spearman Corr -> ๋ฐ์ดํฐ๊ฐ ๊ฐ๋ ๊ฐ์ด ์๋ ์ฐ๋ฆฌ๊ฐ ๋ถ์ฌํ '์์ ํน์ ์์'๋ก๋ง ์๊ด๊ณ์๋ฅผ ๋ฐ์ง๋ค. ๋จ์๋ฒกํฐ : ๊ธธ์ด๊ฐ 1์ธ ๋ฒกํฐ Span : ์ฃผ์ด์ง ๋ฒกํฐ์ ์กฐํฉ์ผ๋ก ๋ง๋ค ์ ์๋ ๋ชจ๋ ๊ฐ๋ฅํ ๋ฒกํฐ์ ์ง..
[TIL]45.8_Section1_sprint2_๊ฐ์ธ๋ณต์ต(์ฃผ๋ง)
Section1_sprint2(์ค์ํ๊ฒ ๊ฐ๋ ์ก๊ณ ๊ฐ์ผํ ํต๊ณ ํํธ) ๊ธฐ์ ํต๊ณ : ํ๊ท , ๋ถ์ฐ, ํ์คํธ์ฐจ ๋ฑ๋ฑ ์์งํ ๋ฐ์ดํฐ๋ฅผ ์ค๋ช ๋ฐ ๋ฌ์ฌํ๋ ํต๊ณ ์ถ๋ฆฌ ํต๊ณ : ์์งํ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ถ๋ก /์์ธกํ๋ ํต๊ณ ex) ์ค๋ฌธ์กฐ์ฌ๋ฅผ ํตํ ๋ํ์จ ์์ธก ์ํ๋ง ๋ฐฉ์ ์ฌ๋ฌ๊ฐ์ง ๊ฐ์ค ๊ฒ์ : ์ฃผ์ด์ง ์ํฉ์ ๋ํด ํ๊ณ ์ํ๋ ์ฃผ์ฅ์ด ๋ง๋์ง ์๋์ง ํ์ ํ๋ ๊ณผ์ ๋ชจ์ง๋จ์ ๋ํ ํ๋ณธ์ง๋จ์ ํต๊ณ์น๊ฐ ์ ์ํ์ง ์๋์ง ์ฌ๋ถ ๊ฒฐ์ Student T-test One sample T-test๊ท๋ฌด๊ฐ์ค(H0) : ํ๋ณธ์ง๋จ์ ํ๊ท = ์ด๋ค ํน์ ๊ฐ ๋๋ฆฝ๊ฐ์ค(H1) : ํ๋ณธ์ง๋จ์ ํ๊ท != ์ด๋ค ํน์ ๊ฐ from scipy.stats import ttest_1samp p-value : ์ฃผ์ด์ง ๊ฐ์ค์ ๋ํด '์ผ๋ง๋ ๊ทผ๊ฑฐ๊ฐ ์๋์ง'๋ฅผ ๋ํ๋ธ ๊ฐ..
[TIL]45.3_Section2_sprint3_๊ฐ์ธ๋ณต์ต(์ฃผ๋ง)
๋ฐ์ดํฐ ์ค๋ฌด ํ๋ก์ธ์ค ๋น์ฆ๋์ค ๋ฌธ์ ๋ฐ๊ฒฌ ๋ฐ์ดํฐ ๋ฐ๊ฒฌ ๋ฐ ๋ฌธ์ ๋ฐ๊ฒฌ ๋ฐ์ดํฐ ๋ฌธ์ ํด๊ฒฐ ๋น์ฆ๋์ค ๋ฌธ์ ํด๊ฒฐ ๋ฐ์ดํฐ ๋์(Data Leakage) ํ๊ฒ ์ธ์, ์์ธก ์์ ๋ ์ฌ์ฉ ํน์ ์ ์ ์๋ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋ ๊ฒฝ์ฐ ํ๋ จ๋ฐ์ดํฐ์ ๊ฒ์ฆ๋ฐ์ดํฐ๋ฅผ ์์ ํ ๋ถ๋ฆฌํ์ง ๋ชปํ ๊ฒฝ์ฐ(๊ฒ์ฆ์ ๋์ ๋ฐ์) ํ๊ท๋ฌธ์ ํ๊ฒ ๋ถํฌ right skewed : log ๋ณํ left skewed : exp ๋ณํ ํ์ค ๋ฐ์ดํฐ๋ ๋๋ถ๋ถ์ด right skewed ์ด๋ค. ๋ฐ์ดํฐ wrangling merge์ groupby ๊ฐ์ง๊ณ ๋ ์ ์๊ฒ ์ ์ฌ์ฉํ์ ํน์ฑ ์ค์๋ ๊ณ์ฐ ๋ฐฉ๋ฒ Tree ๊ธฐ๋ฐ์์ ์ฃผ์ด์ง๋ MDI(๋ถ์๋ ๊ฐ์ ๊ธฐ์ค) importances Drop column importance Permutation importance ๋ถ์คํ ํ์ด..