Jayden`s

    [TIL]48_DataBase, SQL_Basics(SQLite)

    ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค IN-Memory : ํ”„๋กœ๊ทธ๋žจ์ด ์‹คํ–‰๋  ๋•Œ์—๋งŒ ์กด์žฌํ•˜๋Š” ๋ฐ์ดํ„ฐ ex) ํŒŒ์ด์ฌ์—์„œ ๋ณ€์ˆ˜ ์ €์žฅ, ๋ฆฌ์ŠคํŠธ ์ €์žฅ ๋“ฑ File I/O : ํŒŒ์ผ์„ ์ฝ์–ด์˜ค๋Š” ๋ฐฉ์‹์œผ๋กœ ์—‘์…€ ์‹œํŠธ, CSV์™€ ๊ฐ™์€ ํ˜•ํƒœ ํŒŒ์ผ์„ ๋งค๋ฒˆ ์ฝ์–ด์™€์•ผํ•˜๋ฏ€๋กœ ๋ฒˆ๊ฑฐ๋กญ๋‹ค. ๋˜ํ•œ ํŒŒ์ผ ํฌ๊ธฐ๊ฐ€ ์ปค์งˆ์ˆ˜๋ก ์ž‘์—…์ด ๋ฒ„๊ฑฐ์›Œ์ง„๋‹ค. ํŒŒ์ผ์ด ์†์ƒ๋˜๊ฑฐ๋‚˜ ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํŒŒ์ผ๋“ค์„ ๋™์‹œ์— ๋‹ค๋ค„์•ผํ•˜๊ฑฐ๋‚˜ ํ•˜๋Š” ๋“ฑ ๋ณต์žกํ•˜๊ณ  ๋ฐ์ดํ„ฐ๋Ÿ‰์ด ๋งŽ์•„์งˆ์ˆ˜๋ก ์ ์  ํž˜๋“ค์–ด์ง ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค(๊ด€๊ณ„ํ˜•) : ํ•˜๋‚˜์˜ csv ํŒŒ์ผ์ด๋‚˜ ์—‘์…€ ์‹œํŠธ๋ฅผ ํ•œ ๊ฐœ์˜ 'ํ…Œ์ด๋ธ”(์—”ํ‹ฐํ‹ฐ)'๋กœ ์ €์žฅํ•  ์ˆ˜ ์žˆ์Œ ํ•œ๋ฒˆ์— ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํ…Œ์ด๋ธ”์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€์ ธ์˜ค๊ธฐ ์ˆ˜์›” ๋˜ํ•œ ์• ์ดˆ์— ์—‘์…€ ์‹œํŠธ, CSV ํŒŒ์ผ ๋“ฑ ํŠน์ • ํ˜•ํƒœ์˜ ํŒŒ์ผ๋“ค์€ ๋Œ€์šฉ๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ธฐ ์œ„ํ•œ ๋ชฉ์ ์ด ์•„๋‹˜ SQL(Struct..

    [TIL]47_Git&Github and conda(๊ฐ€์ƒํ™˜๊ฒฝ)

    ํ„ฐ๋ฏธ๋„๊ณผ CLI ํ„ฐ๋ฏธ๋„ : ๋ช…๋ น์„ ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ์–ดํ”Œ๋ฆฌ์ผ€์ด์…˜ CLI : ๊ธ€์ž ๊ธฐ๋ฐ˜์œผ๋กœ ๋ช…๋ น์„ ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ์ธํ„ฐํŽ˜์ด์Šค(์˜›๋‚ ์—” ๋งˆ์šฐ์Šค ์—†์ด ํ‚ค๋ณด๋“œ๋กœ๋งŒ ์ปดํ“จํ„ฐ๋ฅผ ๋‹ค๋ค˜๋‹ค.) GUI : ๊ทธ๋ž˜ํ”ฝ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ช…๋ น์„ ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ์ธํ„ฐํŽ˜์ด์Šค(์šฐ๋ฆฌ๊ฐ€ ๋งˆ์šฐ์Šค ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ๋„ GUI) CLI๊ฐ€ ์ค‘์š”ํ•œ ์ด์œ  ์—”์ง€๋‹ˆ์–ด๋ง์„ ์œ„ํ•œ ๊ฐœ๋ฐœ ๋„๊ตฌ์˜ ํ™˜๊ฒฝ์€ ์ฃผ๋กœ CLI๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋งŒ๋“ค์–ด์กŒ์Œ CLI์˜ Top5 ๊ธฐ๋ณธ ๋ช…๋ น์–ด $ pwd : ํ˜„์žฌ ๊ฒฝ๋กœ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋ช…๋ น์–ด์ž…๋‹ˆ๋‹ค. $ mkdir {ํด๋”๋ช…}: ํด๋”(๋””๋ ‰ํ† ๋ฆฌ)๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ช…๋ น์–ด์ž…๋‹ˆ๋‹ค. $ cd {ํด๋”๋ช…} : ํด๋”์— ๋“ค์–ด๊ฐ€๋Š” ๋ช…๋ น์–ด์ž…๋‹ˆ๋‹ค. $ ls : ํ˜„์žฌ ๋””๋ ‰ํ† ๋ฆฌ ์•ˆ์— ํŒŒ์ผ ๋ฐ ํด๋” ๋ชฉ๋ก์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค. $ ls -l : ์ƒ์„ธ์ •๋ณด ์ถœ๋ ฅ $ ls -a : ์ˆจ๊ธด ํŒŒ์ผ๊นŒ์ง€ ํ‘œ์‹œ $ ls -..

    [TIL]46_Section1_review_๋งˆ๋ฌด๋ฆฌ

    Section1_sprint3 ํ‚ค์›Œ๋“œ ์œ„์ฃผ๋กœ ์ •๋ฆฌ set : list์™€ ๋น„์Šท, ๋‹จ ์ค‘๋ณต์น˜ ํ—ˆ์šฉ x ์ˆœ์„œ ๊ฐœ๋… x Determinant ๋ชจ์ง‘๋‹จ : population -> parameter ํ‘œ๋ณธ์ง‘๋‹จ : sample -> statistic Covariance(๊ณต๋ถ„์‚ฐ) Correlation coefficient(์ƒ๊ด€๊ณ„์ˆ˜) : ๊ณต๋ถ„์‚ฐ์„ ์Šค์ผ€์ผ๋งํ•œ ๊ฒƒ ๋ณดํ†ต ์šฐ๋ฆฌ๊ฐ€ ์•„๋Š” ์ƒ๊ด€๊ณ„์ˆ˜๊ฐ€ Pearson Corr์ด๊ณ  categorical data์— ์ˆœ์„œ๋ฅผ ๋ถ€์—ฌํ•˜๊ณ  ์ด๋ฅผ ํ† ๋Œ€๋กœ corr์„ ๊ตฌํ•˜๋Š” ๊ฒŒ Spearman Corr -> ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฐ–๋Š” ๊ฐ’์ด ์•„๋‹Œ ์šฐ๋ฆฌ๊ฐ€ ๋ถ€์—ฌํ•œ '์ˆœ์„œ ํ˜น์€ ์ˆœ์œ„'๋กœ๋งŒ ์ƒ๊ด€๊ณ„์ˆ˜๋ฅผ ๋”ฐ์ง„๋‹ค. ๋‹จ์œ„๋ฒกํ„ฐ : ๊ธธ์ด๊ฐ€ 1์ธ ๋ฒกํ„ฐ Span : ์ฃผ์–ด์ง„ ๋ฒกํ„ฐ์˜ ์กฐํ•ฉ์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ๊ฐ€๋Šฅํ•œ ๋ฒกํ„ฐ์˜ ์ง‘..

    [TIL]45.8_Section1_sprint2_๊ฐœ์ธ๋ณต์Šต(์ฃผ๋ง)

    Section1_sprint2(์ค‘์š”ํ•˜๊ฒŒ ๊ฐœ๋… ์žก๊ณ ๊ฐ€์•ผํ•  ํ†ต๊ณ„ ํŒŒํŠธ) ๊ธฐ์ˆ  ํ†ต๊ณ„ : ํ‰๊ท , ๋ถ„์‚ฐ, ํ‘œ์ค€ํŽธ์ฐจ ๋“ฑ๋“ฑ ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์„ค๋ช… ๋ฐ ๋ฌ˜์‚ฌํ•˜๋Š” ํ†ต๊ณ„ ์ถ”๋ฆฌ ํ†ต๊ณ„ : ์ˆ˜์ง‘ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ถ”๋ก /์˜ˆ์ธกํ•˜๋Š” ํ†ต๊ณ„ ex) ์„ค๋ฌธ์กฐ์‚ฌ๋ฅผ ํ†ตํ•œ ๋“ํ‘œ์œจ ์˜ˆ์ธก ์ƒ˜ํ”Œ๋ง ๋ฐฉ์‹ ์—ฌ๋Ÿฌ๊ฐ€์ง€ ๊ฐ€์„ค ๊ฒ€์ • : ์ฃผ์–ด์ง„ ์ƒํ™ฉ์— ๋Œ€ํ•ด ํ•˜๊ณ ์žํ•˜๋Š” ์ฃผ์žฅ์ด ๋งž๋Š”์ง€ ์•„๋‹Œ์ง€ ํŒ์ •ํ•˜๋Š” ๊ณผ์ • ๋ชจ์ง‘๋‹จ์— ๋Œ€ํ•œ ํ‘œ๋ณธ์ง‘๋‹จ์˜ ํ†ต๊ณ„์น˜๊ฐ€ ์œ ์˜ํ•œ์ง€ ์•„๋‹Œ์ง€ ์—ฌ๋ถ€ ๊ฒฐ์ • Student T-test One sample T-test๊ท€๋ฌด๊ฐ€์„ค(H0) : ํ‘œ๋ณธ์ง‘๋‹จ์˜ ํ‰๊ท  = ์–ด๋–ค ํŠน์ • ๊ฐ’ ๋Œ€๋ฆฝ๊ฐ€์„ค(H1) : ํ‘œ๋ณธ์ง‘๋‹จ์˜ ํ‰๊ท  != ์–ด๋–ค ํŠน์ • ๊ฐ’ from scipy.stats import ttest_1samp p-value : ์ฃผ์–ด์ง„ ๊ฐ€์„ค์— ๋Œ€ํ•ด '์–ผ๋งˆ๋‚˜ ๊ทผ๊ฑฐ๊ฐ€ ์žˆ๋Š”์ง€'๋ฅผ ๋‚˜ํƒ€๋‚ธ ๊ฐ’..

    [TIL]45.3_Section2_sprint3_๊ฐœ์ธ๋ณต์Šต(์ฃผ๋ง)

    ๋ฐ์ดํ„ฐ ์‹ค๋ฌด ํ”„๋กœ์„ธ์Šค ๋น„์ฆˆ๋‹ˆ์Šค ๋ฌธ์ œ ๋ฐœ๊ฒฌ ๋ฐ์ดํ„ฐ ๋ฐœ๊ฒฌ ๋ฐ ๋ฌธ์ œ ๋ฐœ๊ฒฌ ๋ฐ์ดํ„ฐ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋น„์ฆˆ๋‹ˆ์Šค ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฐ์ดํ„ฐ ๋ˆ„์ˆ˜(Data Leakage) ํƒ€๊ฒŸ ์™ธ์—, ์˜ˆ์ธก ์‹œ์  ๋•Œ ์‚ฌ์šฉ ํ˜น์€ ์•Œ ์ˆ˜ ์—†๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ํฌํ•จ๋œ ๊ฒฝ์šฐ ํ›ˆ๋ จ๋ฐ์ดํ„ฐ์™€ ๊ฒ€์ฆ๋ฐ์ดํ„ฐ๋ฅผ ์™„์ „ํžˆ ๋ถ„๋ฆฌํ•˜์ง€ ๋ชปํ•œ ๊ฒฝ์šฐ(๊ฒ€์ฆ์‹œ ๋ˆ„์ˆ˜ ๋ฐœ์ƒ) ํšŒ๊ท€๋ฌธ์ œ ํƒ€๊ฒŸ ๋ถ„ํฌ right skewed : log ๋ณ€ํ™˜ left skewed : exp ๋ณ€ํ™˜ ํ˜„์‹ค ๋ฐ์ดํ„ฐ๋Š” ๋Œ€๋ถ€๋ถ„์ด right skewed ์ด๋‹ค. ๋ฐ์ดํ„ฐ wrangling merge์™€ groupby ๊ฐ€์ง€๊ณ  ๋†€ ์ˆ˜ ์žˆ๊ฒŒ ์ž˜ ์‚ฌ์šฉํ•˜์ž ํŠน์„ฑ ์ค‘์š”๋„ ๊ณ„์‚ฐ ๋ฐฉ๋ฒ• Tree ๊ธฐ๋ฐ˜์—์„œ ์ฃผ์–ด์ง€๋Š” MDI(๋ถˆ์ˆœ๋„ ๊ฐ์†Œ ๊ธฐ์ค€) importances Drop column importance Permutation importance ๋ถ€์ŠคํŒ… ํ•˜์ด..