Jayden`s

    Hypothesis Test(๊ฐ€์„ค๊ฒ€์ •)

    T-test๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํ™ฉ์— ๋Œ€ํ•ด ์„ค๋ช…ํ•˜๊ณ , ๊ทธ ์ƒํ™ฉ์—์„œ ์–ด๋–ป๊ฒŒ ๊ฐ€์„ค์„ ์„ธ์šฐ๋Š”์ง€ T-test์˜ ์ „์ฒด์ ์ธ ์˜ˆ์‹œ๋ฅผ ํ•˜๋‚˜ ์„ค๋ช…ํ•ด์ฃผ์„ธ์š”. ์–ด๋– ํ•œ ๊ฐ€์„ค์„ ์„ธ์› ๋Š”์ง€ ์™œ ์ด๋Ÿฌํ•œ ๊ฐ€์„ค์„ ์„ธ์šฐ๊ฒŒ ๋˜์—ˆ๋Š”์ง€ ์™œ T-test๋ฅผ ์„ ํƒํ–ˆ๋Š”์ง€ NBA์™€ NBA G(๋งˆ์ด๋„ˆ๋ฆฌ๊ทธ)์˜ ๋†๊ตฌ์„ ์ˆ˜๋“ค์˜ ํ‚ค๋ฅผ ๋น„๊ตํ•ด๋ณด๊ณ ์‹ถ์Šต๋‹ˆ๋‹ค. ๊ท€๋ฌด๊ฐ€์„ค(H0) : NBA ๋ฉ”์ด์ € ๋ฆฌ๊ทธ ์„ ์ˆ˜๋“ค์˜ ํ‚ค์™€ ๋งˆ์ด๋„ˆ ๋ฆฌ๊ทธ ์„ ์ˆ˜๋“ค์˜ ํ‚ค ํ‰๊ท ์€ ์ฐจ์ด๊ฐ€ ์—†๋‹ค. ๋Œ€๋ฆฝ๊ฐ€์„ค(H1) : NBA ๋ฉ”์ด์ € ๋ฆฌ๊ทธ ์„ ์ˆ˜๋“ค์˜ ํ‚ค์™€ ๋งˆ์ด๋„ˆ ๋ฆฌ๊ทธ ์„ ์ˆ˜๋“ค์˜ ํ‚ค ํ‰๊ท ์€ ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค. ์ผ๋‹จ ํ‚ค ์ž์ฒด๋Š” ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด๊ณ , ๋†๊ตฌ์„ ์ˆ˜๋“ค์˜ ํ‚ค์— ๋”ฐ๋ฅธ ์˜ํ–ฅ์„ ๋น„๊ตํ•ด๋ณด๊ณ ์‹ถ์—ˆ์Šต๋‹ˆ๋‹ค. ๋ณด๊ธฐ์˜ ์ƒํ™ฉ์„ ์ฝ๊ณ , A/B Test์— ๋Œ€ํ•ด์„œ ์ƒ๊ฐํ•ด ๋ณด์„ธ์š”. ๐Ÿ’ก ๋ณด๊ธฐ) ์—ฌ๋Ÿฌ๋ถ„์€ ๊ทธ๋กœ์Šค ํ•ดํ‚นํŒ€์˜ DA๋กœ ์ทจ์งํ•˜์˜€์Šต๋‹ˆ๋‹ค. ๋งŒ์•ฝ ..

    Basic Derivative(์ถ”๊ฐ€)

    Basic Derivative(์ถ”๊ฐ€)

    ๋‹จ์ˆœ์„ ํ˜•ํšŒ๊ท€๋ฅผ ์ด์šฉํ•˜์—ฌ Binary Classification Prediction์„ ํ•˜๊ณ ์ž ํ•œ๋‹ค๋ฉด, ๋‹จ์ˆœ์„ ํ˜•๋ผ์ธ์— ์–ด๋– ํ•œ ๋ณ€ํ™”๋ฅผ ์ฃผ๋ฉด ๋ ๊นŒ์š”? Binary classification pred๋ฅผ ํ•œ๋‹ค๋Š” ๋ง์€, ์ฆ‰ ๊ฒฐ๊ณผ๊ฐ’์ด 0๊ณผ 1๋กœ ๊ตฌ๋ถ„๋˜๋Š” ๊ฒƒ์— ๋Œ€ํ•œ ๋ถ„๋ฅ˜ ์˜ˆ์ธก์„ ํ•˜๋Š” ๊ฒƒ ๊ทธ๋Ÿฌ๋‚˜ ๋‹จ์ˆœ์„ ํ˜•ํšŒ๊ท€ $$y=wx+b$$ ๋Š” ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ์˜ˆ์ธก๊ฐ’์ด ์‹ค์ˆ˜์ด๊ธฐ ๋•Œ๋ฌธ์— ์ข…์†๋ณ€์ˆ˜์˜ ๋ฒ”์œ„๊ฐ€ ์‹ค์ˆ˜, ๊ทธ๋Ÿฌ๋‚˜ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ์ข…์†๋ณ€์ˆ˜๋Š” binaryํ•œ 0๊ณผ 1์ด๋‹ค. ์ด ๋•Œ, ์šฐ๋ฆฌ๋Š” ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋กœ Logistic Regression์„ ์‚ฌ์šฉํ•ด์•ผํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ๋˜๋ฉด $$wx+b$$์— ๋Œ€ํ•ด์„œ 0๊ณผ 1 ์‚ฌ์ด์—์„œ ๊ฐ’์ด ๋‚˜์˜จ๋‹ค. ์ด ๋•Œ, ๊ฐ’์ด 0.5๋ณด๋‹ค ํฌ๋ฉด 1, ์ž‘์œผ๋ฉด 0์œผ๋กœ ๋ณด๋‚ด๋Š” ๊ฒƒ์œผ๋กœ binary ๋ถ„๋ฅ˜๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค. sigmoid ํ•จ์ˆ˜์™€ Ch..

    EDA(Exploratory Confirmatory Analysis; ํƒ์ƒ‰์  ์ž๋ฃŒ ๋ถ„์„)

    ๋‹ค์Œ ๋งํฌ๋Š” ๋‹ค์–‘ํ•œ ์‹œ๊ฐํ™” ๋ฐฉ๋ฒ•๋“ค์ด ๋‚˜์™€์žˆ๋Š” Seaborn๊ณผ Matplotlib ์˜ ๊ณต์‹๋ฌธ์„œ์ž…๋‹ˆ๋‹ค. ๋งํฌ ์†์˜ ์‹œ๊ฐํ™” ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜๋ฅผ ์„ ํƒํ•˜์—ฌ, ๊ณ ๋ฅธ ์ด์œ ์™€ ํ•ด๋‹น ์‹œ๊ฐํ™” ๋ฐฉ๋ฒ•์˜ ์žฅ์ ์„ ์†Œ๊ฐœํ•ด ์ฃผ์„ธ์š”. ์ €๋Š” seaborn์˜ violinplot์„ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค! ๋จผ์ € violinplot์€ boxplot๊ณผ ๋™์ผํ•˜๊ฒŒ ์ผ๋ณ€๋Ÿ‰, ์—ฐ์†ํ˜• ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๋ฅผ ์„ค๋ช…ํ•˜๊ธฐ ์œ„ํ•œ ๊ทธ๋ž˜ํ”„์ž…๋‹ˆ๋‹ค. ๋‚ด์šฉ ์ž์ฒด๋Š” boxplot๊ณผ ๊ฐ™์œผ๋‚˜ ์ปค๋„ ๋ฐ€๋„ ๊ณก์„ ์„ ๋”ํ•ด, ์นดํ…Œ๊ณ ๋ฆฌ๊ฐ’์— ๋”ฐ๋ฅธ ๊ฐ ๋ถ„ํฌ์˜ ์‹ค์ œ ๋ฐ์ดํ„ฐ ๋˜๋Š” ์ „์ฒด ํ˜•์ƒ์„ ๋ณด์—ฌ์ค€๋‹ค๋Š” ์žฅ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ํ™•์ฆ์  ๋ฐ์ดํ„ฐ ๋ถ„์„(CDA: Confirmatory Data Analysis)๊ณผ ํƒ์ƒ‰์  ์ž๋ฃŒ ๋ถ„์„(EDA: Exploratory Data Analysis)์˜ ์ฐจ์ด์ ์„ ์„ค๋ช…ํ•˜๊ณ ,๊ฐ๊ฐ ์–ด๋–ค ๊ฒฝ์šฐ์— ..

    [TIL]4.Basic Derivative

    ๋ชฉํ‘œ ์ตœ์ ์™€์™€ ๋ฏธ๋ถ„์˜ ๊ด€๊ณ„ ๋ฏธ๋ถ„, ํŽธ๋ฏธ๋ถ„, Chain Rule์˜ ์ฐจ์ด๋ฅผ ์ดํ•ด ๋„ํ•จ์ˆ˜(๋ฏธ๋ถ„)์„ ํŒŒ์ด์ฌ์œผ๋กœ ์ง์ ‘ ๊ตฌํ˜„ ๋ฐ scipy ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ™œ์šฉ ๋ฏธ๋ถ„(Derivative) ๊ทธ๋ฆผ์„ ๋ณด๋ฉด ์šฐ๋ฆฌ๊ฐ€ ๊ณ„์‚ฐํ•˜๊ณ ์ž ํ•˜๋Š” ๊ฒƒ์€ Δx๊ฐ€ ํ•œ์—†์ด 0์— ๊ฐ€๊นŒ์›Œ์งˆ ๋•Œ์˜ ๊ธฐ์šธ๊ธฐ ํŠน์ •ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐ’ (input, x)์— ๋Œ€ํ•ด์„œ ๋‚˜์˜ค๋Š” ๊ฒฐ๊ณผ๊ฐ’(output, y)์ด ๋ณ€ํ™”ํ•˜๋Š” ์ •๋„๋ฅผ (0์— ๊ฐ€๊นŒ์šด ๋ถ€๋ถ„์„ ์ฐพ๊ธฐ ์œ„ํ•ด) ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ. ๋ฏธ๋ถ„๊ณผ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค๋Š” ๋ฌด์Šจ ์ƒ๊ด€์ด ์žˆ๋‚˜? ์•„๋ž˜์™€ ๊ฐ™์€ ๋ฐ์ดํ„ฐ ๋ถ„ํฌ๊ฐ€ ์žˆ์„ ๋•Œ, ๊ทธ ๋ถ„ํฌ๋ฅผ ๊ฐ€์žฅ ์ž˜ ์„ค๋ช…ํ•ด์ฃผ๋Š” ํ•˜๋‚˜์˜ ์„ ์„ ๊ทธ๋ฆฐ๋‹ค๊ณ  ์ƒ๊ฐํ•ด๋ณด์ž. y-hat=b+aX (a:๊ธฐ์šธ๊ธฐ, b:y์ ˆํŽธ, y-hat:์˜ˆ์ธก๊ฐ’, x:๋ฐ์ดํ„ฐ) cf) ๋ณดํ†ต ์‹ค์ œ๊ฐ’์€ ๊ทธ๋ƒฅ y๋กœ ํ‘œํ˜„ํ•œ๋‹ค. ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ X๋ฅผ ๋„ฃ์—ˆ์„ ๋•Œ, ๋ชจ๋ธ์ด ..

    [TIL]3.Data Manipulation(๊ฐœ์ธ์ ์œผ๋กœ ์ž˜ ์•Œ์•„์•ผ ๋œ๋‹ค๊ณ  ๋Š๊ผˆ๋˜ ๋ถ€๋ถ„)

    ๋ชฉํ‘œ pandas๋ฅผ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ concat/mergeํ•˜๊ธฐ tidy ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๊ฐœ๋… ์ดํ•ด melt์™€ pivot/pivot_table ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ wide์™€ tidy ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์„œ๋กœ ๋ณ€ํ™˜ํ•  ์ˆ˜ ์žˆ๋‹ค. Pandas๋กœ ๋ฐ์ดํ„ฐ ํ•ฉ์น˜๊ธฐ ์ฃผ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ์˜ˆ๋กœ ๋“ค๋ฉด, ์ข…๋ชฉ๋ณ„ ๋ฐ์ดํ„ฐ์™€ ์–ด๋–ค ๋ฐ์ดํ„ฐ๊ฐ€ ์–ด๋–ค ์ข…๋ชฉ์„ ์˜๋ฏธํ•˜๋Š”์ง€ ์„ค๋ช…ํ•˜๋Š” description ๋ฐ์ดํ„ฐ๋กœ ๋‚˜๋ˆ„์–ด ์งˆ ์ˆ˜ ์žˆ๋‹ค. ํšจ๊ณผ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ ๋ถ„์„์„ ํ•˜๊ธฐ์œ„ํ•ด์„œ๋Š” ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํŒŒ์ผ์„ ํ•˜๋‚˜๋กœ ํ•ฉ์ณ์•ผํ•œ๋‹ค!!! ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฐฉ๋ฒ• ์ค‘ 2๊ฐ€์ง€๋ฅผ ์†Œ๊ฐœํ•ด๋ณด๊ฒ ๋‹น Concat(concatenate) ๊ฐ„๋‹จํ•˜๊ฒŒ '๋”ํ•œ๋‹ค' ํ˜น์€ '๋ถ™์ธ๋‹ค'๋ผ๋Š” ์˜๋ฏธ๋กœ ์ƒ๊ฐํ•˜๋ฉด ์ดํ•ด๊ฐ€ ํŽธํ•˜๋‹ค. ๋ฌธ์žํ˜• ๋ถ™์ด๋Š” ๋Š๋‚Œ '๋ฌธ์ž๋ฅผ' + '๋ถ™์—ฌ์š”' == '๋ฌธ์ž๋ฅผ๋ถ™์—ฌ์š”' ๋œฌ๊ธˆ์—†์ง€๋งŒ ๋ฌธ์žํ˜•์„ ๋‹ค๋ฃจ๋Š” ๋ฐฉ๋ฒ•์€ ์—ฌ..