๐Ÿ’ฟ Data/๋ถ€ํŠธ์บ ํ”„

[TIL]27.Section2_sprint1 challenge

Jayden1116 2021. 12. 24. 00:13

linear regression

multiple regression

ridge regression

logistic regression

 

ํฐ ๊ณจ์ž๋Š” ์œ„์™€ ๊ฐ™์€ ๋ชจ๋ธ๋“ค์„ ๋ฐฐ์› ๋‹ค. 

 

ํšŒ๊ท€์™€ ๋ถ„๋ฅ˜์— ๋”ฐ๋ผ ์‚ฌ์šฉํ•˜๋Š” ๋ชจ๋ธ์ด ๋‹ค๋ฅด๊ณ 

 

๋ชจ๋ธ์— ๋”ฐ๋ผ ํ‰๊ฐ€์ง€ํ‘œ๊ฐ€ ๋‹ค๋ฅด๊ณ 

 

๊ทธ ๋ชจ๋ธ์— ๋ฐ์ดํ„ฐ๋ฅผ ๋Œ€์ž…ํ•˜๊ธฐ ์ „ 

 

train, validate, test set์„ ๊ตฌ๋ถ„ํ•˜๊ณ 

 

๊ทธ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด OneHot encoding, scaling, polynomial ๋“ฑ๋“ฑ

 

๋‹ค์–‘ํ•œ ์ธ์ฝ”๋”๋“ค์ด ์žˆ๋‹ค.

 

๋˜ํ•œ ๊ฐ ๋ชจ๋ธ๋“ค์— ๋”ฐ๋ผ ์กฐ์ ˆํ•  ์ˆ˜ ์žˆ๋Š” ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋„ ์žˆ์—ˆ๋‹ค. 

 

์ด๋ฒˆ ์ฃผ์— ๋Š๋‚€ ๊ฒƒ์€ ๋จธ์‹ ๋Ÿฌ๋‹ ์ž์ฒด๋Š” ๋„ˆ๋ฌด ์žฌ๋ฏธ์žˆ๋‹ค.

 

๋‹ค๋งŒ, Section 1 ์—์„œ ํ•™์Šตํ•œ EDA, Feature Engineering์ด ์–ผ๋งˆ๋‚˜

 

์‹ค๋ฌด์—์„œ ์ค‘์š”ํ•œ์ง€ ๋Š๋‚„ ์ˆ˜ ์žˆ์—ˆ๋‹ค.

 

ํ†ต๊ณ„์ , ์‹œ๊ฐํ™”, ๋„๋ฉ”์ธ ์„ ํ†ตํ•œ ๊ฐˆํ”ผ๊ฐ€ ์žกํ˜€์•ผ 

 

๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€๊ณตํ•  ์ˆ˜ ์žˆ๊ณ  ๊ทธ๋ž˜์•ผ๋งŒ ์–ด๋–ค ๋ชจ๋ธ์— ์–ด๋–ค ์ธ์ฝ”๋”๋ฅผ ์ ์šฉํ•˜๊ณ 

 

์–ด๋–ป๊ฒŒ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ ˆํ•˜๊ณ  ๋“ฑ์˜ ๊ณผ์ •์ด ๊ฒฐ์ •๋˜๋Š” ๋Š๋‚Œ์ด๋‹ค.

 

์ผ๋‹จ์€ ๋„ˆ๋ฌด ๋ถ€๋‹ด๊ฐ–์ง€๋ง๊ณ  ๋ฐฐ์šฐ๊ณ  ์žˆ๋Š” ํŒŒํŠธ์— ์ข€๋” ๋น„์ค‘์„ ๋‘๊ณ  ๊ณต๋ถ€ํ•ด๊ฐ€์ž

 

ํ•  ์ˆ˜ ์žˆ๋‹ค.