๐Ÿ’ฟ Data/๋ถ€ํŠธ์บ ํ”„

[TIL]21.Session ๋ณต์Šต

Jayden1116 2021. 12. 16. 00:32

ํ‹ˆํ‹ˆํžˆ ๋ณต์Šตํ–ˆ๋‹ค๊ณ  ์ƒ๊ฐํ–ˆ๋Š”๋ฐ

์ง๊ด€์ ์œผ๋กœ ์‰ฝ๊ฒŒ ์„ค๋ช…์ด ์•ˆ๋˜๋Š” ๊ฐœ๋…๋“ค์ด ์€๊ทผ ์žˆ๋‹ค.

Sprint1 ์ฒดํฌํ•  ๊ฒƒ

  • EDA : ์ˆ˜์น˜(Statistics)์™€ ๊ทธ๋ฆผ(์‹œ๊ฐํ™”)๋ฅผ ๊ผญ ๊ฐ™์ด ๋ณด๋ฉด์„œ ๋ฐ์ดํ„ฐ ํ™•์ธํ•  ๊ฒƒ
  • Feature engineering
  • Data manipulation
  • Basic Derivative(๋ฏธ๋ถ„) : ๋ชจ๋ธ์ด cost function์˜ ์ตœ์†Ÿ๊ฐ’์„ ์ฐพ์„ ๋•Œ ์‚ฌ์šฉ(๋„ํ•จ์ˆ˜=0)

Sprint2 ์ฒดํฌํ•  ๊ฒƒ

  • ๊ฐ€์„ค๊ฒ€์ • : ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•ด์„œ ๊ฒ€์ • ์ง„ํ–‰ -> ๋‹จ, ๋ฐ์ดํ„ฐ๋Š” sample์ž„ ์ฆ‰, ๊ฐ€์„ค๊ฒ€์ •์€ 'sample์ด population์„ ๋Œ€๋ณ€ํ•  ์ˆ˜ ์žˆ๋А๋ƒ'๋ฅผ ๋ณด๋Š” ๊ฒƒ
  • P-value
  • ์‹ ๋ขฐ๊ตฌ๊ฐ„(Confident Interval)
  • ๋ฒ ์ด์ง€์•ˆ : ์‚ฌ์ „๊ฐ€์„ค์„ ๋ฐ์ดํ„ฐ(๊ด€์ธก์น˜)๋ฅผ ํ†ตํ•ด ์‚ฌํ›„๊ฐ€์„ค๋กœ ์—…๋ฐ์ดํŠธ

Sprint3 ์ฒดํฌํ•  ๊ฒƒ

  • ๋ฒกํ„ฐ์™€ ๋ฉ”ํŠธ๋ฆญ์Šค
  • ์„ ํ˜•๋Œ€์ˆ˜ : Variance, Covariance(๊ณต๋ถ„์‚ฐ), Correlation coefficient(์ƒ๊ด€๊ณ„์ˆ˜)
  • PCA
  • ํด๋Ÿฌ์Šคํ„ฐ๋ง