ํํํ ๋ณต์ตํ๋ค๊ณ ์๊ฐํ๋๋ฐ
์ง๊ด์ ์ผ๋ก ์ฝ๊ฒ ์ค๋ช ์ด ์๋๋ ๊ฐ๋ ๋ค์ด ์๊ทผ ์๋ค.
Sprint1 ์ฒดํฌํ ๊ฒ
- EDA : ์์น(Statistics)์ ๊ทธ๋ฆผ(์๊ฐํ)๋ฅผ ๊ผญ ๊ฐ์ด ๋ณด๋ฉด์ ๋ฐ์ดํฐ ํ์ธํ ๊ฒ
- Feature engineering
- Data manipulation
- Basic Derivative(๋ฏธ๋ถ) : ๋ชจ๋ธ์ด cost function์ ์ต์๊ฐ์ ์ฐพ์ ๋ ์ฌ์ฉ(๋ํจ์=0)
Sprint2 ์ฒดํฌํ ๊ฒ
- ๊ฐ์ค๊ฒ์ : ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด์ ๊ฒ์ ์งํ -> ๋จ, ๋ฐ์ดํฐ๋ sample์ ์ฆ, ๊ฐ์ค๊ฒ์ ์ 'sample์ด population์ ๋๋ณํ ์ ์๋๋'๋ฅผ ๋ณด๋ ๊ฒ
- P-value
- ์ ๋ขฐ๊ตฌ๊ฐ(Confident Interval)
- ๋ฒ ์ด์ง์ : ์ฌ์ ๊ฐ์ค์ ๋ฐ์ดํฐ(๊ด์ธก์น)๋ฅผ ํตํด ์ฌํ๊ฐ์ค๋ก ์ ๋ฐ์ดํธ
Sprint3 ์ฒดํฌํ ๊ฒ
- ๋ฒกํฐ์ ๋ฉํธ๋ฆญ์ค
- ์ ํ๋์ : Variance, Covariance(๊ณต๋ถ์ฐ), Correlation coefficient(์๊ด๊ณ์)
- PCA
- ํด๋ฌ์คํฐ๋ง
'๐ฟ Data > ๋ถํธ์บ ํ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[TIL]23.Simple Regression(๋จ์ํ๊ท) (0) | 2021.12.18 |
---|---|
[TIL]22.Section Challenge ๋ฐ ๋ณต์ต (0) | 2021.12.17 |
[TIL]15.์ค์ฑ3 (0) | 2021.12.08 |
[TIL]14.Clustering(๊ตฐ์งํ) (0) | 2021.12.07 |
[TIL]13.High Dimensional Data (0) | 2021.12.05 |