๐ฟ Data/๋ถํธ์บ ํ
[TIL]21.Session ๋ณต์ต
Jayden1116
2021. 12. 16. 00:32
ํํํ ๋ณต์ตํ๋ค๊ณ ์๊ฐํ๋๋ฐ
์ง๊ด์ ์ผ๋ก ์ฝ๊ฒ ์ค๋ช ์ด ์๋๋ ๊ฐ๋ ๋ค์ด ์๊ทผ ์๋ค.
Sprint1 ์ฒดํฌํ ๊ฒ
- EDA : ์์น(Statistics)์ ๊ทธ๋ฆผ(์๊ฐํ)๋ฅผ ๊ผญ ๊ฐ์ด ๋ณด๋ฉด์ ๋ฐ์ดํฐ ํ์ธํ ๊ฒ
- Feature engineering
- Data manipulation
- Basic Derivative(๋ฏธ๋ถ) : ๋ชจ๋ธ์ด cost function์ ์ต์๊ฐ์ ์ฐพ์ ๋ ์ฌ์ฉ(๋ํจ์=0)
Sprint2 ์ฒดํฌํ ๊ฒ
- ๊ฐ์ค๊ฒ์ : ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด์ ๊ฒ์ ์งํ -> ๋จ, ๋ฐ์ดํฐ๋ sample์ ์ฆ, ๊ฐ์ค๊ฒ์ ์ 'sample์ด population์ ๋๋ณํ ์ ์๋๋'๋ฅผ ๋ณด๋ ๊ฒ
- P-value
- ์ ๋ขฐ๊ตฌ๊ฐ(Confident Interval)
- ๋ฒ ์ด์ง์ : ์ฌ์ ๊ฐ์ค์ ๋ฐ์ดํฐ(๊ด์ธก์น)๋ฅผ ํตํด ์ฌํ๊ฐ์ค๋ก ์ ๋ฐ์ดํธ
Sprint3 ์ฒดํฌํ ๊ฒ
- ๋ฒกํฐ์ ๋ฉํธ๋ฆญ์ค
- ์ ํ๋์ : Variance, Covariance(๊ณต๋ถ์ฐ), Correlation coefficient(์๊ด๊ณ์)
- PCA
- ํด๋ฌ์คํฐ๋ง