confusion matrix, classification report ๋ฑ์ ๊ทธ๋ ค ๋ณด์๊ณ , ๊ฐ ํ๊ฐ์งํ๋ค์ ๋ํด ์ต๋ํ ๋ถ์ํ๊ณ ๋ฌด์์ด ๋ถ์กฑํ์ง ์ด๋ค ๋ฐฉํฅ์ผ๋ก ์ฑ๋ฅ์ ๋์ฌ์ผ ํ ์ง ๋ ผ์ํด ๋ณด์ธ์.
๋ถ๋ฅ ๋ฌธ์ ์ ํ๊ฐ ์งํ
- accuracy(์ ํ๋)
- f1_score
- precision(์ ๋ฐ๋)
- recall(์ฌํ์จ ; sensitivity)
- ROC curve ๋ฐ AUC score
- accuracy(์ ํ๋)
- f1_score
- precision ๋ฐ recall - classification_report
- train set
- val set
- confusion matrix
- train set
- val set
- ROC curve ๋ฐ AUC
- train set
- val set
- train set vs val set
- ๋น์ฐํ ๊ฒฐ๊ณผ๊ฒ ์ง๋ง, ์ฌ๋ฌ์งํ์์ train set๊ณผ val set์ ๋ํ ๊ฒฐ๊ณผ๊ฐ ๋ง์ด ์ฐจ์ด๋๋ ๊ฒ์ ํ์ธํ์์ต๋๋ค.
- ๋ํ train set์ ํตํด ๊ณผ์ ํฉ ์, ํ๊ฐ์งํ๊ฐ ์ด๋ป๊ฒ ๋์ค๊ณ ROC curve๊ฐ ์ด๋ป๊ฒ ๊ทธ๋ ค์ง๋์ง ํ์ธํด๋ณผ ์ ์์์ต๋๋ค.
- ์ฐ๋ฆฌ๊ฐ ๋ ์ค์์ ์ฌ๊ฒจ์ผ ํ ๊ฐ : FP(precision)
- ๋ฌธ์ : ๋ฐฑ์ ์ ๋ง์๊น ์๋ง์๊น?
- '์์ : ๋ฐฑ์ ์ ์๋ง์ ๊ฒ, ์ค์ : ๋ฐฑ์ ์ ๋ง์ -> FN'๋ณด๋ค
'์์ : ๋ฐฑ์ ์ ๋ง์ ๊ฒ, ์ค์ : ๋ฐฑ์ ์ ์๋ง์ -> FP'๊ฐ ๋ ์น๋ช ์ ์ธ ๋ฌธ์ ์ด๋ฏ๋ก precision์ ์ด์ ์ ๋ง์ถฐ์ ๋ด์ผํ ๊ฒ ๊ฐ์ต๋๋ค.
- train set์์ True ๊ฐ๋ค ๋น๊ต
- ๋ฐฑ์ ์ ๋ง์(1) : 66 + 7978 = 8044
- ๋ฐฑ์ ์ ์๋ง์(0) : 25636 + 43 = 25679
- 8044 / 25679 * 100 = 31.33(%) ์ฆ, ๋ฐฑ์ ์ ๋ง์ ์ฌ๋์ ๋ฐ์ดํฐ๊ฐ ์๋ง์ ์ฌ๋์ ๋ฐ์ดํฐ๋ณด๋ค ๋ค์ ๋ง์ ๊ฒฝํฅ์ด ์์ต๋๋ค.
- ๋ฐ๋ผ์ accuracy๋ง์ผ๋ก ํ๋จํด์๋ ์๋๊ณ (๊ธฐ์ค๋ชจ๋ธ์ด 90%๋ผ๊ณ ํด์ ์ฑ๋ฅ์ด ์ข์ ๊ฒ ์๋๋ฏ) ๋ค๋ฅธ ์งํ๋ค๋ ํจ๊ป ๋ณด๊ณ ๋ฐ์ดํฐ์ ๋ํ ๊ฐ์ค์ ๋ค๋ฅด๊ฒ ํด์ผํ ๊ฒ ๊ฐ์ต๋๋ค.
๋ชจ๋ธ์ ordinalencoder, simpleImputer, randomforestclassifier๋ก ๊ธฐ๋ณธ ์ธํ ์ผ๋ก ํ์ต๋๋ค.
์ด์์ ๋๋ค. ๊ฐ์ฌํฉ๋๋ค.
'๐ฟ Data > ์ด๋ชจ์ ๋ชจ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋ฐ์ดํฐ ์ง๋ฌด ๊ฐ๋จ ์ ๋ฆฌ(๋น ๋ฐ์ดํฐ ์ปค๋ฆฌ์ด ๊ฐ์ด๋๋ถ ์ฐธ๊ณ ) (0) | 2022.01.02 |
---|---|
HyperParameter tuning (0) | 2022.01.01 |
category_encoders(TargetEncoder, CatBoostEncoder) ๊ทธ๋ฆฌ๊ณ Ordinal๊ณผ OneHot encoder (0) | 2021.12.28 |
์๊ฐํ๋ฅผ ํตํด ํ์ธํ Imputer์ ์ฐจ์ด (0) | 2021.12.26 |
Ridge regression, ๋ชจ๋ธ ์ฑ๊ณผ ํ๊ฐ ์งํ, OneHotencoding, feature selection (0) | 2021.12.23 |