Jayden1116 2022. 1. 6. 23:08

1. ํŠน์„ฑ ์ค‘์š”๋„๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์˜ ์žฅ๋‹จ์ ์„ ์„ค๋ช…ํ•˜๊ณ  ๊ฐ๊ฐ ์–ด๋–ค ์ƒํ™ฉ์— ์‚ฌ์šฉํ•˜๋ฉด ์ข‹์„์ง€ ์„ค๋ช…ํ•ด ๋ณด์„ธ์š”.

์—ฌ๊ธฐ๋กœ


2. bagging๊ณผ boosting์˜ ์ฐจ์ด์ ๊ณผ ๊ฐ๊ฐ ์–ด๋–ค ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ข…๋ฅ˜๋“ค์ด ์žˆ๋Š”์ง€ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋ณ„ ์žฅ๋‹จ์ ์„ ์„ค๋ช…ํ•˜๊ณ , ์–ด๋–ค ์ƒํ™ฉ์—์„œ ์‚ฌ์šฉํ•˜๋ฉด ์ข‹์„์ง€ ๋…ผ์˜ํ•ด ๋ณด์„ธ์š”.

  1. bagging vs boosting์˜ ์ฐจ์ด

image

  • ๋ฐฐ๊น… : ๋ณ‘๋ ฌ ํ•™์Šต, ๊ฐ๊ฐ์˜ ํŠธ๋ฆฌ๋“ค์ด ๋…๋ฆฝ์ 
  • ๋ถ€์ŠคํŒ… : ์ˆœ์ฐจ ํ•™์Šต(์ง๋ ฌ), ๋’ค์˜ ํŠธ๋ฆฌ๊ฐ€ ์ด์ „ ํŠธ๋ฆฌ์˜ ์˜ํ–ฅ์„ ๋ฐ›์Œ(์ข…์†)
    • ์˜ค๋‹ต์— ๋Œ€ํ•ด์„œ ๋” ๋†’์€ ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌํ•จ์œผ๋กœ ์จ ์˜ค๋‹ต์— ๋” ์ง‘์ค‘ํ•ฉ๋‹ˆ๋‹ค.
    • ๊ทธ๋งŒํผ ๋ฐฐ๊น…์— ๋น„ํ•ด error๊ฐ€ ์ ๊ณ  ์„ฑ๋Šฅ์ด ์ข‹์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ, ์˜ค๋‹ต์— ๋” ์ง‘์ค‘ํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ์˜ค๋ฒ„ ํ”ผํŒ…๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค.

๋‹จ์ˆœํ•˜๊ฒŒ ์ƒ๊ฐํ•  ์ˆ˜๋Š” ์—†์ง€๋งŒ, ์ผ๋ฐ˜์ ์œผ๋กœ

  • ๊ฐœ๋ณ„ ๊ฒฐ์ • ํŠธ๋ฆฌ(๊ธฐ๋ณธ๋ชจ๋ธ)์˜ ์„ฑ๋Šฅ์ด ๋‚ฎ๋‹ค๋ฉด -> ๋ถ€์ŠคํŒ…์ด ์ ํ•ฉ
  • ๊ฐœ๋ณ„ ๊ฒฐ์ • ํŠธ๋ฆฌ(๊ธฐ๋ณธ๋ชจ๋ธ)์˜ ์„ฑ๋Šฅ์ด ์ ์ ˆํ•˜๊ณ  ๊ณผ์ ํ•ฉ์ด ๋ฌธ์ œ๋ผ๋ฉด -> ๋ฐฐ๊น…์ด ์ ํ•ฉ
    ํ•ฉ๋‹ˆ๋‹ค.
  1. boosting ๊ฐœ๋…

image

  • ๋‹จ์ผ ๋ชจ๋ธ์„ ์ˆœ์ฐจ์ ์œผ๋กœ ํ™œ์šฉ, ์ƒ˜ํ”Œ1 ์ค‘์—์„œ ์ž˜ ๋ถ„๋ฅ˜ํ•˜์ง€ ๋ชปํ•œ ๋ฐ์ดํ„ฐ์— ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌํ•˜์—ฌ ์ƒ˜ํ”Œ2๋กœ ๋„˜๊น๋‹ˆ๋‹ค. ์ด ๋•Œ, ์ƒ˜ํ”Œ1์—์„œ
    ๋ณต์›์ถ”์ถœ๋กœ ์„ ํƒ๋˜์ง€ ๋ชปํ•œ ๋ฐ์ดํ„ฐ ๋˜ํ•œ ๊ฐ€์ค‘์น˜๊ฐ€ ๋ถ€์—ฌ๋˜์–ด ์ƒ˜ํ”Œ2์— ๋ณด๋‚ด์ง‘๋‹ˆ๋‹ค.
  • ์ฆ‰, ๋ถ„๋ฅ˜๊ฐ€ ์ž˜ ์•ˆ๋œ ๋ฐ์ดํ„ฐ์— ๊ฐ€์ค‘์น˜๋ฅผ ์ฃผ๋ฉฐ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ๋งˆ์ง€๋ง‰์— ํ•™์Šต๋œ ๋ชจ๋ธ๋ฟ ์•„๋‹ˆ๋ผ ์ด์ „๊นŒ์ง€ ํ•™์Šต๋œ ๋ชจ๋“  ๋ชจ๋ธ๋“ค์„
    ๊ณ ๋ คํ•ด์„œ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  1. boosting ์ข…๋ฅ˜
  • Adaptive Boosting(Adaboost)

    image

    • ์œ„์˜ ๋ถ€์ŠคํŒ…์˜ ๊ธฐ๋ณธ๊ฐœ๋…(์„ ํƒ๋˜์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ์— ๊ฐ€์ค‘์น˜ ๋ถ€์—ฌ)๋ฅผ ๊ฐ€์ ธ๊ฐ€๋ฉด์„œ ๋™์‹œ์— ๊ฐœ๋ณ„ ๋ชจ๋ธ์—๋„ ๋ณ„๋„๋กœ ๊ฐ€์ค‘์น˜๋ฅผ ์ฃผ๋Š” ๊ฐœ๋…์ด ์ถ”๊ฐ€๋œ ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

    • ์•„๋ž˜ ์‚ฌ์ง„๊ณผ ๊ฐ™์ด (2)๋ฒˆ์‹์—์„œ ์ดํ›„ ์ถ”๊ฐ€๋œ ๊ฐœ๋ณ„๋ชจํ˜•์— ๋Œ€ํ•ด ๊ฐœ๋ณ„์ ์ธ ๊ฐ€์ค‘์น˜๊ฐ€ ๊ณฑํ•ด์ง€๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

      image

  • Gradient Boosting(GBM ; M์€ Model)

    • ์˜ˆ์ธก์— ๋Œ€ํ•œ loss function์— ๋ฏธ๋ถ„์„ ํ†ตํ•ด gradient๋ฅผ ๊ตฌํ•ฉ๋‹ˆ๋‹ค.(์ž”์ฐจ) ์ด ๊ฐ’์„ ์ „๋‹ฌํ•˜์—ฌ ์˜ค์ฐจ๋ฅผ ์ค„์ด๋Š” ํ•™์Šต ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.
    • ์„ฑ๋Šฅ์€ ์ „๋ฐ˜์ ์œผ๋กœ ๊ดœ์ฐฎ์ง€๋งŒ ๊ณผ์ ํ•ฉ์ด ์ž˜๋˜๊ณ  ์†๋„๊ฐ€ ๋‹ค์†Œ ๋Š๋ฆฌ๋‹ค๋Š” ๋‹จ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
    • ์•„๋ž˜์˜ ๋ชจ๋ธ๋“ค์€ ์ด๋Ÿฐ GBM์˜ ๋‹จ์ ์„ ๋ณด์™„ํ•œ ๋ชจ๋ธ๋“ค๋กœ ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ๋ชจ๋ธ๋“ค์ž…๋‹ˆ๋‹ค.
  • eXtreme Gradient Boosting(XGBoost)

    • ๋ณ‘๋ ฌ์ฒ˜๋ฆฌ๋ฅผ ํ†ตํ•œ ๋น ๋ฅธ ํ•™์Šต, ์œ ์—ฐํ•œ learning system, overfitting ๋ฐฉ์ง€, ๋‹ค์–‘ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค์— ๋Œ€ํ•œ ํ™•์žฅ์„ฑ
  • LightGBM

    • XGBoost์˜ ํšจ์œจ์„ฑ ๋ฌธ์ œ๋ฅผ ๋ณด์™„ํ•˜์—ฌ ๋“ฑ์žฅํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹ค.
    • ๊ธฐ์กด ํšจ์œจ์„ฑ ์ •ํ™•๋„์˜ trade-off๋ฅผ ํ•ด๊ฒฐํ–ˆ๋‹ค๋Š” ์ ์ด ํฐ ์žฅ์ ์ด๋ฉฐ, ๊ธฐ์กด ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์ •ํ™•๋„๋ฅผ ์œ ์ง€ํ•˜๋ฉด์„œ ํ›จ์”ฌ ์ข‹์€ ํšจ์œจ์„ฑ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
    • ๋ฐ์ดํ„ฐ์…‹์ด ๋งŽ์ง€ ์•Š์„ ๊ฒฝ์šฐ, LightGBM์ด ๋” ๊ณผ์ ํ•ฉ ๋ฐœ์ƒ์ด ์‰ฝ๋‹ค๋Š” ๋‹จ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • Categorical Boosting(Catboost)

    • ์ƒ๋Œ€์ ์œผ๋กœ ์ตœ๊ทผ์— ๊ตฌํ˜„๋œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š”๋ฐ ์œ ์šฉํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹ค.

bagging๊ณผ boosting์€ ์ดํ•ดํ–ˆ๋Š”๋ฐ, ๋ถ€์ŠคํŒ… ๋‚ด์—์„œ ์—ฌ๋Ÿฌ ๋ชจ๋ธ์˜ ์ •ํ™•ํ•œ ์ฐจ์ด๋ฅผ ์•Œ๊ณ ์‹ถ์–ด ์ •๋ฆฌ๋ฅผ ์‹œ์ž‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ, XGB, LightGBM, CatB ๋‚ด์šฉ์ด ์ƒ๊ฐ๋ณด๋‹ค ๋งŒ๋งŒ์น˜ ์•Š์•„ ๋”ฐ๋กœ ์•„๋ž˜์˜ ์ฐธ๊ณ  ๋‚ด์šฉ ๋ณด์‹œ๋ฉด ๋„์›€๋˜์‹ค ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์ด์ƒ์ž…๋‹ˆ๋‹ค. ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. :)

๋” ์ž์„ธํ•œ ๋‚ด์šฉ ์ฐธ๊ณ