๐Ÿ’ฟ Data

    [TIL]73. ๋” ๋‚˜์€ ์‹ ๊ฒฝ๋ง ํ•™์Šต์„ ์œ„ํ•œ ๋ฐฉ๋ฒ•

    ํ‚ค์›Œ๋“œ ํ•™์Šต๋ฅ  ๊ฐ€์ค‘์น˜ ์ดˆ๊ธฐํ™” ๊ณผ์ ํ•ฉ ๋ฐฉ์ง€(๊ฐ€์ค‘์น˜ ๊ฐ์†Œ, ๋“œ๋กญ์•„์›ƒ, ์–ผ๋ฆฌ์Šคํƒ€ํ•‘) ํ•™์Šต๋ฅ  ๊ฐ์†Œ/๊ณ„ํš๋ฒ•(Learning rate Decay/Scheduling) ํ•™์Šต๋ฅ (Learning rate) : ๋งค ๊ฐ€์ค‘์น˜์— ๋Œ€ํ•ด ๊ตฌํ•ด์ง„ ๊ธฐ์šธ๊ธฐ ๊ฐ’์„ ์–ผ๋งˆ๋‚˜ ์ ์šฉํ• ์ง€๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ์œ„์—์„œ ๋ณด๋Š” ๊ฒƒ๊ณผ ๊ฐ™์ด ํ•™์Šต๋ฅ ์€ ๊ฐ€์ค‘์น˜๋ฅผ ๊ฐฑ์‹ ํ•˜๋Š” ๊ณผ์ •(๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•)์—์„œ ํ•ด๋‹น ์ง€์ ์˜ ๊ธฐ์šธ๊ธฐ๋ฅผ ์–ผ๋งˆ๋‚˜ ๋ฐ˜์˜ํ• ์ง€๋ฅผ ์ •ํ•ด์ฃผ๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ์ž…๋‹ˆ๋‹ค. ํ•™์Šต๋ฅ ์ด ๋„ˆ๋ฌด ๋‚ฎ์€ ๊ฒฝ์šฐ : ์‹œ๊ฐ„์ด ๋„ˆ๋ฌด ์˜ค๋ž˜ ๊ฑธ๋ฆฌ๊ฑฐ๋‚˜ ๋๋‚ด ์ตœ์ ์ ์— ๋„๋‹ฌํ•˜์ง€ ๋ชปํ•˜๊ฒŒ ๋จ ํ•™์Šต๋ฅ ์ด ๋„ˆ๋ฌด ๋†’์€ ๊ฒฝ์šฐ : ์ตœ์ ์ ์„ ์ง€๋‚˜์ณ ๋ฐœ์‚ฐํ•˜๊ฒŒ ๋  ๊ฐ€๋Šฅ์„ฑ ์กด์žฌ ์œ„์™€ ๊ฐ™์€ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•๋“ค์ด ์กด์žฌ ํ•™์Šต๋ฅ  ๊ฐ์†Œ(Learning rate Decay) ์—ฌ๋Ÿฌ ์˜ตํ‹ฐ๋งˆ์ด์ €(Adagrad, RMSprop, ..

    [๋”ฅ๋Ÿฌ๋‹]์˜ตํ‹ฐ๋งˆ์ด์ €(Optimizer)

    Optimizer๋ž€ ํ˜น์‹œ ์…ฐ๋ฅดํŒŒ๋ผ๊ณ  ์•„์‹œ๋‚˜์š”? ์…ฐ๋ฅดํŒŒ๋Š” ํ‹ฐ๋ฒ ํŠธ์–ธ์–ด๋กœ, '์ผ๋กœ์„œ ๋“ฑ๋ฐ˜์„ ๋•๋Š” ์‚ฌ๋žŒ' ์ด๋ผ๋Š” ์˜๋ฏธ๋กœ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ ์šฐ๋ฆฌ๋‚˜๋ผ ์‚ฐ์ด ์•„๋‹Œ, ์ •๋ง ํ—˜๋‚œํ•œ ์‚ฐ์„ ๋“ฑ๋ฐ˜ํ•ด์•ผํ•œ๋‹ค๋ฉด ์šฐ๋ฆฌ๋Š” ์ ๋‹นํ•œ ๊ธธ์žก์ด๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ฒ ์ด์Šค์บ ํ”„๊ฐ€ ์–ด๋””์žˆ๋Š”์ง€๋ถ€ํ„ฐ, ํ•˜๋ฃจ์— ๋ช‡ํ‚ค๋กœ๋ฅผ ๊ฐ€๋Š” ๊ฒŒ ์ข‹์„์ง€, ๊ตฌ์„ฑ์›์— ๋”ฐ๋ผ ์ฒด๋ ฅ์•ˆ๋ฐฐ๋Š” ์–ด๋–ป๊ฒŒ ํ• ์ง€ ๋“ฑ๋“ฑ์„ ๊ฐ€์ด๋“œํ•ด์ค„ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ๋ง์ด์ฃ . ๋“ฑ๋ฐ˜๋ณด๋‹จ ํ•˜์‚ฐ์— ์ข€๋” ๊ฐ€๊นŒ์šด ๋Š๋‚Œ์ด์ง€๋งŒ, ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ์ €ํฌ๊ฐ€ ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•์„ ํ†ตํ•ด ์ตœ์ ์ ์„ ์ฐพ์•„๊ฐ€๋Š” ๊ณผ์ •์—์„œ ์…ฐ๋ฅดํŒŒ์˜ ์—ญํ• ์„ ํ•˜๋Š” ๊ฒƒ์ด ์˜ตํ‹ฐ๋งˆ์ด์ €์™€ ๋‹ฎ์•„์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ธธ์žก์ด๋งˆ๋‹ค ์กฐ๊ธˆ์”ฉ์€ ๋‹ค๋ฅธ ์กฐ๊ฑด์œผ๋กœ ๊ธธ์„ ๊ฐ€๋ฅด์ณ์ฃผ๊ณ , ๊ธธ์žก์ด์— ๋”ฐ๋ผ ์‚ฐ์„ ๋ฌด์‚ฌํžˆ ๋“ฑ๋ฐ˜ํ•  ์ˆ˜๋„ ์žˆ๊ณ  ๊ทธ๋ ‡์ง€ ๋ชปํ•  ์ˆ˜๋„ ์žˆ๋Š” ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. Optimizer ์ข…๋ฅ˜ GD(Gradient Des..

    [TIL]72. ์‹ ๊ฒฝ๋ง ํ•™์Šต

    ํ‚ค์›Œ๋“œ ์‹ ๊ฒฝ๋ง ํ•™์Šต ๋ฉ”์ปค๋‹ˆ์ฆ˜(์ˆœ์ „ํŒŒ, ์†์‹ค ๊ณ„์‚ฐ, ์—ญ์ „ํŒŒ) ๊ฒฝ์‚ฌ ํ•˜๊ฐ•๋ฒ•(Gradient Descent ; GD) : ๊ฐ€์ค‘์น˜๊ฐ€ ๊ฐฑ์‹ ๋˜๋Š” ๊ณผ์ • ์˜ตํ‹ฐ๋งˆ์ด์ €(Optimizer)์˜ ๊ฐœ๋… ์‹ ๊ฒฝ๋ง ํ•™์Šต ๋ฐ์ดํ„ฐ ์ž…๋ ฅ ๋ฐ ์‹ ๊ฒฝ๋ง ๊ฐ ์ธต์—์„œ ๊ฐ€์ค‘์น˜ ๋ฐ ํ™œ์„ฑํ™” ํ•จ์ˆ˜ ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ ๋ชจ๋“  ์ธต์—์„œ 1์˜ ๊ณผ์ •์„ ์ง„ํ–‰ ํ›„ ๋งˆ์ง€๋ง‰ ์ถœ๋ ฅ์ธต์—์„œ ๊ฐ’์„ ์ถœ๋ ฅ(์ถœ๋ ฅ๊ฐ’) ์†์‹ค ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ์˜ˆ์ธก๊ฐ’(prediction)๊ณผ ์‹ค์ œ๊ฐ’(target)์˜ ์ฐจ์ด๋ฅผ ๊ณ„์‚ฐ ๊ฒฝ์‚ฌํ•˜๊ฐ•๋ฒ•๊ณผ ์—ญ์ „ํŒŒ๋ฅผ ํ†ตํ•ด ๊ฐ ๊ฐ€์ค‘์น˜๋ฅผ ์ƒˆ๋กญ๊ฒŒ ๊ฐฑ์‹  ์–ด๋–ค ํ•™์Šต ์ค‘์ง€ ๊ธฐ์ค€์„ ๋งŒ์กฑํ•  ๋•Œ๊นŒ์ง€ 1-4์˜ ๊ณผ์ •์„ ๋ฐ˜๋ณต Iteration : 1-4์˜ ๊ณผ์ •์„ ๋งํ•˜๋ฉฐ ๋งค Iteration๋งˆ๋‹ค ๊ฐ€์ค‘์น˜๊ฐ€ ๊ฐฑ์‹ ๋จ 1๋ฒˆ์˜ Iteration์—๋Š” ์ˆœ์ „ํŒŒ ๊ณผ์ •(1-2), ์†์‹ค๊ณ„์‚ฐ ๊ณผ์ •(3), ์—ญ์ „ํŒŒ ๊ณผ์ •(4)์œผ๋กœ ํฌ๊ฒŒ ..

    [๋”ฅ๋Ÿฌ๋‹]์†์‹ค ํ•จ์ˆ˜

    ์†์‹ค ํ•จ์ˆ˜๋ž€ ์†์‹ค ํ•จ์ˆ˜ = ๋น„์šฉ ํ•จ์ˆ˜(cost function ; cost) ์ž…๋ ฅ๊ฐ’(x)๋ฅผ F(w)๋ผ๋Š” ๋ชจ๋ธ์— ํ†ต๊ณผ์‹œ์ผฐ์„ ๋•Œ ๋‚˜์˜ค๋Š” ๊ฐ’์€ ์ถœ๋ ฅ๊ฐ’(y_pred; ์˜ˆ์ธก๊ฐ’)์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์˜ ์ตœ์ข… ๋ชฉ์ ์€ ์‹ค์ œ๊ฐ’(y_true; ์ฐธ๊ฐ’, ๊ด€์ธก๊ฐ’)์— ์ตœ๋Œ€ํ•œ ๊ฐ€๊นŒ์šด ์˜ˆ์ธก๊ฐ’์„ ์–ป๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ๋•Œ, ์˜ˆ์ธก๊ฐ’๊ณผ ์‹ค์ œ๊ฐ’์˜ ์ฐจ์ด๋ฅผ ํ™•์ธํ•˜๋Š” ํ•จ์ˆ˜๊ฐ€ ์†์‹คํ•จ์ˆ˜ ์ž…๋‹ˆ๋‹ค. ๋‹ค์‹œ ๋งํ•ด, ์šฐ๋ฆฌ๊ฐ€ ์„ค๊ณ„ํ•œ ๋ชจ๋ธ์ด ์ž…๋ ฅ๊ฐ’์„ ํ† ๋Œ€๋กœ ์–ผ๋งˆ๋‚˜ ์ž˜ ๋งž์ถ”์—ˆ๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ง€ํ‘œ๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์šด๋™์—๋Š” ์šด๋™๋งˆ๋‹ค ๋‹ค๋ฅธ ๊ทœ์น™์ด ์ ์šฉ๋˜๋“ฏ, ์šฐ๋ฆฌ๊ฐ€ ์„ค๊ณ„ํ•œ ๋ชจ๋ธ(์ •ํ™•ํžˆ๋Š” ์šฐ๋ฆฌ๊ฐ€ ํ’€๊ณ ์ž ํ•˜๋Š” ๋ฌธ์ œ์˜ ์ข…๋ฅ˜)์— ๋”ฐ๋ผ ๋‹ค์–‘ํ•œ ์†์‹คํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์†์‹ค ํ•จ์ˆ˜์˜ ์ข…๋ฅ˜ ์šฐ๋ฆฌ๊ฐ€ ๋‹ค๋ฃจ๊ฒŒ ๋  ๋ฌธ์ œ๋Š” ํฌ๊ฒŒ 3๊ฐ€์ง€๋กœ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 1) ํšŒ๊ท€, 2) ์ด์ง„ ๋ถ„๋ฅ˜, 3) ๋‹ค์ค‘ ๋ถ„..

    [๋”ฅ๋Ÿฌ๋‹]์—ญ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜

    ์—ญ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ €ํฌ๊ฐ€ ์ฐจ๋ฅผ ๊ตฌ๋งคํ•˜๊ฒŒ ๋˜๋ฉด, ์ ๋‹นํ•œ ์„ธํŒ… ํ›„ ์ฐจ๋Ÿ‰์„ ์šด์ „ํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ ์‹œํŠธ ๋†’์ด, ํ•ธ๋“ค๊ณผ์˜ ๊ฑฐ๋ฆฌ, ๋ฐฑ๋ฏธ๋Ÿฌ ์œ„์น˜, ์‚ฌ์ด๋“œ ๋ฏธ๋Ÿฌ ์œ„์น˜ ๋“ฑ์„ ์กฐ์ ˆํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ฒ˜์Œ๋ถ€ํ„ฐ ๋ณธ์ธ์—๊ฒŒ ์ตœ์ ํ™” ๋œ ์„ธํŒ…์€ ํ•œ๋ฒˆ์— ์ด๋ฃจ์–ด์งˆ ์ˆ˜ ์—†๊ธฐ์—, ์‹œ๊ฐ„์ด ํ๋ฅด๋ฉฐ ์šด์ „์„ ์ง„ํ–‰ํ• ์ˆ˜๋ก ๋‚˜์—๊ฒŒ ๋งž๊ฒŒ ์กฐ๊ธˆ์”ฉ ์„ธํŒ…์„ ์ˆ˜์ • ๋ฐ˜๋ณตํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค. ์ˆœ์ „ํŒŒ : ์ ๋‹นํ•œ ์„ธํŒ…์„ ํ†ตํ•ด ์šด์ „ํ•˜๋Š” ํ–‰์œ„ ์†์‹ค ๊ณ„์‚ฐ : '์ด ์„ธํŒ…์€ ์กฐ๊ธˆ ๋ถˆํŽธํ•œ๋ฐ? ์–ผ๋งˆ๋‚˜ ์กฐ์ •ํ• ๊นŒ?' ํ•˜๋Š” ์ƒ๊ฐ ์—ญ์ „ํŒŒ : ๋ถˆํŽธํ•œ ์„ธํŒ…์— ๋Œ€ํ•ด์„œ ์กฐ๊ธˆ์”ฉ ์กฐ์ •ํ•˜๋Š” ํ–‰์œ„ ์ถ”๊ฐ€) ์„ธํŒ…์„ ์กฐ์ •ํ•  ๋•Œ(์˜์ž ๋†’์ด๋ฅผ ์กฐ์ •ํ•œ๋‹ค ํ•  ๋•Œ), ํ•œ๋ฒˆ์— 10cm๋ฅผ ๋‚ฎ์ถ”๋Š” ๊ฒฝ์šฐ๋„ ์žˆ๊ณ  ์•„์ฃผ ์กฐ๊ธˆ์”ฉ 1cm์”ฉ ๋‚ฎ์ถ”๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ๋“ฏ์ด ์„ธํŒ…์„ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋‹ค์–‘ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฐ ์„ธํŒ…์„ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์˜ตํ‹ฐ๋งˆ์ด์ €์˜..