๐ฟ Data/์ด๋ชจ์ ๋ชจ
SQL_SELECT์ ์คํ ์์
SELECT๋ฌธ์ ๋ฐ์ดํฐ๋ฅผ ์กฐํํ๋ ์ฟผ๋ฆฌ๋ฌธ์ ์ฌ์ฉ ์ฟผ๋ฆฌ๋ฌธ์ด ์ ํ ์์๊ฐ ์๋ ์ ํด์ง ์์๋๋ก ์๋ ์คํ ์์ FROM WHERE GROUP BY HAVING SELECT ORDER BY ์์) SELECT CustomerId, AVG(Total) FROM invoices WHERE CustomerId >= 10 GROUP BY CustomerId HAVING SUM(Total) >= 30 ORDER BY 2 ์์ ์คํ ์์ FROM invoices: ๋จผ์ invoices ํ ์ด๋ธ์ ์ ๊ทผ์ ํฉ๋๋ค. WHERE CustomerId >= 10: 'CustomerId' ํ๋๊ฐ 10 ์ด์์ธ ๋ ์ฝ๋๋ค์ ์กฐํํฉ๋๋ค. GROUP BY CustomerId: 'CustomerId' ๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ทธ..
SQL_SQLite ์์ฃผ ์ฐ๋ ๋ฌธ๋ฒ(2)
์ฌ์ฉ๋๋ ์์๋ค์ ๋ฐ๋ก ๋ช ์๋์ง ์๋ ํ chinook(SQLite training ์์ ๋ฐ์ดํฐ๋ฒ ์ด์ค) ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ๊ธฐ์ค์ผ๋ก ์ฌ์ฉํฉ๋๋ค. SQL ๋ด์ฅํจ์ ์งํฉ์ฐ์ฐ ๋ ์ฝ๋๋ค์ ์กฐํํ๊ณ ๋ถ๋ฅํ ๋ค์ ํน์ ์์ ์ ํ๋ ๋ฑ์ ์งํฉ์ฐ์ฐ GROUP BY ๋ฐ์ดํฐ๋ฅผ ์กฐํํ ๋, ๊ธฐ์ค์ผ๋ก ๋ฌถ์ด์ ์กฐํํ๊ฒ ํด์ฃผ๋ ๊ธฐ๋ฅ SELECT State, COUNT(*) # ๊ฐ State๋ง๋ค ๊ฐฏ์๋ฅผ ์ธ์ด ์ค๋๋ค.(State๋ง๋ค ๋ฌถ์์ด ํ์ฑ๋์ด์์ผ๋) FROM customers GROUP BY State; HAVING GROUP BY๋ก ์กฐํ๋ ๊ฒฐ๊ณผ์ ํํฐ๋ฅผ ์ ์ฉ SELECT State, COUNT(*) FROM customers GROUP BY State HAVING COUNT(*) >= 3 ์ฌ๊ธฐ์ TIP WHERE์ HAVING์ ..
SQL_SQLite ์์ฃผ ์ฐ๋ ๋ฌธ๋ฒ
SELECT : ๋ฐ์ดํฐ์ ์ ํฌํจ๋ ํน์ฑ ๊ณ ๋ฅด๊ธฐ SELECT 'hello world'; SELECT 2; SELECT 15 + 3;FROM : ํ ์ด๋ธ๊ณผ ๊ด๋ จ์ด ์๋ ๊ฒฝ์ฐ ํ์๋ก ๋ช ์ํด์ผํ๋ ๋ช ๋ น์ด, ๊ฒฐ๊ณผ๋ค์ ๋์ถํด๋ผ ๋ฐ์ดํฐ๋ฒ ์ด์ค ํ ์ด๋ธ ๋ช ์ SELECT ํน์ฑ_1, ํน์ฑ_2 FROM ํ ์ด๋ธ_์ด๋ฆ; -- ์์ SELECT customers.FirstName, customers.LastName FROM customers; SELECT * FROM ํ ์ด๋ธ_์ด๋ฆ; -- ์์ SELECT * # *๋ ์์ผ๋์นด๋(wildcard)๋ก ์ ๋ถ ์ ํํ ๋ ์ฌ์ฉ FROM customers;WHERE : ์ ํ์ ์ผ๋ก ํํฐ ์ญํ ์ ํ๋ ์ฟผ๋ฆฌ๋ฌธ # ํน์ ๊ฐ๊ณผ ๋์ผํ ๋ฐ์ดํฐ ์ฐพ๊ธฐ SELECT ํน์ฑ_1, ํน์ฑ_2 FROM ..
Boosting(vs bagging)
1. ํน์ฑ ์ค์๋๋ฅผ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ์ ์ฅ๋จ์ ์ ์ค๋ช ํ๊ณ ๊ฐ๊ฐ ์ด๋ค ์ํฉ์ ์ฌ์ฉํ๋ฉด ์ข์์ง ์ค๋ช ํด ๋ณด์ธ์. ์ฌ๊ธฐ๋ก 2. bagging๊ณผ boosting์ ์ฐจ์ด์ ๊ณผ ๊ฐ๊ฐ ์ด๋ค ์๊ณ ๋ฆฌ์ฆ ์ข ๋ฅ๋ค์ด ์๋์ง ์๊ณ ๋ฆฌ์ฆ๋ณ ์ฅ๋จ์ ์ ์ค๋ช ํ๊ณ , ์ด๋ค ์ํฉ์์ ์ฌ์ฉํ๋ฉด ์ข์์ง ๋ ผ์ํด ๋ณด์ธ์. bagging vs boosting์ ์ฐจ์ด ๋ฐฐ๊น : ๋ณ๋ ฌ ํ์ต, ๊ฐ๊ฐ์ ํธ๋ฆฌ๋ค์ด ๋ ๋ฆฝ์ ๋ถ์คํ : ์์ฐจ ํ์ต(์ง๋ ฌ), ๋ค์ ํธ๋ฆฌ๊ฐ ์ด์ ํธ๋ฆฌ์ ์ํฅ์ ๋ฐ์(์ข ์) ์ค๋ต์ ๋ํด์ ๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํจ์ผ๋ก ์จ ์ค๋ต์ ๋ ์ง์คํฉ๋๋ค. ๊ทธ๋งํผ ๋ฐฐ๊น ์ ๋นํด error๊ฐ ์ ๊ณ ์ฑ๋ฅ์ด ์ข์ต๋๋ค. ๋ค๋ง, ์ค๋ต์ ๋ ์ง์คํ๋ ๋ฐฉ๋ฒ์ผ๋ก ์ค๋ฒ ํผํ ๋ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค. ๋จ์ํ๊ฒ ์๊ฐํ ์๋ ์์ง๋ง, ์ผ๋ฐ์ ์ผ๋ก ๊ฐ๋ณ ๊ฒฐ์ ํธ๋ฆฌ(๊ธฐ๋ณธ๋ชจ๋ธ)์ ์ฑ๋ฅ์ด ๋ฎ๋ค๋ฉด ..
Model Interpreting
๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ํด์ ๋ฐฉ๋ฒ๋ค์ ์ฅ๋จ์ ๊ณผ ๊ฐ๊ฐ ์ด๋ค ๋ฐฉ์์ผ๋ก ํ์ฉํ ์ ์์์ง ๋ ผ์ํด ๋ณด์ธ์. ๋ชจ๋ธ ํด์์ ํ์์ฑ ์ฑ๋ฅ์ด ์ข์ ๋ชจ๋ธ์ ๋์ฒด๋ก Black Box Model์ ๋๋ค. (์์ธก์ด ์ ํํ๊ธฐ ์ํด์ ์๋ฌด๋๋ ๋ชจ๋ธ ์์ฒด๊ฐ ๋ณต์กํด์ง๋ค๋ณด๋) ๋ง์ ๋ถ์ผ์์ ๋ชจ๋ธ์ ๋ฌด์กฐ๊ฑด ์ ๋ขฐํ ์ ์์ต๋๋ค. ๊ฐ๋ น, ์ํ๋ฅผ ์ถ์ฒํ๋ ์์คํ ์์ ์ํ ์ถ์ฒ์ ์๋ชปํ๋ค๊ณ ํด์ ์์ฃผ ํฐ ์ผ์ด ๋๋ ๊ฒ์ ์๋๋๋ค. ํ์ง๋ง ์์จ์๋์ฐจ๊ฐ์ ๊ฒฝ์ฐ, ํ๋ฒ์ ํ๋จ์ด ํฐ ์ฌ๊ณ ๋ก ์ด์ด์ง ์ ์์ผ๋ฏ๋ก ์ฐ๋ฆฌ๋ ๊ทธ ๋ด๋ถ์ ์๋ ์๋ฆฌ๋ฅผ ๋ถ์ํ๊ณ ์ฐ๊ตฌํ์ฌ ๋ ์์ ์ฑ ์๋ ๋ชจ๋ธ์ ๋ง๋ค ํ์๊ฐ ์์ต๋๋ค. ์์ฌ๊ฒฐ์ ์ ์ง์ ์ํฅ์ ์ฃผ๋ ๊ฒ์ ํด์์ ๋๋ค. ์ฆ, ๋ชจ๋ธ์ ํตํด ์์ธก์ ๋ํ 'score'๋ ๊ณ์ฐํ ์ ์์ง๋ง ๊ทธ ๊ณผ์ ์ ๋ณด๊ณ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ๊ฒ์..