Vector, Matrix์ DataFrame์ ์ฐจ์ด์ ์ ๋ฌด์์ผ๊น?
- Vector : 1์ฐจ์ ๋ฐ์ดํฐ ๊ตฌ์กฐ
- Matrix : 2์ฐจ์ ๋ฐ์ดํฐ ๊ตฌ์กฐ, ๋ฐ์ดํฐ ํ์
์ด ๋ชจ๋ ๋์ผํด์ผํ๋ค. (์นผ๋ผ ํ๋๋ฅผ ๋ฒกํฐ๋ผ ๋ณด๋ฉด ๋ฒกํฐ์ ๋์ด)
import numpy as np np.matrix() # ๋ํ์ด ์์ ์๋ค.
- DataFrame : 2์ฐจ์ ๋ฐ์ดํฐ ๊ตฌ์กฐ, ์นผ๋ผ๋ง๋ค ๋ฐ์ดํฐ ํ์
์ด ๋ค๋ฅผ ์ ์๋ค. (๋ง์ฐฌ๊ฐ์ง๋ก, ์นผ๋ผ ํ๋๋ฅผ ๋ฒกํฐ๋ผ ๋ณด๋ฉด ๋ฒกํฐ์ ๋์ด)
import pandas as pd pd.DataFrame() # ํ๋ค์ค ์์ ์๋ค.
๋ณด๊ธฐ์ ๊ทธ๋ฆผ์ ์ด๋ฏธ์ง ํน์ ํ ์คํธ๋ฅผ ๋ฒกํฐํํ๋ ๊ณผ์ ์ ๋๋ค. ์ด์ฒ๋ผ ๋ฒกํฐํ๋ฅผ ์งํํ๋ ์ด์ ๊ฐ ๋ฌด์์ผ๊น?
์ด๋ฏธ์ง๋ฅผ ๋ฒกํฐํํ๋ ๊ณผ์ (Computer Vision; ์ปดํจํฐ ๋น์ )
ํ ์คํธ๋ฅผ ๋ฒกํฐํํ๋ ๊ณผ์ (Natural Language Processing; ์์ฐ์ด ์ฒ๋ฆฌ)
๋จผ์ '๋ฒกํฐํ'๋ผ ํจ์ ํํ ์ ํ๋์ ๋ฐ ํ๋ ฌ ์ด๋ก ์์ ํ๋ ฌ์ ์ธ๋ก ๋ฒกํฐ๋ก ๋ฐ๊พธ๋ ์ ํ๋ณํ์ ์๋ฏธํ๋ค. ์์ ์ง๋ฌธ์์ '๋ฒกํฐํ'๋ ์ข๋ ๋จ์ํ๊ฒ '์ซ์๋ก์ ๋์ด'์ด๋ผ๊ณ ์๊ฐํ๋ค. ๋จ์ํ๊ฒ ์๊ฐํ๋ฉด, ์ฐ๋ฆฌ๊ฐ ๋ค๋ฃจ๋ ์ด๋ฏธ์ง, ํ ์คํธ, ์์, ์์ฑ ๋ฑ์ ์ปดํจํฐ๊ฐ ์ดํดํ๊ณ ๊ตฌ๋ถํ์ฌ ํ์ตํ ์ ์๊ฒ ํ๊ธฐ ์ํจ์ด๋ผ๊ณ ์๊ฐํ ์ ์๋ค. ๋ํ, ์ด๋ ๊ฒ ๋ฒกํฐ๋ฅผ ํตํ ํํ์ผ๋ก ๋ฐ์ดํฐ๋ง๋ค์ ์ ๊ธฐ์ ์ธ ์ฐ๊ฒฐ์ด ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ ๋ฒกํฐํ๋ฅผ ์งํํด์ผํ๋ค.
- ์ด๋ฏธ์ง : ์ธ์ ๋ชจ๋ ์๊น์ ํน์ ๊ฐ์ ๋ถ์ฌํ๊ฒ ๋๋ฉด ๋๋ฌด ๋ง์ ์ฐจ์์ด ์๊ธด๋ค. ํด์, RGB์ 3๊ฐ์ ์นผ๋ผ์ ๋๊ณ ๊ฐ๊ฐ ์นผ๋ผ๋ง๋ค ๊ฐ์ ์กฐํฉํ์ฌ ๋ฒกํฐ๋ฅผ ๋ง๋ค๊ณ ๊ตฌ๋ถํ๋ค.
- ํ ์คํธ : ์ธ๊ฐ์ ๊ธ์๋ฅผ ํ์ต์ํค๊ธฐ ์ํด ์ซ์๋ก ๋ฐ๊พธ๋ ์์ ์ด ํ์ํ๋ค. ์ฐ๋ฆฌ๊ฐ categorical ๋ฐ์ดํฐ๋ฅผ ์ซ์๋ฅผ ๋ถ์ฌํด์ ์ฒ๋ฆฌํ๋ฏ, ์ธ๊ฐ์ ๊ธ์์๋ ์ซ์๋ฅผ ๋ถ์ฌํ์ฌ ํ์ต์ํค๊ธฐ ์ํจ์ด๋ค. ์ด ๋, ๋ฒกํฐ๋ฅผ ์ด์ฉํ๋ ์ด์ ๋ ์ปดํจํฐ๊ฐ ๋ฒกํฐ๋ฅผ ํตํด ํ์ต์ '๊ฑฐ๋ฆฌ'์ ๋ํ ๊ณ์ฐ์ด ๊ฐ๋ฅํ๊ณ ๊ทธ์ ๋ฐ๋ผ ๋จ์ด ๋ณ ์ ์ฌ์ฑ์ ๊ณ์ฐํ ์ ์๊ฒ ๋๋ค.
'๐ฟ Data > ์ด๋ชจ์ ๋ชจ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Dimension Reduction(์ฐจ์ ์ถ์) (0) | 2021.12.04 |
---|---|
Linear Algebra + (Cov ;๊ณต๋ถ์ฐ, Cor ; ์๊ด๊ณ์) (0) | 2021.12.02 |
Bayesian Statistics(๋ฒ ์ด์ฆ์ฃผ์) vs Frequentist statistics(๋น๋์ฃผ์) (0) | 2021.11.29 |
ANOVA ์์ (0) | 2021.11.29 |
Hypothesis Test(๊ฐ์ค ๊ฒ์ ) 2 (0) | 2021.11.29 |