Jayden1116
Jayden`s LifeTrip ๐Ÿ”†
Jayden1116
์ „์ฒด ๋ฐฉ๋ฌธ์ž
์˜ค๋Š˜
์–ด์ œ
  • Jayden`s (481)
    • ๐Ÿฏ Hello, Jayden (144)
      • ์ผ๊ธฐ (1)
      • ์‹ ๋ฌธ (121)
      • ์Œ์•… (6)
      • ๊ฒฝ์ œ (16)
    • ๐Ÿ’› JavaScript (88)
      • ์ด๋ชจ์ €๋ชจ (4)
      • ๋ฐฑ์ค€ (44)
      • ํ”„๋กœ๊ทธ๋ž˜๋จธ์Šค (40)
      • ๋ฒ„๊ทธ (0)
    • ๐ŸŽญ HTML CSS (6)
      • ํํŠธ๋ฏ€๋ฅด (2)
      • ํฌ์Šค์Šค (4)
    • ๐Ÿ’ป CS (13)
      • ์ž๋ฃŒ๊ตฌ์กฐ ๋ฐ ์•Œ๊ณ ๋ฆฌ์ฆ˜ (1)
      • ๋„คํŠธ์›Œํฌ (9)
      • ์šด์˜์ฒด์ œ (1)
      • ๋ฐ์ดํ„ฐ ๋ฒ ์ด์Šค (0)
      • ๋””์ž์ธ ํŒจํ„ด (1)
    • ๐Ÿ Python (71)
      • ๋ฐฑ์ค€ (67)
      • ํ”„๋กœ๊ทธ๋ž˜๋จธ์Šค (4)
    • ๐Ÿ’ฟ Data (156)
      • ์ด๋ชจ์ €๋ชจ (65)
      • ๋ถ€ํŠธ์บ ํ”„ (89)
      • ๊ทธ๋กœ์Šค ํ•ดํ‚น (2)

๋ธ”๋กœ๊ทธ ๋ฉ”๋‰ด

  • ๐Ÿ”ด ๋ธ”๋กœ๊ทธ(ํ™ˆ)
  • ๐Ÿฑ Github
  • ๊ธ€์“ฐ๊ธฐ
  • ํŽธ์ง‘
hELLO ยท Designed By JSW.
Jayden1116

Jayden`s LifeTrip ๐Ÿ”†

๐Ÿ’ฟ Data/์ด๋ชจ์ €๋ชจ

Linear Algebra + (Cov ;๊ณต๋ถ„์‚ฐ, Cor ; ์ƒ๊ด€๊ณ„์ˆ˜)

2021. 12. 2. 14:36

titanic ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ƒ๊ด€๊ณ„์ˆ˜๋ฅผ ํ‘œํ˜„ํ•œ heatmap

  • heatmap์„ ํ†ตํ•ด ํ™•์ธํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ๊ด€๊ณ„๋Š” ๋ฌด์—‡์ธ๊ฐ€?
    titanic data์•ˆ์— ์žˆ๋Š” ์นผ๋Ÿผ(feature) ๋ณ„๋กœ ์–‘/์Œ/๋ฌด ์ƒ๊ด€๊ด€๊ณ„์— ๋Œ€ํ•ด์„œ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
    ์˜ˆ๋ฅผ ๋“ค์–ด 'survived'์™€ 'adult_male'์˜ ์ƒ๊ด€๊ณ„์ˆ˜๋Š” -0.56
    ๋‹จ์ˆœํ•˜๊ฒŒ ์ด ์ˆ˜์น˜๋งŒ ๋†“๊ณ  ๋ณด๋ฉด '์ƒ์กด ์—ฌ๋ถ€์™€ ์„ฑ์ธ ์–ด๋ฅธ ์—ฌ๋ถ€๊ฐ€ ์Œ์˜ ์ƒ๊ด€๊ด€๊ณ„' ์ฆ‰, ์„ฑ์ธ ๋‚จ์„ฑ์ด ๋” ์ƒ์กด์œจ์ด ๋‚ฎ์•˜๋‹ค๋Š” ์ด์•ผ๊ธฐ
    ์—ฌ๊ธฐ์„œ ํ•œ ๋ฒˆ ๋” ํ•ด์„ํ•˜๋ฉด ์„ฑ์ธ ๋‚จ์„ฑ๋“ค์ด ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์˜ ์ƒ์กด์„ ๋•๋‹ค๊ฐ€ ํฌ์ƒ๋๋‹ค ๋Š” ๋“ฑ์˜ ํ•ด์„์ด ๊ฐ€๋Šฅ

  • ๊ณต๋ถ„์‚ฐ๊ณผ ์ƒ๊ด€๊ณ„์ˆ˜์˜ ์ˆ˜์‹์„ ํ™•์ธํ•˜๊ณ  ๊ทธ ๋‘˜์˜ ์—ฐ๊ด€์„ฑ ๋ฐ ์ฐจ์ด์ 

์—ฐ๊ด€์„ฑ(๊ณตํ†ต์ ) : ๊ณต๋ถ„์‚ฐ๊ณผ ์ƒ๊ด€๊ณ„์ˆ˜ ๋ชจ๋‘ ํŠน์ • ๋ฒกํ„ฐ(ํ˜น์€ ์นผ๋Ÿผ, ์—ด, ์นดํ…Œ๊ณ ๋ฆฌ ๋“ฑ)์— ๋Œ€ํ•ด ๊ทธ ๋‘๊ฐœ์˜ ๊ฐ’์ด ์–ด๋А ์ •๋„๋กœ ์–‘ ๋˜๋Š” ์Œ์˜ ๊ด€๊ณ„๋ฅผ ๊ฐ–๊ณ  ์žˆ๋Š”์ง€๋ฅผ ๋น„๊ตํ•˜๋Š” ์ง€ํ‘œ์ด๋‹ค.

์ฐจ์ด์  : ์‹์„ ๋ณด๋ฉด ์•Œ๊ฒ ์ง€๋งŒ ์ƒ๊ด€๊ณ„์ˆ˜๋Š” ๊ณต๋ถ„์‚ฐ์„ ํ‘œ์ค€ํ™”ํ•œ ๊ฒƒ, ์ข€ ๋” ์ •ํ™•ํžˆ ํ‘œํ˜„ํ•˜๋ฉด ๊ฐ ๋ณ€์ˆ˜๋ฅผ ํ‘œ์ค€ํ™”ํ•œ ํ›„ ๋‘ ๋ณ€์ˆ˜์˜ ๊ด€๊ณ„๋ฅผ ํ™•์ธ

ํ‘œ์ค€ํ™”ํ•˜๋Š” ์ด์œ ๋Š” ๋‹จ์œ„์— ๋”ฐ๋ผ(๋ณ€์ˆ˜์˜ scale์— ๋”ฐ๋ผ) ๊ณต๋ถ„์‚ฐ ๊ฐ’์ด ํฌ๊ฒŒ ๋‚˜์˜ค๋Š” ๊ฒŒ ๊ฐ€๋Šฅํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์ฆ‰, ๊ทธ๋ƒฅ ์ˆซ์ž๊ฐ€ ํด์ˆ˜๋ก ๊ณต๋ถ„์‚ฐ ๊ฐ’์ด ์ปค์ง€๊ณ  ๊ทธ๋Ÿฌ๋ฉด ์šฐ๋ฆฌ๋Š” 2๊ฐœ์˜ ๊ณต๋ถ„์‚ฐ์„ ๋น„๊ตํ–ˆ์„ ๋•Œ, ๋‹จ์ˆœํ•˜๊ฒŒ ๋” ์ˆซ์ž๊ฐ€ ํฐ ๊ฐ’์„ ๋ณด๊ณ  '์•„, ์–˜๊ฐ€ ๋” ๊ด€๊ณ„์„ฑ์ด ํฌ๋„ค'๋ผ๊ณ  ํŒ๋‹จํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ. ๊ทธ๋ ‡๊ธฐ์— ๋ณ€์ˆ˜๋“ค๋งˆ๋‹ค ๊ฐ–๊ณ  ์žˆ๋Š” ๋‹จ์œ„ ์ฆ‰, scale์„ ๋งž์ถฐ์ฃผ์–ด -1๊ณผ 1 ์‚ฌ์ด์˜ ๊ฐ’์œผ๋กœ ๊ธฐ์ค€์„ ๋งž์ถฐ์ค€ ๊ฐ’์ด ์ƒ๊ด€๊ณ„์ˆ˜


  • ์ƒ๊ด€๊ด€๊ณ„์™€ ์ธ๊ณผ๊ด€๊ณ„์˜ ์ฐจ์ด์ ์‚ฌ์‹ค ์ •ํ™•ํ•˜๊ฒŒ ๋น„๊ตํ•ด๋ด์•ผ๊ฒ ์ง€๋งŒ ์ƒ์‹์„ ์—์„œ ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ์ƒ๊ฐํ•ด๋ณด๋ฉด

์ธ๊ณผ๊ด€๊ณ„ : '๊ธฐ์˜จ์ด ์˜ค๋ฅธ๋‹ค.' -> '์•„์ด์Šคํฌ๋ฆผ ํŒ๋งค๋Ÿ‰์ด ์ฆ๊ฐ€ํ•œ๋‹ค.' # ์‚ฌ์‹ค ์ด๊ฒƒ๋„ ์ •ํ™•ํ•˜์ง„์•Š์ง€๋งŒ ์ƒ์‹์„ ์—์„œ ์ธ๊ณผ๊ด€๊ณ„๋ผ๊ณ  ์นœ๋‹ค.
์ƒ๊ด€๊ด€๊ณ„ : '์•„์ด์Šคํฌ๋ฆผ ํŒ๋งค๋Ÿ‰์ด ์ฆ๊ฐ€ํ•œ๋‹ค.' -> '์ต์‚ฌํ•˜๋Š” ์‚ฌ๋ง์ž ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•œ๋‹ค.' # ์ด ๋‘˜์€ ์•„์ด์Šคํฌ๋ฆผ์„ ๋งŽ์ด ํŒ๋‹ค๊ณ  ์ต์‚ฌํ•˜๋Š” ์‚ฌ๋ง์ž ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•˜์ง„ ์•Š์Œ(์ธ๊ณผ์„ฑ์€ ์—†๋‹ค.) ๋‹ค๋งŒ ์ด ๋‘˜์˜ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์€ ์ด์œ ๋Š” ์ค‘๊ฐ„์— '์—ฌ๋ฆ„์ด ์˜จ๋‹ค', '๊ธฐ์˜จ์ด ์ฆ๊ฐ€ํ•œ๋‹ค.', '๊ฐœ์žฅํ•˜๋Š” ํ•ด์ˆ˜์š•์žฅ ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•œ๋‹ค.' ๋“ฑ ์ด ๋‘˜์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์„ค๋ช…ํ•˜๋Š” ๋ณ€์ˆ˜๋“ค์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ..!
๋‹ค์‹œ ๋งํ•ด, ์œ„์˜ ํƒ€์ดํƒ€๋‹‰ ์˜ˆ์‹œ๋„ '์ƒ๊ด€๊ณ„์ˆ˜'์ด๊ธฐ ๋•Œ๋ฌธ์— ๋ณ€์ˆ˜๋ผ๋ฆฌ์˜ '์ธ๊ณผ์„ฑ'์€ ๋”ฐ๋กœ ์ฆ๋ช…ํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

์ถ”๊ฐ€

import numpy as np

np.cov(s1, s2) # numpy๋ฅผ ์ด์šฉํ•œ ๊ณต๋ถ„์‚ฐ ๊ตฌํ•˜๊ธฐ cf)์—ฌ๊ธฐ์„œ ddof๋Š” 0๊ณผ 1 ์ค‘ ๋ชจ์ง‘๋‹จ์ด๋ƒ ํ‘œ๋ณธ์ง‘๋‹จ์ด๋ƒ๋กœ ์กฐ์ ˆ

np.corrcoef(s1, s2) # numpy๋ฅผ ์ด์šฉํ•œ ์ƒ๊ด€๊ณ„์ˆ˜ ๊ตฌํ•˜๊ธฐ 

# ๋‘ ๊ฐ’ ๋ชจ๋‘ ์œ„์˜ heatmap์ฒ˜๋Ÿผ ๋Œ€์นญํ–‰๋ ฌ ๊ผด๋กœ ๊ฐ’์ด ๋‚˜์˜จ๋‹ค. ํ•จ์ˆ˜๊ฐ€ ์ž๊ธฐ ์ž์‹ ํ•˜๊ณ ๋„ ๋น„๊ตํ•˜๊ฒŒ ๋” ๋˜์–ด์žˆ์–ด์„œ ๊ทธ๋ ‡๋‹ค.(๋‹นํ™ฉใ„ดใ„ด)

'๐Ÿ’ฟ Data > ์ด๋ชจ์ €๋ชจ' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

Clustering(๊ตฐ์ง‘ํ™”)  (0) 2021.12.06
Dimension Reduction(์ฐจ์› ์ถ•์†Œ)  (0) 2021.12.04
Verctor, Matrix, DataFrame  (0) 2021.12.01
Bayesian Statistics(๋ฒ ์ด์ฆˆ์ฃผ์˜) vs Frequentist statistics(๋นˆ๋„์ฃผ์˜)  (0) 2021.11.29
ANOVA ์˜ˆ์‹œ  (0) 2021.11.29
    '๐Ÿ’ฟ Data/์ด๋ชจ์ €๋ชจ' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€
    • Clustering(๊ตฐ์ง‘ํ™”)
    • Dimension Reduction(์ฐจ์› ์ถ•์†Œ)
    • Verctor, Matrix, DataFrame
    • Bayesian Statistics(๋ฒ ์ด์ฆˆ์ฃผ์˜) vs Frequentist statistics(๋นˆ๋„์ฃผ์˜)
    Jayden1116
    Jayden1116
    ์•„๋งˆ๋„ ํ•œ๋ฒˆ ๋ฟ์ธ ์ธ์ƒ์„ ์—ฌํ–‰ ์ค‘์ธ Jayden์˜ ์ผ์ง€๐Ÿ„๐ŸŒŠ

    ํ‹ฐ์Šคํ† ๋ฆฌํˆด๋ฐ”