Jayden1116
Jayden`s LifeTrip πŸ”†
Jayden1116
전체 방문자
였늘
μ–΄μ œ
  • Jayden`s (481)
    • 🐯 Hello, Jayden (144)
      • 일기 (1)
      • μ‹ λ¬Έ (121)
      • μŒμ•… (6)
      • 경제 (16)
    • πŸ’› JavaScript (88)
      • 이λͺ¨μ €λͺ¨ (4)
      • λ°±μ€€ (44)
      • ν”„λ‘œκ·Έλž˜λ¨ΈμŠ€ (40)
      • 버그 (0)
    • 🎭 HTML CSS (6)
      • ννŠΈλ―€λ₯΄ (2)
      • 크슀슀 (4)
    • πŸ’» CS (13)
      • 자료ꡬ쑰 및 μ•Œκ³ λ¦¬μ¦˜ (1)
      • λ„€νŠΈμ›Œν¬ (9)
      • 운영체제 (1)
      • 데이터 베이슀 (0)
      • λ””μžμΈ νŒ¨ν„΄ (1)
    • 🐍 Python (71)
      • λ°±μ€€ (67)
      • ν”„λ‘œκ·Έλž˜λ¨ΈμŠ€ (4)
    • πŸ’Ώ Data (156)
      • 이λͺ¨μ €λͺ¨ (65)
      • λΆ€νŠΈμΊ ν”„ (89)
      • 그둜슀 ν•΄ν‚Ή (2)

λΈ”λ‘œκ·Έ 메뉴

  • πŸ”΄ λΈ”λ‘œκ·Έ(ν™ˆ)
  • 🐱 Github
  • κΈ€μ“°κΈ°
  • νŽΈμ§‘
hELLO Β· Designed By JSW.
Jayden1116

Jayden`s LifeTrip πŸ”†

πŸ’Ώ Data/이λͺ¨μ €λͺ¨

ANOVA μ˜ˆμ‹œ, μ—¬λŸ¬ μƒ˜ν”Œλ§

2021. 12. 10. 10:43

1. ANOVA

데이터 μ „μ²˜λ¦¬λŠ” μƒλž΅ν•˜κ² μŠ΅λ‹ˆλ‹€.

df_tree.head()

image

df_tree_mel = df_tree.reset_index().melt(id_vars='index', value_vars=['μ€ν–‰λ‚˜λ¬΄','μ–‘λ²„μ¦˜λ‚˜λ¬΄','λŠν‹°λ‚˜λ¬΄']) # μ΄μƒμΉ˜ 및 μ‹œκ°ν™”λ₯Ό μœ„ν•œ melting
from scipy import stats

stats.f_oneway(df_tree['μ€ν–‰λ‚˜λ¬΄'], df_tree['μ–‘λ²„μ¦˜λ‚˜λ¬΄'], df_tree['λŠν‹°λ‚˜λ¬΄'])

F_onewayResult(statistic=17.006289557888046, pvalue=8.935183167883698e-07)

귀무가섀(H0) : μ„œμšΈμ‹œμ˜ ꡬ별 평균 μ€ν–‰λ‚˜λ¬΄, μ–‘λ²„μ¦˜λ‚˜λ¬΄, λŠν‹°λ‚˜λ¬΄μ˜ μˆ˜λŠ” λͺ¨λ‘ κ°™λ‹€.
λŒ€λ¦½κ°€μ„€(H1) : λͺ¨λ‘ κ°™μ§€λŠ” μ•Šλ‹€.

p-value << 0.05 μ΄λ―€λ‘œ 귀무가섀은 기각
μ„œμšΈμ‹œμ˜ ꡬ별 평균 μ€ν–‰λ‚˜λ¬΄, μ–‘λ²„μ¦˜λ‚˜λ¬΄, λŠν‹°λ‚˜λ¬΄ μˆ˜λŠ” λͺ¨λ‘ κ°™μ§„ μ•Šλ‹€.

이후 각각의 λ‚˜λ¬΄λ“€μ— λŒ€ν•΄ 2 sample t-testλ₯Ό μ§„ν–‰ν•˜μ˜€μŠ΅λ‹ˆλ‹€.

image

2. μƒ˜ν”Œλ§

1) Simple Random Sampling

import random
random.sample(range(1,101), 20)

import numpy as np

pop = np.arange(1,101)

np.random.choice(pop, size=sample_size, replace=False)

2) Symetric Sampling

import random
np.array(range(random.randint(1,5),101,5))

3) Stratified Random Sampling

sample = []

for i in range(10,101,10):
  sam = np.random.choice(pop[i-9:i], int(sample_size/10), replace=False)
  sample.append(sam)

np.hstack(sample)

4) Clustering Sampling

condition = (pop % 5 == random.randint(0,4))
pop[condition]
sample_size = 20

'πŸ’Ώ Data > 이λͺ¨μ €λͺ¨' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

λ² μ΄μ§€μ•ˆ μ˜ˆμ‹œ 풀이(Bayesian Problem example)  (0) 2021.12.10
큰 수의 법칙, μ€‘μ‹¬κ·Ήν•œμ •λ¦¬ μ½”λ“œλ‘œ κ΅¬ν˜„  (0) 2021.12.10
Python λ―ΈλΆ„  (0) 2021.12.10
데이터 정리 및 μ‹œκ°ν™” μ˜ˆμ‹œ 기둝  (0) 2021.12.10
Feature Engineering_결츑치 처리, apply ν•¨μˆ˜ 적용  (0) 2021.12.09
    'πŸ’Ώ Data/이λͺ¨μ €λͺ¨' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€
    • λ² μ΄μ§€μ•ˆ μ˜ˆμ‹œ 풀이(Bayesian Problem example)
    • 큰 수의 법칙, μ€‘μ‹¬κ·Ήν•œμ •λ¦¬ μ½”λ“œλ‘œ κ΅¬ν˜„
    • Python λ―ΈλΆ„
    • 데이터 정리 및 μ‹œκ°ν™” μ˜ˆμ‹œ 기둝
    Jayden1116
    Jayden1116
    μ•„λ§ˆλ„ ν•œλ²ˆ 뿐인 인생을 μ—¬ν–‰ 쀑인 Jayden의 μΌμ§€πŸ„πŸŒŠ

    ν‹°μŠ€ν† λ¦¬νˆ΄λ°”