πŸ’Ώ Data/이λͺ¨μ €λͺ¨

큰 수의 법칙, μ€‘μ‹¬κ·Ήν•œμ •λ¦¬ μ½”λ“œλ‘œ κ΅¬ν˜„

Jayden1116 2021. 12. 10. 11:35

1. 큰 수의 법칙

df3.describe() # λŒ€λž΅μ μΈ λ°μ΄ν„°μ˜ λͺ¨μˆ˜λ₯Ό ν™•μΈν•©λ‹ˆλ‹€.

image

λŒ€λž΅ 5000개만 가도 값이 λΉ„μŠ·ν•΄μ§€λŠ” 것을 확인할 수 μžˆμŠ΅λ‹ˆλ‹€.

dat = []
np.random.seed(42)
for i in np.arange(start = 0, stop = 18000, step = 100) :
  s = np.random.choice(df3, i)
  dat.append(s.var())
dat

(pd
 .DataFrame(dat)
 .plot
 .line(color = '#4000c7')
 .axhline(y = 192, color = '#00da75')
 );

image

ν‘œλ³Έμ˜ μˆ˜κ°€ λ§Žμ•„μ§ˆμˆ˜λ‘ 점차 뢄산값이 μˆ˜λ ΄ν•˜λŠ” λͺ¨μŠ΅μ„ ν™•μΈν•˜μ˜€μŠ΅λ‹ˆλ‹€.

2. μ€‘μ‹¬κ·Ήν•œμ •λ¦¬

sample_means = []

for x in range(0, 1000):
  coinflips = np.random.choice(df3, 1000)
  sample_means.append(coinflips.mean())

pd.DataFrame(sample_means).hist(color = '#4000c7'); # 1000κ°œμ”© 1000번 뽑은 경우

image

sample_means2 = []

for x in range(0, 10000):
  coinflips = np.random.choice(df3, 1000)
  sample_means2.append(coinflips.mean())

pd.DataFrame(sample_means2).hist(color = '#4000c7'); # 1000κ°œμ”© 10000번 뽑은 경우

image

ν™•μ‹€νžˆ 쒀더 μ •κ·œλΆ„ν¬μ— κ°€κΉŒμ›Œμ§€λŠ” 것을 확인할 수 μžˆμ—ˆμŠ΅λ‹ˆλ‹€.

μ΄μƒμž…λ‹ˆλ‹€. κ°μ‚¬ν•©λ‹ˆλ‹€. :)