'💿 Data/이모저모' 카테고리의 글 목록 (10 Page)

Feature Engineering_결측치 처리, apply 함수 적용

2021.12.09

NA Value Handling 19년도 4분기의 당기순이익(비지배) 부분을 Na로 대체하세요 이후 해당 결측치를 mean imputation 방법을 사용하여 처리하세요. Feature Engineering Relative Perfomance 라는 새로운 feature를 계산하세요. 이는 최근 1년치 매출액의 평균값을 기준으로 10% 이상 -> S 5% 이상 -> A -5 ~ 5% -> B -5%이하 -> C 10%이하 -> D 라는 값을 갖는 feature입니다. 20년도 2분기에 해당하는 결과값은 A가 나와야합니다. 각각에 해당하는 등급이 나오기 위해서 필요한 매출액을 추가로 서술하세요. url = 'https://ds-lecture-data.s3.ap-northeast-2.amazonaws...

💿 Data/이모저모

Seaborn 'penguins'

2021.12.09

import seaborn as sns pp = sns.load_dataset('penguins') penguins 데이터를 계속 사용합니다. 이에 대해 아래의 task들을 시행하세요. 결측치 처리 (제거) bill_length_mm에 대해서 qqplot 그리기 island에 대해서 다른 4개의 numerical feature 를 boxplot으로 표현하기 각 numerical feature에 대해서 summary statistics : mean, sd, Quantiles(1Q, 2Q, 3Q, 4Q)를 계산하세요. 1. 결측치 처리(제거) pp.isna().sum() # 먼저 결측치 개수를 확인하였습니다. pp_clean = pp.dropna(axis=0) # 결측치를 갖고 있는 행 제거 ..

💿 Data/이모저모

데이터 다루기 예시2

2021.12.07

# Import Packages import pandas as pd import numpy as np import seaborn as sns # dataset upload df = sns.load_dataset("titanic") df 1. index 및 columns 다루기 Q. 'survived' 컬럼을 index로 만들어 확인하고, 다시 'survived' 컬럼을 돌려놓은 뒤 인덱스를 초기화시키세요. df.set_index('survived', inplace=True) temp = df.index df.reset_index(drop=True, inplace=True) df['survived'] = temp Q. DataFrame df의 컬럼명..

💿 Data/이모저모

데이터 다루기 예시1

2021.12.07

# Import Packages import pandas as pd import numpy as np import seaborn as sns # dataset upload df = sns.load_dataset("titanic") df 1. 결측치 다루기 Q. 'deck'컬럼의 결측치 개수는 몇 개인가요? df['deck'].isna().sum() # 특정 컬럼에 결측치 개수 세기 Q. 모든 결측치는 컬럼기준 직전의 값으로 대체하고, 첫번째 행에 결측치가 있을 경우 뒤에 있는 값으로 대체하세요 df['deck'].fillna(method='ffill', inplace=True) # 먼저 전체에 대해서 직전값 적용 df['deck']...

💿 Data/이모저모

Cramer's rule(크레이머 소거법)

2021.12.07

다음 링크의 내용을 참조하여 Cramer's rule을 사용해 x1 , x2 , x3 의 값을 구하세요. https://youtu.be/6StS7VjtuGI x1 + 2x3 = 6 −3x1 + 4x2 + 6x3 = 30 −x1 −2x2 + 3x3 = 8 개인적으로 위의 영상을 대략 이해하고 코드로 구현해봤는데, 계산 횟수를 늘릴 때마다 계속 값이 달라져서 구글링해서 나온 공식을 적용하였습니다. import numpy as np A = np.array([[1, 0, 2], [-3, 4, 6], [-1, -2, 3]]) b = np.array([[6], [30], [8]]) det(A)의 값을 각각 1행에 b를 넣고 나온 det 값, 2행에 넣고 나온 값, 3행에 넣고 나온 값을 나누면 그게 곧 해가..

Feature Engineering_결측치 처리, apply 함수 적용

Seaborn 'penguins'

데이터 다루기 예시2

데이터 다루기 예시1

Cramer's rule(크레이머 소거법)

티스토리툴바