728x90
반응형

Reference
- DataManim (https://www.datamanim.com/dataset/99_pandas/pandasMain.html#)
<파이썬 한권으로 끝내기>, 데싸라면▪빨간색 물고기▪자투리코드, 시대고시기획 시대교육

 

DataSet

뉴욕 airBnB : https://www.kaggle.com/ptoscano230382/air-bnb-ny-2019 

DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/AB_NYC_2019.csv%E2%80%99

 

Question

✔ 데이터를 로드하고 상위 5개 컬럼을 출력하라

 

+ df.host_name.value_counts() : "host_name" 열에서 각 고유한 값의 등장 횟수를 계산

 

+ agg : 집계(aggregation) 함수를 적용하는 메서드

  'mean': 평균

  'sum': 합

  'min': 최솟값

  'max': 최댓값

  'count': 유효한(non-null) 값의 개수

  'std': 표준 편차

  'var': 분산

  'median': 중앙값

  'quantile(q)': 주어진 분위수(q)에 해당하는 값. q는 0 ~ 1 사이의 값

+ neighbourhood_group 값에 따른 price값 : df[['neighbourhood_group', 'price']].groupby('neighbourhood_group')

+ neighbourhood 값과 neighbourhood_group 값 : df.groupby(['neighbourhood', 'neighbourhood_group'])

 

+ unstack() : 계층적 인덱스를 가진 DataFrame이나 Series에서 인덱스를 열로 변환하는 데 사용

+ Ans.sum(axis=1) : 각 행의 합

+ .values.reshape(-1,1) : 1차원 배열을 열 벡터로 변환

+ Ans.values / Ans.sum(axis=1).values.reshape(-1,1) : Ans의 값들을 각 행의 합으로 나누어서 비율을 계산

+ .loc[:,:] : 모든 행과 열에 해당하는 부분을 선택하는 인덱싱

728x90
반응형