-
pandas 기초 익히기파이썬/데이터 주무르기 2019. 12. 18. 02:16
소스 코드
12345678910111213141516171819import pandas as pdimport numpy as np# Series - 대괄호로 만드는 파이썬의 list 데이터로 만들 수 있다.s = pd.Series([1,3,5,np.nan,6,8])print(s)# 2013월 01월 01일 부터 6일 동안의 데이터를 저장dates = pd.date_range('20130101', periods=6)print(dates)# 6행 4열의 random 변수를 만들고 columns=['A','B','C','D']로 지정, index는 2013월 01월 01일 부터 6일 동안의 데이터df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=['A','B','C','D'])print('-------------------------------------------')print(df.index) # DataFrame의 index정보 출력print(df.columns) # DataFrame의 column정보 출력print(df.values) # DataFrame의 Values정보 출력print(df.describe()) # DataFrame의 통계정 개요를 확인cs print(s) 출력 결과
print(dates) 출력 결과
df에 저장된 데이터
print(df.index) 출력 결과
Index(['A', 'B', 'C', 'D'], dtype='object')DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',
'2013-01-05', '2013-01-06'],
dtype='datetime64[ns]', freq='D')print(df.columns) 출력 결과
Index(['A', 'B', 'C', 'D'], dtype='object')
print(df.values) 출력 결과
[[ 0.66311407 0.79238582 1.3398887 -0.13912784]
[-0.39180542 -0.78931294 -0.0703802 -0.62366634]
[-0.61042631 1.61375469 0.24972748 0.55330084]
[-1.12157847 2.0345322 0.01338598 0.42132617]
[-0.12014888 -0.1113363 -0.20207455 1.03233071]
[-0.21781195 -1.48348572 0.37475024 0.26999078]]print(df.describe())출력 결과
sort_values명령은 by로 지정된 컬럼을 기준으로 정렬
1result = df.sort_values(by='B', ascending=False)cs '파이썬 > 데이터 주무르기' 카테고리의 다른 글
파이썬 BeautifulSoup를 이용하여 네이버 웹툰 제목 가져오기 (0) 2019.12.20 DataFrame 합치기(merge) (0) 2019.12.18 CCTV 현황 그래프로 분석하기 (0) 2019.12.18 파이썬에서 텍스트 파일과 엑셀 파일 읽기 - pandas <2> (0) 2019.12.18 파이썬에서 텍스트 파일과 엑셀 파일 읽기 - pandas <1> (0) 2019.12.17