ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 파이썬에서 텍스트 파일과 엑셀 파일 읽기 - pandas <2>
    파이썬/데이터 주무르기 2019. 12. 18. 00:59

    엑셀 파일을 읽는 방법입니다.

    - 테스트 하는 엑셀 파일은 컬럼이 3줄을 차지합니다. 컬럼을 1줄로 만들고 원한는 열만 출력하도록 해봅시다.

    - 컬럼명을 변경해 봅시다.

     

    소스 코드

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    import pandas as pd
     
    # 엑셀 데이터 불러오기
    pop_Seoul = pd.read_excel('population_in_Seoul.xls', encoding='utf-8')  #엑셀 파일을 읽음
    data1 = pop_Seoul.head()    #데이터의 첫 5행만 보여줌
     
    # 엑셀 데이터 불러오기 - 컬럼을 3번째 줄부터 읽고 원하는 열만 읽도록 하기
    pop_Seoul = pd.read_excel('population_in_Seoul.xls',
                              header=2,                 # 컬럼은 3번째 줄부터 읽으라는 의미
                              usecols='B, D, G, J, N',  # B, D, G, J, N 열만 읽도록 한다.
                              encoding='utf-8')
    data2 = pop_Seoul.head()
     
    # 컬럼명 변경하기
    pop_Seoul.rename(columns = {pop_Seoul.columns[0] : '구별',
                                pop_Seoul.columns[1] : '인구수',
                                pop_Seoul.columns[2] : '한국인',
                                pop_Seoul.columns[3] : '외국인',
                                pop_Seoul.columns[4] : '고령자', }, inplace=True)
    data3 = pop_Seoul
    cs

     

    엑셀 파일 내용

    Column이 3줄을 차지한다.

    data1의 값

    Column이 3줄을 차지한다. 원하는 의도가 아니다.

    data2의 값

    Column이 1줄만 차지(원하는 의도) / B,D,G,J,N 열의 데이터만 저장됨 / 의도하지 않은 컬럼명

    data3의 값

    컬럼명이 변경됨(원하는 의도)

     

    댓글

Designed by Tistory.