Pandas read_excel 소개
회사에서 업무를 할 때 가장 많이 사용하는 포맷 중 하나는 단연 엑셀입니다. 엑셀은 자체적인 계산 formula 함수를 통해 데이터를 분석하고 자동화하는 데 특화되어 있습니다. 표 형식의 포맷이자 널리 사용되는 만큼 pandas는 엑셀을 간편하게 읽을 수 있도록 지원합니다.
기본사용법
가장 간단한 형태로는 파일 경로만 지정하면 되며, 시트 이름이나 특정 범위를 지정하여 데이터를 선택적으로 불러올 수도 있습니다. 파일 경로는 현재 실행하는 파이썬 파일이 있는 디렉토리(파일의 경로)를 기준으로 설정됩니다.
import pandas as pd # import 참고
# 현재 디렉토리에 있는 파일
df = pd.read_excel('example.xlsx')
# 하위 폴더에 있는 파일
df = pd.read_excel('data/example.xlsx')
# 상위 폴더에 있는 파일
df = pd.read_excel('../example.xlsx')
# 절대 경로 사용
df = pd.read_excel('C:/Users/username/Documents/example.xlsx')
Python
복사
Windows 시스템에서 절대 경로를 사용할 때는 백슬래시(\) 대신 슬래시(/)를 사용하거나 백슬래시를 두 번(\\) 사용하는 것이 좋습니다. 이는 파이썬에서 백슬래시가 특수 문자로 인식되기 때문입니다.
경로(Path)의 두 가지 유형
- 절대 경로(Absolute Path):
파일의 전체 경로를 root부터 모두 포함
예: C:/Users/username/Documents/example.xlsx
장점: 명확하고 오류가 적음
단점: 다른 환경에서 실행할 때 수정이 필요
- 상대 경로(Relative Path):
현재 작업 디렉토리를 기준으로 한 경로
예: data/example.xlsx, ../example.xlsx
장점: 코드의 이식성이 좋음
단점: 현재 위치를 정확히 알아야 함
Google Colab에서의 실습방법
제가 공유한 파이썬 기초문법을 통해 학습하셨다면 Google Colab으로 파이썬을 시작하셨을 것입니다. Colab은 클라우드 컴퓨터를 대여받는 개념이므로, 데이터를 클라우드에 업로드하는 추가 작업이 필요합니다. 아래링크를 참고 해주세요!!
실습에서 Google Colab을 사용하기 싫다! 내PC에서 하겠다 하면 vscode나 jupyter notebook설치를 해보시기 바랍니다.
실습하기
1) 실습파일 다운로드
아래의 실습파일을 다운로드 받아서 특정경로에 위치시켜주세요!
google colab의 경우 files를 이용해서 업로드합니다.
2) 파이썬파일 생성
실습파일이 있는 경로에 py파일 또는 jupyter notebook을 생성합니다.
3)read_excel()
import pandas as pd # import 참고
# 현재 디렉토리에 있는 파일
df = pd.read_excel('investwings 동화약품(000020).xlsx')
Python
복사