🗃️ 프로그램
home
EveryData엑셀
home

인덱스 세팅하기

데이터프레임 인덱스의 중요성

데이터프레임에서 인덱스는 각 행을 고유하게 식별하는 중요한 역할을 합니다. 마치 엑셀의 행 번호와 비슷하지만, 더 강력한 기능을 제공합니다.

set_index() - 의미있는 인덱스 만들기

set_index() 함수는 기존 열을 인덱스로 설정할 수 있게 해줍니다. 예를 들어 거래내역 데이터에서 거래일자를 인덱스로 설정하면 날짜별 데이터 접근이 용이해집니다.
# 거래일자를 인덱스로 설정 df = df.set_index('거래일자')
Python
복사

reset_index() - 인덱스를 열로 변환

reset_index() 함수는 현재 인덱스를 일반 열로 변환하고, 기본 숫자 인덱스로 재설정합니다. drop=True 옵션을 사용하면 기존 인덱스를 열로 변환하지 않고 삭제할 수 있습니다. 데이터 처리 과정에서 인덱스를 다시 일반 열로 되돌려야 할 때 유용합니다.
# 인덱스를 열로 변환 (옵션: drop=True로 기존 인덱스 삭제) df = df.reset_index() df = df.reset_index(drop=False) # drop=True 사용시 기존 인덱스 제거
Python
복사

index.name - 인덱스 이름 설정

index.name 속성을 사용하여 인덱스에 의미 있는 이름을 부여할 수 있습니다. 이는 데이터 분석 결과를 해석할 때 더 명확한 이해를 돕습니다.
# 인덱스 이름 설정 df = df.copy() df.index.name = '거래일자'
Python
복사

실무 활용 예시

회계 데이터 분석에서 인덱스 활용 사례
거래일자를 인덱스로 설정하여 특정 기간의 거래 데이터 추출
계정과목코드를 인덱스로 설정하여 계정과목별 집계 수행
거래처코드를 인덱스로 설정하여 거래처별 분석 진행
실무 팁: 데이터 분석 초기에 의미 있는 인덱스를 설정해두면, 이후 데이터 처리 과정이 훨씬 수월해집니다. 특히 시계열 데이터 분석이나 그룹별 집계 작업에서 큰 도움이 됩니다.

실습노트북 및 엑셀

앞서 배운 데이터 선택 방법을 직접 실습해보겠습니다.
실습 노트북 특징
데이터 복사: data = df.copy()로 원본 데이터 보존
인덱스 확인: data.index로 현재 range형 인덱스 확인
인덱스 설정: data.set_index('계정명')으로 계정명을 인덱스로 지정
인덱스 초기화: data.reset_index()로 인덱스를 다시 열로 변환
인덱스 이름 변경: data.index.name = '주요계정'으로 인덱스명 수정
최종 확인: data로 변경된 데이터프레임 출력
회계쟁이의Pandas #인덱스세팅.xlsx
332.4KB