데이터프레임 인덱스의 중요성
데이터프레임에서 인덱스는 각 행을 고유하게 식별하는 중요한 역할을 합니다. 마치 엑셀의 행 번호와 비슷하지만, 더 강력한 기능을 제공합니다.
set_index() - 의미있는 인덱스 만들기
set_index() 함수는 기존 열을 인덱스로 설정할 수 있게 해줍니다. 예를 들어 거래내역 데이터에서 거래일자를 인덱스로 설정하면 날짜별 데이터 접근이 용이해집니다.
# 거래일자를 인덱스로 설정
df = df.set_index('거래일자')
Python
복사
reset_index() - 인덱스를 열로 변환
reset_index() 함수는 현재 인덱스를 일반 열로 변환하고, 기본 숫자 인덱스로 재설정합니다. drop=True 옵션을 사용하면 기존 인덱스를 열로 변환하지 않고 삭제할 수 있습니다. 데이터 처리 과정에서 인덱스를 다시 일반 열로 되돌려야 할 때 유용합니다.
# 인덱스를 열로 변환 (옵션: drop=True로 기존 인덱스 삭제)
df = df.reset_index()
df = df.reset_index(drop=False) # drop=True 사용시 기존 인덱스 제거
Python
복사
index.name - 인덱스 이름 설정
index.name 속성을 사용하여 인덱스에 의미 있는 이름을 부여할 수 있습니다. 이는 데이터 분석 결과를 해석할 때 더 명확한 이해를 돕습니다.
# 인덱스 이름 설정
df = df.copy()
df.index.name = '거래일자'
Python
복사
실무 활용 예시
회계 데이터 분석에서 인덱스 활용 사례
•
거래일자를 인덱스로 설정하여 특정 기간의 거래 데이터 추출
•
계정과목코드를 인덱스로 설정하여 계정과목별 집계 수행
•
거래처코드를 인덱스로 설정하여 거래처별 분석 진행
실습노트북 및 엑셀
앞서 배운 데이터 선택 방법을 직접 실습해보겠습니다.
•
데이터 복사: data = df.copy()로 원본 데이터 보존
•
인덱스 확인: data.index로 현재 range형 인덱스 확인
•
인덱스 설정: data.set_index('계정명')으로 계정명을 인덱스로 지정
•
인덱스 초기화: data.reset_index()로 인덱스를 다시 열로 변환
•
•
최종 확인: data로 변경된 데이터프레임 출력