본문 바로가기
코딩

[파이썬 Python] Pandas 에러 해결 cannot reindex from a duplicate axis 컬럼 중복

by 명석한 쭌이 2023. 8. 2.

다음과 같은 데이터 프레임이 있다고 가정하자.

예시 데이터프레임
학급 컬럼값이 1,2인 데이터만 추출

loc 함수를 하려면 주체가 반드시 리스트형태가 되어야 한다.

data라는 데이터프레임에서 '학급'이라는 하나의 컬럼을 지정함으로써 주체는 리스트 형태로

아래와 같이 애러 없이 잘 출력이 된다.

출력값!

허나 다음과 같은 경우

ValueError: cannot reindex from a duplicate axis 애러가 발생한다.

 

① 이중 대괄호를 넣을 경우 

 

② 다중 컬럼을 넣게 될 경우

 

컬럼을 지정해주지 않을 경우

 

그런데 리스트형태를 주체로 사용했음에도 같은 애러가 나는 경우가 있다.

 

원인은 바로

중복된 컬럼으로 인해 아래와 같이 같은 이름의 두 개의 컬럼이 선택되어 리스트형태가 아닌 데이터 프레임 형태로 간주되므로, 애러가 발생하게 되는 것이다. 컬럼명을 중복되지 않게 바꿔주면 해결!

df['국어'] 출력 결과