코딩2 [파이썬 코딩] 데이터프레임 하나의 컬럼을 여러 개로 나누기 데이터 프레임 내 하나의 컬럼값을 두 개의 컬럼값으로 나눠보겠습니다.. 그래서 어떻게 나눈다는 거지? 이해가 잘 안 가시는 분들은 아래 그림을 봐주세요. 아래처럼 도로명_주소명 컬럼을 주시도명과 시군구명으로 나눠보려는 것입니다. import pandas as pd df = pd.read_csv('/content/데이터.csv') df.head() 나누기 위해 쓸 명령어는 바로 split 명령어인데요. 아래와 같이 split(' ')을 준다는 것은 ' ' (공백)을 기준으로 안의 데이터를 쪼갠다는 겁니다. 아래의 아웃풋 결과를 보시는 것처럼 리스트 단위 내로 쪼개진 것을 확인하실 수 있습니다. df['도로명_주소'].str.split(' ') 쪼개진 데이터에서 1행당 똑같은 위치에 있는 데이터를 가져오는 .. 2024. 2. 12. [파이썬 Python] Pandas 에러 해결 cannot reindex from a duplicate axis 컬럼 중복 다음과 같은 데이터 프레임이 있다고 가정하자. loc 함수를 하려면 주체가 반드시 리스트형태가 되어야 한다. data라는 데이터프레임에서 '학급'이라는 하나의 컬럼을 지정함으로써 주체는 리스트 형태로 아래와 같이 애러 없이 잘 출력이 된다. 허나 다음과 같은 경우 ValueError: cannot reindex from a duplicate axis 애러가 발생한다. ① 이중 대괄호를 넣을 경우 ② 다중 컬럼을 넣게 될 경우 ③ 컬럼을 지정해주지 않을 경우 그런데 리스트형태를 주체로 사용했음에도 같은 애러가 나는 경우가 있다. 원인은 바로 중복된 컬럼으로 인해 아래와 같이 같은 이름의 두 개의 컬럼이 선택되어 리스트형태가 아닌 데이터 프레임 형태로 간주되므로, 애러가 발생하게 되는 것이다. 컬럼명을 중복.. 2023. 8. 2. 이전 1 다음