본문 바로가기

데이터분석 & 엔지니어링 부트캠프

파이썬 데이터 통합 기초 메서드 join(), append()-->concat(), merge()

환경: 주피터 노트북, 언어: 파이썬  라이브러리: 판다스, 넘파이 

--------------------------------------------------------------------------------------

데이터를 세로로 한 번 가로로 한 번 합쳐보도록 하겠습니다.

우선 세로로 한 번 합쳐봄.

합쳐볼 데이터프레임을 만들었습니다.

 

 

 

이 두개의 테이블을 합쳐보겠습니다. 

append 매서드를 이용하면 되겠죠? 

 

명령어

이렇게요 ㅎ! 

 

 

맨 밑줄 주목

 

?? 분명 쓰던거일텐데요. 

이런 경우 공식문서를 확인해볼 필요가 있습니다.

 

 DataFrame append method docs 정도 키워드로 구글에 검색해서 공식문서를 확인하겠습니다.

 

아 역시! 판다스 1.4.0 버전 이우로는 append() 함수 대신 concat()을 써야한다고 알려주고 있습니다. 

Deprecated가 이제 지원하지 않는다는 뜻입니다.


 

그럼 concat()을 어떻게 쓰지?

 

이런식으로 명령어를 입력하면 되는데요.

 

요렇게 나옵니다. 세로로 합쳐졌습니다.

 

이렇게 테이블을 하나 더 만들고 concat()을 써서  위에거랑 한번 더 합쳐보겠습니다. 

합쳤는데 보니까 인덱스 번호가 그대로 이어붙여서 엉망입니다. 

 

이 명령어를 입력(공식문서 확인) 

인덱스가 정렬이 됐다.

이처럼 append()가 아닌 

concat() 을 써줘야 하며 이걸 써주면 세로로 데이터가 통합됩니다. 

 

이제 가로로 한 번 합쳐보자.

가로는 join() 을 써주면 된다.

 

가로로 합쳐볼 테이블을 만들고 

아랫줄 처럼 join()을 써서 명령하면 

 

가로로 'Class3'가 합쳐진 걸 확인할 수 있다.

===================================================

이제 join과 비슷한 merge를 간단히 설명하겠다

일단 이렇게 합쳐볼 테이블 두개를 만들어봄.

이렇게 두개의 테이블이 만들어짐 

a b c d 나란히 한 테이블로 합치고 싶으니 join써도 될 것 같지만 에러가 난다. 

컬럼명이 중복된다나 뭐라나

그래서 이렇게 조인을 쓰면 안되고 

위와같이 merge()를 활용하면 데이터가 합쳐진다. 

 

이상 아주아주 기초 데이터통합 메서드를 알아봤다.