본문 바로가기
python

python - 집합 연산자

by jinny-log 2024. 11. 4.

▩ 판다스의 집합 연산자  

             SQL                          vs                 판다스 

1.  union all (중복제거x)                                  pd.concat 
2.  union (중복제거o)                                      pd.concat + drop_duplicates()
3.  intersect                                            아래의 코드 
4.  minus                                                아래의 코드 

 

예시1. union all 

 

 

lg가 두번 나옴! 중복제거 안했기 때문에

 

예시2. union (중복제거 O)

lg가 한번 나옴! 중복 제거 했기 때문에

 

예시3. minus (빼기)

 

예시3-1

x1은 14개, x2는 8개임

그러므로 x1-x2 minus하면 x1은 있는데 x2에 없는 데이터가 출력됨

 

예시3-2

kt랑 lg 포함된 x1 데이터에서, sk랑 lg포함된 x2를 빼니 중복집합인 lg만 제외하면 결국 kt값만 나오게됨.