본문 바로가기
python

python - select_dtypes 특정 데이터 타입 열 지정

by jinny-log 2024. 11. 9.

select_dtypes() 함수는 pandas에서 특정 데이터 타입을 가진 열만 선택할 때 사용됩니다. 이 함수는 데이터프레임에서 원하는 타입의 열을 선택하여 데이터 전처리 작업에 유용합니다.

기본 문법

DataFrame.select_dtypes(include=None, exclude=None)
 

주요 옵션

  1. include: 선택할 데이터 타입을 지정합니다.
    • 기본값은 None이며, None일 경우 포함할 열이 없습니다.
    • 문자열(예: 'number', 'object'), np.number, np.object, np.int64와 같은 개별 데이터 타입, 또는 이들의 리스트를 사용할 수 있습니다.
    • 예를 들어, include='number'로 설정하면 숫자형 열만 선택합니다.
  2. exclude: 제외할 데이터 타입을 지정합니다.
    • 기본값은 None이며, None일 경우 제외할 열이 없습니다.
    • include와 동일한 방식으로 타입을 지정할 수 있으며, exclude에 지정된 타입의 열은 선택되지 않습니다.

Note: include와 exclude를 동시에 지정할 수 있습니다.

동시에 지정할 경우 include에 속하면서 exclude에는 속하지 않는 열이 선택됩니다.

include와 exclude에서 사용 가능한 데이터 타입

select_dtypes의 include와 exclude 옵션에 지정할 수 있는 타입은 다음과 같습니다.

  • 'number': 모든 숫자형 데이터 (int, float 등)
  • 'object': 문자열이나 기타 객체형 데이터
  • 'datetime': 날짜/시간 형식 데이터 (datetime64)
  • 'timedelta': 시간 간격 데이터 (timedelta64)
  • 'category': 카테고리형 데이터
  • 'bool': 논리형 데이터 (boolean)
  • 'float', 'int', 'complex': 각각의 수치 데이터 타입

또한 np.number, np.object, np.bool_ 등의 numpy 데이터 타입을 사용할 수도 있습니다.