select_dtypes() 함수는 pandas에서 특정 데이터 타입을 가진 열만 선택할 때 사용됩니다. 이 함수는 데이터프레임에서 원하는 타입의 열을 선택하여 데이터 전처리 작업에 유용합니다.
기본 문법
DataFrame.select_dtypes(include=None, exclude=None)
주요 옵션
- include: 선택할 데이터 타입을 지정합니다.
- 기본값은 None이며, None일 경우 포함할 열이 없습니다.
- 문자열(예: 'number', 'object'), np.number, np.object, np.int64와 같은 개별 데이터 타입, 또는 이들의 리스트를 사용할 수 있습니다.
- 예를 들어, include='number'로 설정하면 숫자형 열만 선택합니다.
- exclude: 제외할 데이터 타입을 지정합니다.
- 기본값은 None이며, None일 경우 제외할 열이 없습니다.
- include와 동일한 방식으로 타입을 지정할 수 있으며, exclude에 지정된 타입의 열은 선택되지 않습니다.
Note: include와 exclude를 동시에 지정할 수 있습니다.
동시에 지정할 경우 include에 속하면서 exclude에는 속하지 않는 열이 선택됩니다.
include와 exclude에서 사용 가능한 데이터 타입
select_dtypes의 include와 exclude 옵션에 지정할 수 있는 타입은 다음과 같습니다.
- 'number': 모든 숫자형 데이터 (int, float 등)
- 'object': 문자열이나 기타 객체형 데이터
- 'datetime': 날짜/시간 형식 데이터 (datetime64)
- 'timedelta': 시간 간격 데이터 (timedelta64)
- 'category': 카테고리형 데이터
- 'bool': 논리형 데이터 (boolean)
- 'float', 'int', 'complex': 각각의 수치 데이터 타입
또한 np.number, np.object, np.bool_ 등의 numpy 데이터 타입을 사용할 수도 있습니다.
'python' 카테고리의 다른 글
python - 지수함수 실수로 변환하는 파이썬 코드 (0) | 2025.01.15 |
---|---|
python - class method (__init__, show, set, get) (2) | 2024.12.19 |
python - 중복 데이터 제거 함수 (drop_duplicates()) (0) | 2024.11.09 |
python - dropna() 결측치 제거 함수 (0) | 2024.11.09 |
python - 집계함수옵션 (numeric_only=True) vs select_dtypes 함수 (0) | 2024.11.08 |