본문 바로가기

python26

python - timedelta (시간의 차이를 구하는데 최적화된 함수) 2024. 11. 5.
python - data slicing (loc 와 iloc) loc는 문자를 인식! iloc는 숫자를 순서대로 인식한다는 개념을 분명히 구분해야 한다. loc에서 대괄호 안의 0은 인덱스명을 의미한다. 그러나 iloc에서 대괄호 안의 0은 순서를 의미한다. iloc에서 0은 첫번째 행(또는 컬럼), 1은 두번쨰 행(또는 컬럼) 방식인식 방법범위예시loc인덱스명, 컬럼명끝 인덱스까지 포함해서 인식loc[0:2]일 때, 2를 포함하는 것이고 여기서 2는 숫자적 2가 아니라, 텍스트의 2로 인식되어야 한다. (0,1,2 index 행이 추출)iloc인덱스 번호(위치 숫자), 컬럼번호(위치숫자)번호는 0부터 시작끝 인덱스를 포함하지 않음iloc[0:2]일때, 2가 미포함된다. (0,1이 포함) loc  : 특정 행을 기준으로 가져오는 함수 (컬럼 명칭을 활용)loc [행.. 2024. 11. 5.
python - data indexing할때 각괄호 주의점 <list와 series> 컬럼을 1개만 불러올 것인지, 여러개 불러 올 것인지 이에 따라 각괄호 수를 달리 해야함.다시말해 각괄호 한개만 써서 불러올 때랑 각 괄호 두개만 써서 불러올 때의 데이터 타입 차이점을 알아보자. ex.  emp라는 dataframe의 데이터 구성과 열 목록이 아래와 같을때, 이중, empno라는 단 한개의 열을 불러 올때 각괄호 한개만 쓰면 데이터 타입은 Series 하나의 열만 갖는 Series!각괄호 두개 쓰면 데이터 타입은 DataFrame!   그렇다면 이번에는 데이터에서 여러개의 컬럼 값을 불러오고 싶을 때각괄호 한개 썼을 때랑, 두개 썼을 때를 비교해보자. 두개 이상의 칼럼을 불러올 때 각괄호 하나 쓰면 아래와 같이 에러 발생한다. 여러 개 컬럼 불러 올 때 각괄호 두개 써야지 데이터프레임.. 2024. 11. 4.
python - 집합 연산자 ▩ 판다스의 집합 연산자               SQL                          vs                 판다스 1.  union all (중복제거x)                                  pd.concat 2.  union (중복제거o)                                      pd.concat + drop_duplicates()3.  intersect                                            아래의 코드 4.  minus                                                아래의 코드  예시1. union all   lg가 두번 나옴! 중복제거 안했기 때문에.. 2024. 11. 4.