Pandas Apply 함수 정리
Pandas Apply 함수를 정리하자
Pandas를 쓰다보면 데이터 전처리 과정에서 apply 함수를 쓰는 것을 볼 수 있다. 수치 데이터의 배열의 합계나 평균 등 일반적인 통계는 DataFrame 내 함수를 사용하지만 데이터 전처리 과정에서 개발자가 만드는 함수는 Apply, Map, ApplyMap 등과 같은 함수를 사용하여 DataFrame에 적용한다. 오늘은 이 과정중 하나인 apply 함수를 정리해보려고 한다. ——————————-
Apply 함수는 커스텀 함수가 복수의 DataFrame의 컬럼을 사용할때 사용한다.
** 아래의 코드는 Udacity의 DataScience Nanodegree 중의 나온 실습 파일에서 발췌했다.
def higher_ed(formal_ed_str): if formal_ed_str in (“Master’s degree”, “Professional degree”): return 1 else: return 0
df[“FormalEducation”].apply(higher_ed)[:5]
석사 과정 혹은 학위관련 프로그램에 formal_ed_str가 있다면 1을 반환하고 그렇지 않은 경우는 0을 반환하는 데이터 전처리 함수인데 커스텀 함수이기 때문에 DataFrame에 적용하는데 Apply 함수를 활용한 것을 볼 수 있다.