본문 바로가기

Python/그때 이걸 알았더라면..

[Pandas] Groupby 와 unstack 활용

Groupby와 unstack()을 활용하여 데이터를 핸들링 해보자

 

타이타닉 데이터에서 성별,생존여부에 따른 나이대의 평균을 groupy를 통해 구하면 아래코드와 같다

df = pd.read_csv('../../Data/titanic_train.csv')

df.groupby(['Sex','Survived'])['Age'].mean()

 

이렇게 groupby한 결과물도 DataFrame이다. 이걸 DataFrame 즉, matrix 형태로 변환시키기 위해 unstack 메서드를 사용한다

 

new_df = df.groupby(['Sex','Survived'])['Age'].mean().unstack()

 

이렇게 하면 'Sex' 와 'Survivied'를 index,column으로 가지는 DataFrame을 얻을 수 있다.