Groupby와 unstack()을 활용하여 데이터를 핸들링 해보자
타이타닉 데이터에서 성별,생존여부에 따른 나이대의 평균을 groupy를 통해 구하면 아래코드와 같다
df = pd.read_csv('../../Data/titanic_train.csv')
df.groupby(['Sex','Survived'])['Age'].mean()
이렇게 groupby한 결과물도 DataFrame이다. 이걸 DataFrame 즉, matrix 형태로 변환시키기 위해 unstack 메서드를 사용한다
new_df = df.groupby(['Sex','Survived'])['Age'].mean().unstack()
이렇게 하면 'Sex' 와 'Survivied'를 index,column으로 가지는 DataFrame을 얻을 수 있다.
'Python > 그때 이걸 알았더라면..' 카테고리의 다른 글
[Python] 리스트 내 리스트들 합치기 (0) | 2020.04.09 |
---|---|
[Pandas] Insert 활용하기 (0) | 2020.04.09 |
[Pandas] apply 사용 시 index 활용 꿀팁 (0) | 2020.03.28 |
[Pandas] map을 활용하여 DataFrame & Series Data Handling (0) | 2020.02.26 |
[Python] sort와 sorted (0) | 2020.02.24 |