Pandasでデータ解析
簡単な集計
Pandasを使用した簡単な集計をみていきます。
df['xxx'].value_counts()
上記の処理では任意の列を対象に集計し、各項目がいくつ存在するかを取得することができます。
df.groupby(['xxx'])['yyy'].sum()
上記の処理ではxxx列の項目ごとに集計しその各合計値を求めます。また、sum()をmean()にすることで平均値を
求めることができるようになります。
※合計/平均集計をする際は必ず対象の項目が数値型であることを確認する必要があります。