1. ホーム
  2. python

[解決済み] パンダのGroupbyと1列の和の計算

2023-06-04 18:10:46

質問

以下のようなデータフレームdf1があります。

       A      B      C
1     foo    12    California
2     foo    22    California
3     bar    8     Rhode Island
4     bar    32    Rhode Island
5     baz    15    Ohio
6     baz    26    Ohio

A列でグループ化し、C列の値を保持したままB列を合計したいのですが、こんな感じです。

      A       B      C
1    foo     34    California
2    bar     40    Rhode Island
3    baz     41    Ohio

問題は、df.groupby('A').sum()と言ったときに、C列が削除されて戻ってくることです。

      B
A
bar  40
baz  41
foo  34

グループ化と合計を行う際に、C列を維持するにはどうしたらよいでしょうか?

どのように解決するのですか?

Cをgroupbyに含めるしかないでしょう(groupby関数はリストを受け取ることができます)。

これを試してみてください。

df.groupby(['A','C'])['B'].sum()

もうひとつ、集計後に df を扱う必要がある場合は、集計のために as_index=False オプションを使って、データフレームオブジェクトを返すことができます。これは、私が初めてPandasを使ったときに問題を起こしました。例を挙げます。

df.groupby(['A','C'], as_index=False)['B'].sum()