[解決済み] Pandas: グループ・バイとピボット・テーブルの違い

2023-04-28 13:30:34

質問

私はPandasを学び始めたばかりですが、以下のような違いがあるのでしょうか？ groupby() と pivot_table() という関数があります。どなたか、これらの違いを理解する手助けをしていただけませんか？ヘルプをお願いします。

どのように解決するのですか？

どちらも pivot_table と groupby はデータフレームを集約するために使用されます。違いは結果の形状に関してのみです。

を使って pd.pivot_table(df, index=["a"], columns=["b"], values=["c"], aggfunc=np.sum) を使うと、テーブルが作成されます。 a が行軸になる。 b が列の軸で、その値は c .

例です。

df = pd.DataFrame({"a": [1,2,3,1,2,3], "b":[1,1,1,2,2,2], "c":np.random.rand(6)})
pd.pivot_table(df, index=["a"], columns=["b"], values=["c"], aggfunc=np.sum)

b         1         2
a                    
1  0.528470  0.484766
2  0.187277  0.144326
3  0.866832  0.650100

使用方法 groupby を使うと、与えられた次元が列に配置され、それらの次元の組み合わせごとに行が作成されます。

この例では、値の合計の系列を作成します。 c のすべてのユニークな組み合わせでグループ化された a と b .

df.groupby(['a','b'])['c'].sum()

a  b
1  1    0.528470
   2    0.484766
2  1    0.187277
   2    0.144326
3  1    0.866832
   2    0.650100
Name: c, dtype: float64

同様の使い方をする groupby を省略した場合です。 ['c'] . のユニークな値でグループ化された残りのすべてのカラムの合計のデータフレーム（系列ではない）が作成されます。 a と b .

print df.groupby(["a","b"]).sum()
            c
a b          
1 1  0.528470
  2  0.484766
2 1  0.187277
  2  0.144326
3 1  0.866832
  2  0.650100

[解決済み] Pandas: グループ・バイとピボット・テーブルの違い

質問

どのように解決するのですか？

関連

[解決済み] 関数デコレータを作成し、それらを連鎖させるには？

[解決済み] staticmethodとclassmethodの違いについて

[解決済み] PandasでDataFrameの行を反復処理する方法

[解決済み] 最小限の驚き」と「変更可能なデフォルトの引数

[解決済み] リストを均等な大きさの塊に分割するには？

[解決済み] Pandasのカラム名のリネーム

[解決済み] pandasを使った "大量データ "ワークフロー【終了しました

[解決済み】strとreprの違いは何ですか？

[解決済み] Pythonの辞書にあるスレッドセーフについて

[解決済み] Django filter queryset __in for every item in list

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み] バブルソートの宿題

[解決済み] Pythonの要素別タプル演算（sumなど

[解決済み] Django 1.7で初期マイグレーションからマイグレートバックする方法は？

[解決済み] CSVデータを処理する際、1行目のデータを無視する方法を教えてください。

[解決済み] Pythonによる一対のクロスプロダクト [重複] (英語)

[解決済み] virtualenv の `--no-site-packages` オプションを元に戻す。

[解決済み] Python 言語を決定するには？

[解決済み] Pythonの辞書にあるスレッドセーフについて

[解決済み] 認証プラグイン 'caching_sha2_password' はサポートされていません。

[解決済み] Pythonでリストが空かどうかをチェックする方法は？重複