[解決済み] Pandas: グループ・バイとピボット・テーブルの違い
2023-04-28 13:30:34
質問
私はPandasを学び始めたばかりですが、以下のような違いがあるのでしょうか?
groupby()
と
pivot_table()
という関数があります。どなたか、これらの違いを理解する手助けをしていただけませんか?
ヘルプをお願いします。
どのように解決するのですか?
どちらも
pivot_table
と
groupby
はデータフレームを集約するために使用されます。違いは結果の形状に関してのみです。
を使って
pd.pivot_table(df, index=["a"], columns=["b"], values=["c"], aggfunc=np.sum)
を使うと、テーブルが作成されます。
a
が行軸になる。
b
が列の軸で、その値は
c
.
例です。
df = pd.DataFrame({"a": [1,2,3,1,2,3], "b":[1,1,1,2,2,2], "c":np.random.rand(6)})
pd.pivot_table(df, index=["a"], columns=["b"], values=["c"], aggfunc=np.sum)
b 1 2
a
1 0.528470 0.484766
2 0.187277 0.144326
3 0.866832 0.650100
使用方法
groupby
を使うと、与えられた次元が列に配置され、それらの次元の組み合わせごとに行が作成されます。
この例では、値の合計の系列を作成します。
c
のすべてのユニークな組み合わせでグループ化された
a
と
b
.
df.groupby(['a','b'])['c'].sum()
a b
1 1 0.528470
2 0.484766
2 1 0.187277
2 0.144326
3 1 0.866832
2 0.650100
Name: c, dtype: float64
同様の使い方をする
groupby
を省略した場合です。
['c']
. のユニークな値でグループ化された残りのすべてのカラムの合計のデータフレーム(系列ではない)が作成されます。
a
と
b
.
print df.groupby(["a","b"]).sum()
c
a b
1 1 0.528470
2 0.484766
2 1 0.187277
2 0.144326
3 1 0.866832
2 0.650100
関連
-
[解決済み] 関数デコレータを作成し、それらを連鎖させるには?
-
[解決済み] staticmethodとclassmethodの違いについて
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 最小限の驚き」と「変更可能なデフォルトの引数
-
[解決済み] リストを均等な大きさの塊に分割するには?
-
[解決済み] Pandasのカラム名のリネーム
-
[解決済み] pandasを使った "大量データ "ワークフロー【終了しました
-
[解決済み】__str__と__repr__の違いは何ですか?
-
[解決済み] Pythonの辞書にあるスレッドセーフについて
-
[解決済み] Django filter queryset __in for *every* item in list
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] バブルソートの宿題
-
[解決済み] Pythonの要素別タプル演算(sumなど
-
[解決済み] Django 1.7で初期マイグレーションからマイグレートバックする方法は?
-
[解決済み] CSVデータを処理する際、1行目のデータを無視する方法を教えてください。
-
[解決済み] Pythonによる一対のクロスプロダクト [重複] (英語)
-
[解決済み] virtualenv の `--no-site-packages` オプションを元に戻す。
-
[解決済み] Python 言語を決定するには?
-
[解決済み] Pythonの辞書にあるスレッドセーフについて
-
[解決済み] 認証プラグイン 'caching_sha2_password' はサポートされていません。
-
[解決済み] Pythonでリストが空かどうかをチェックする方法は?重複