[解決済み] Python Pandas groupby操作の結果を親データフレームのカラムに戻すには？

2023-01-07 04:43:24

質問

IPythonで以下のようなデータフレームを持っています。

In [261]: bdata
Out[261]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 21210 entries, 0 to 21209
Data columns:
BloombergTicker      21206  non-null values
Company              21210  non-null values
Country              21210  non-null values
MarketCap            21210  non-null values
PriceReturn          21210  non-null values
SEDOL                21210  non-null values
yearmonth            21210  non-null values
dtypes: float64(2), int64(1), object(4)

私は、"yearmonth"列の各日付ごとに、すべてにわたるキャップ加重平均リターンを計算するgroupby操作を適用したいです。

これは期待通りに動作します。

In [262]: bdata.groupby("yearmonth").apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())
Out[262]:
yearmonth
201204      -0.109444
201205      -0.290546

しかし、私はこれらの値を元のデータフレームのインデックスに戻し、日付が一致する定数カラムとして保存するように並べ替えたいと考えています。

In [263]: dateGrps = bdata.groupby("yearmonth")

In [264]: dateGrps["MarketReturn"] = dateGrps.apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
/mnt/bos-devrnd04/usr6/home/espears/ws/Research/Projects/python-util/src/util/<ipython-input-264-4a68c8782426> in <module>()
----> 1 dateGrps["MarketReturn"] = dateGrps.apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())

TypeError: 'DataFrameGroupBy' object does not support item assignment

この素朴な代入はうまくいかないはずだと理解しています。しかし、groupby操作の結果を親データフレーム上の新しい列に代入するためのPandasのイディオムは何でしょうか？

最終的に、私は、groupby操作の出力と一致する日付を持つすべてのインデックスに対して繰り返される一定の値である、"MarketReturn"という列が欲しいのです。

これを達成するための1つのハックは、次のようになります。

marketRetsByDate  = dateGrps.apply(lambda x: (x["PriceReturn"]*x["MarketCap"]/x["MarketCap"].sum()).sum())

bdata["MarketReturn"] = np.repeat(np.NaN, len(bdata))

for elem in marketRetsByDate.index.values:
    bdata["MarketReturn"][bdata["yearmonth"]==elem] = marketRetsByDate.ix[elem]

しかし、これでは遅いし、悪いし、Pythonicらしくない。

どのように解決するのですか？

In [97]: df = pandas.DataFrame({'month': np.random.randint(0,11, 100), 'A': np.random.randn(100), 'B': np.random.randn(100)})

In [98]: df.join(df.groupby('month')['A'].sum(), on='month', rsuffix='_r')
Out[98]:
           A         B  month       A_r
0  -0.040710  0.182269      0 -0.331816
1  -0.004867  0.642243      1  2.448232
2  -0.162191  0.442338      4  2.045909
3  -0.979875  1.367018      5 -2.736399
4  -1.126198  0.338946      5 -2.736399
5  -0.992209 -1.343258      1  2.448232
6  -1.450310  0.021290      0 -0.331816
7  -0.675345 -1.359915      9  2.722156

[解決済み] Python Pandas groupby操作の結果を親データフレームのカラムに戻すには？

質問

どのように解決するのですか？

関連

[解決済み] PandasでDataFrameの行を反復処理する方法

[解決済み] Pandasのデータフレームで複数の列を選択する

[解決済み] Pandas DataFrameの行数を取得する方法は？

[解決済み] 既存のDataFrameに新しい列を追加する方法は？

[解決済み] Pandas DataFrameの特定の列の値がNaNである行を削除する方法

[解決済み] PandasのGroupByの出力をSeriesからDataFrameに変換する

[解決済み】Pandas DataFrameのより多くの列を見るために出力表示を拡大する方法は？

[解決済み] Pythonによる一対のクロスプロダクト [重複] (英語)

[解決済み] matplotlib でプロットの軸、目盛、ラベルの色を変更する方法

[解決済み] virtualenv の `--no-site-packages` オプションを元に戻す。

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み] 2つの線分が交差しているかどうかを確認するにはどうすればよいですか？

[解決済み] Pythonのキャッシュライブラリはありますか？

[解決済み] Djangoで2つの日付の間を選択する

[解決済み] Spyderを仮想環境で動作させるには？

[解決済み] dict を txt ファイルに書き、それを読み取る？

[解決済み] 小数点以下1桁を取得する[重複]。

[解決済み] Python 2.7サポート終了？

[解決済み] ファブリック経由でデプロイユーザとしてvirtualenvを有効化する

[解決済み] Jupyter (IPython)ノートブックのセッションをpickleして保存する方法

[解決済み] 単純な文字列からtimedeltaオブジェクトを作成する方法