[解決済み] PySpark DataFrameの集約の列の名前の変更
2023-03-20 19:27:25
質問
PySparkのDataFrameを使ってデータを解析しています。例えば、以下のようなDataFrameがあるとします。
df
があって、それを集計しているとします。
(df.groupBy("group")
.agg({"money":"sum"})
.show(100)
)
これで
group SUM(money#2L)
A 137461285853
B 172185566943
C 271179590646
集計はうまくいきますが、新しいカラム名である
SUM(money#2L)
. このカラムを人間が読めるような名前に変更する方法はありますか?
.agg
メソッドから人間が読めるような名前に変更する方法はありますか?たぶん、もっと似たようなことを
dplyr
:
df %>% group_by(group) %>% summarise(sum_money = sum(money))
どのように解決するのですか?
私はまだ dplyr 構文が好きですが、このコードスニペットで十分です。
import pyspark.sql.functions as sf
(df.groupBy("group")
.agg(sf.sum('money').alias('money'))
.show(100))
冗長になる。
関連
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか?
-
[解決済み] Pandasのカラム名のリネーム
-
[解決済み] Pandas DataFrameからカラムを削除する
-
[解決済み] Pandasのデータフレームで複数の列を選択する
-
[解決済み] Pandas DataFrameの行数を取得する方法は?
-
[解決済み] データフレームの行を複数の列でソート(並び替え)する。
-
[解決済み】Pandas DataFrameのカラムヘッダからリストを取得する。
-
[解決済み】SparkのDataFrame、Dataset、RDDの違いについて
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン