[解決済み] Spark DataFrameのgroupByと降順ソート(pyspark)
2022-10-09 03:57:01
質問
私はpyspark(Python 2.7.9/Spark 1.3.1)を使用しており、私は降順でフィルタリング&アンプ、ソートする必要があるデータフレームのGroupObjectを持っています。このコードの部分を介してそれを達成しようとしています。
group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False)
しかし、以下のようなエラーを投げます。
sort() got an unexpected keyword argument 'ascending'
どのように解決するのですか?
PySpark 1.3では
sort
メソッドは昇順のパラメータを取りません。このため
desc
メソッドを使うことができます。
from pyspark.sql.functions import col
(group_by_dataframe
.count()
.filter("`count` >= 10")
.sort(col("count").desc()))
または
desc
という関数があります。
from pyspark.sql.functions import desc
(group_by_dataframe
.count()
.filter("`count` >= 10")
.sort(desc("count"))
どちらの方法も、Spark >= 1.3 (Spark 2.xを含む)で使用することができます。
関連
-
[解決済み] Pythonのリストメソッドであるappendとextendの違いは何ですか?
-
[解決済み] 最小限の驚き」と「変更可能なデフォルトの引数
-
[解決済み] 辞書のリストを辞書の値でソートするにはどうしたらいいですか?
-
[解決済み] Pandas DataFrameの行数を取得する方法は?
-
[解決済み] データフレームの行を複数の列でソート(並び替え)する。
-
[解決済み】__str__と__repr__の違いは何ですか?
-
[解決済み] Spark DataFrameに新しいカラムを追加するにはどうすればよいですか(PySparkを使用)?
-
[解決済み] Spyderを仮想環境で動作させるには?
-
[解決済み] Python 2.7サポート終了?
-
[解決済み] 新しいpip backtrackingの実行時問題の解決
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] pandasのDataFrameから空のセルを含む行を削除する
-
[解決済み] Pythonのインスタンス変数とクラス変数
-
[解決済み] Django Rest Framework ファイルアップロード
-
[解決済み] 古いバージョンのPythonにおける辞書のキーの並び順
-
[解決済み] 範囲指定された浮動小数点数のランダムな配列を生成します。
-
[解決済み] subprocess.run()の出力を抑制またはキャプチャするには?
-
[解決済み] Pythonでファイルの読み込みと上書きをする
-
[解決済み] Python 言語を決定するには?
-
[解決済み] Pythonでランダムなファイル名を生成する最良の方法
-
[解決済み] pipの依存性/必要条件をリストアップする方法はありますか?