[解決済み] PySparkでテーブルのデータフレームをcsvにエクスポートするには?
2023-01-04 07:45:08
質問
Spark 1.3.1 (PySpark) を使用しており、SQLクエリを使用してテーブルを生成しました。私は今、オブジェクトが
DataFrame
. 私はこれをエクスポートしたい
DataFrame
オブジェクト (私はそれを "table" と呼んでいます) を csv ファイルにエクスポートして、それを操作して列をプロットできるようにしたいのです。どのように
DataFrame
table"をcsvファイルにエクスポートするにはどうしたらよいですか?
ありがとうございます。
どのように解決するのですか?
データフレームがドライバのメモリに収まり、ローカルファイルに保存したい場合は、以下のように変換します。
スパークデータフレーム
をローカルの
Pandasのデータフレーム
を使って
toPandas
メソッドを使用して、単純に
to_csv
:
df.toPandas().to_csv('mycsv.csv')
それ以外の場合は spark-csv :
-
スパーク1.3
df.save('mycsv.csv', 'com.databricks.spark.csv')
-
Spark 1.4+
df.write.format('com.databricks.spark.csv').save('mycsv.csv')
Spark 2.0+では、以下のように
csv
のデータソースを直接使用することができます。
df.write.csv('mycsv.csv')
関連
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか?
-
[解決済み] Matplotlibでプロットを表示するのではなく、画像ファイルに保存する。
-
[解決済み] データフレームを結合(マージ)する方法(内側、外側、左側、右側)
-
[解決済み] 既存のDataFrameに新しい列を追加する方法は?
-
[解決済み] 辞書のリストをpandasのDataFrameに変換する
-
[解決済み] pandasのDataFrameをCSVファイルに書き出す
-
[解決済み】ネストされたディレクトリを安全に作成するには?
-
[解決済み】pandasでカラムの種類を変更する
-
[解決済み] Pythonでコード行間にかかる時間を測定するには?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] Spark - repartition() vs coalesce()
-
[解決済み] Pandasのデータフレームでタプルの列を分割するにはどうしたらいいですか?
-
[解決済み] なぜ(0-6)は-6=偽なのか?重複
-
[解決済み] 文字列のリストを内容に基づいてフィルタリングする
-
[解決済み] Django 1.7で初期マイグレーションからマイグレートバックする方法は?
-
[解決済み] Ctrl-CでPythonスクリプトを終了できない
-
[解決済み] あるオブジェクトが数であるかどうかを確認する、最もパイソン的な方法は何でしょうか?
-
[解決済み] 単純な文字列からtimedeltaオブジェクトを作成する方法
-
[解決済み] 認証プラグイン 'caching_sha2_password' はサポートされていません。
-
[解決済み] Alembicアップグレードスクリプトでインサートやアップデートを実行するにはどうすればよいですか?