[解決済み] Apache SparkでDataframeのカラム値をListとして抽出する。
2022-11-25 16:50:26
質問
データフレームの文字列列をリストに変換したい。私がから見つけることができるもの
Dataframe
APIから得られるのはRDDなので、まずRDDに変換し直して、そこに
toArray
関数をRDDに適用してみました。この場合、長さやSQLは問題なく動作します。しかし、RDDから得られた結果は、以下のようにすべての要素が角括弧で囲まれています。
[A00001]
. カラムをリストに変換する適切な方法、または角括弧を削除する方法はないかと考えていました。
何かご提案がありましたら、よろしくお願いします。ありがとうございます!
どのように解決するのですか?
これは単一のリストを含むコレクションを返すはずです。
dataFrame.select("YOUR_COLUMN_NAME").rdd.map(r => r(0)).collect()
マッピングがなければ、データベースからのすべてのカラムを含むRowオブジェクトを取得するだけです。
これはおそらくAnyタイプのリストを取得することになることを覚えておいてください。結果の型を指定したい場合は、.asInstanceOf[YOUR_TYPE] を使って
r => r(0).asInstanceOf[YOUR_TYPE]
マッピング
追伸: 自動変換により
.rdd
の部分をスキップできます。
関連
-
[解決済み] DataFrameのパーティショニングはどのように定義するのですか?
-
[解決済み] 依存するメソッドタイプの説得力のある使用例とは?
-
[解決済み] ネストした構造体をよりきれいに更新する方法
-
[解決済み] Scalaの配列の初期化
-
[解決済み] Scalaです。リスト[Future]からFuture[List]への変換は、失敗したFutureを無視する。
-
[解決済み] private[this] vs private
-
[解決済み] Any、AnyVal、AnyRef、Objectの関係と、Javaコードでのマッピングについて教えてください。
-
[解決済み] sbtとGradleの比較 [終了しました]。
-
[解決済み] Scalaのcaseクラスを宣言することのデメリットは何ですか?
-
[解決済み] Scalaでimmutable.Mapをmutable.Mapに変換するにはどうしたらいいですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] RDDの内容を印刷するには?
-
[解決済み] IntelliJ IDEAで依存関係が変更された後、build.sbtから強制的に再ロードするには?
-
[解決済み] ネストした構造体をよりきれいに更新する方法
-
[解決済み] Scalaの配列の初期化
-
[解決済み] Scalaです。リスト[Future]からFuture[List]への変換は、失敗したFutureを無視する。
-
[解決済み] HDFSではなく、ローカルファイルをsc.textFileで読み込む方法
-
[解決済み] 機能的デザインパターン【終了しました
-
[解決済み] 末尾再帰関数が最適化されるためのScalaアノテーションは何ですか?
-
[解決済み] Scalaでリストを2つのフィールドでソートするには?
-
[解決済み] Scalaでimmutable.Mapをmutable.Mapに変換するにはどうしたらいいですか?