1. ホーム
  2. scala

[解決済み] sparkでrddオブジェクトをdataframeに変換する方法

2022-03-02 14:42:30

質問

RDD()はどのように変換するのですか? org.apache.spark.rdd.RDD[org.apache.spark.sql.Row] ) をデータフレームに変換します。 org.apache.spark.sql.DataFrame . データフレームをrddに変換するには、次のようにします。 .rdd . それを処理した後、私はそれをデータフレームに戻したいです。どのように私はこれを行うことができますか?

解決方法は?

SparkSession には createDataFrame を作成するメソッドです。 DataFrame 与えられた RDD . あなたの文脈では、これらのいずれかが機能すると想像しています。

例えば

def createDataFrame(rowRDD: RDD[Row], schema: StructType): DataFrame

行を含む RDD から、指定された方法で DataFrame を作成します。 スキーマを使用します。