[解決済み] RDD のインスタンスが必要だが、クラス 'pyspark.rdd.PipelinedRDD' が返された。
2022-02-09 16:06:34
質問
こんにちは、私はノートブックでこのコードを持っているとpythonのスパークをコーディングするためにtraying。
mydataNoSQL.createOrReplaceTempView("mytable")
spark.sql("SELECT * from mytable")
return mydataNoSQL
def getsameData(df,spark):
result = spark.sql("select * from mytable where temeperature is not null")
return result.rdd.sample(False, 0.1).map(lambda row : (row.temperature))
RDD のインスタンスが必要ですが、クラス 'pyspark.rdd.PipelinedRDD' が表示されます。
何かお手伝いできることがあれば、よろしくお願いします。
解決方法は?
pyspark.rdd.PipelinedRDD
のサブクラスです。
RDD
で定義されたすべての API を備えていなければなりません。たとえば、PipelinedRDD は
RDD
に対してmap関数を実行すると作成されます。
RDD
.
例えば、以下のスニペットを見てください。
>>> rdd = spark.sparkContext.parallelize(range(1,10))
>>> type(rdd)
<class 'pyspark.rdd.RDD'> ## the type is RDD here
>>> rdd = rdd.map(lambda x: x * x)
>>> type(rdd)
<class 'pyspark.rdd.PipelinedRDD'> ## after the map operation the type is changed to pyspark.rdd.PipelinedRDD
ということで
pyspark.rdd.PipelinedRDD
と同じように
RDD
をコードに追加してください。
Pythonは動的型付け言語であるため、完全なキャスティングのサポートはありません。
pyspark.rdd.PipelinedRDD
を通常のRDDに変換し、rddに集めて並列化することができます。
>>> rdd = spark.sparkContext.parallelize(rdd.collect())
>>> type(rdd)
<class 'pyspark.rdd.RDD'>
実行中
collect
が発生することがあります。
MemoryError
は、RDD のデータが大きい場合。
関連
-
PicgoのイメージベッドツールをPythonで実装する
-
[解決済み】ilocが「IndexError: single positional indexer is out-of-bounds」を出す。
-
[解決済み] 'DataFrame' オブジェクトに 'sort' 属性がない
-
[解決済み] 'int'オブジェクトに'__getitem__'属性がない。
-
[解決済み] TypeError: 'DataFrame' オブジェクトは呼び出し可能ではない
-
[解決済み】Flask ImportError: Flask という名前のモジュールがない
-
[解決済み】Python: OverflowError: 数学の範囲エラー
-
[解決済み] Pythonで静的なクラス変数は可能ですか?
-
[解決済み] インスタンスのクラス名を取得する?
-
[解決済み】SparkのDataFrame、Dataset、RDDの違いについて
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
PythonによるLeNetネットワークモデルの学習と予測
-
ピロウズ画像色処理の具体的な活用方法
-
Python カメの描画コマンドとその例
-
Pythonを使って簡単なzipファイルの解凍パスワードを手作業で解く
-
PyQt5はユーザーログインGUIインターフェースとログイン後のジャンプを実装しています。
-
[解決済み] _tkinter.TclError: 表示名がなく、$DISPLAY環境変数もない。
-
[解決済み】socket.error: [Errno 48] アドレスはすでに使用中です。
-
[解決済み】csv.Error:イテレータはバイトではなく文字列を返すべき
-
[解決済み】Django: ImproperlyConfigured: SECRET_KEY 設定は空であってはならない
-
[解決済み】SyntaxError: デフォルト以外の引数がデフォルトの引数に続く