[解決済み] Apache Spark: map vs mapPartitions?
2022-04-26 09:11:55
質問
とはどう違うのですか?
RDDの
map
と
mapPartitions
というメソッドがあるのですか?そして
flatMap
のように動作します。
map
または
mapPartitions
? ありがとうございます。
(編集) つまり、次の2つの違いは何ですか(意味的にも実行面でも)?
def map[A, B](rdd: RDD[A], fn: (A => B))
(implicit a: Manifest[A], b: Manifest[B]): RDD[B] = {
rdd.mapPartitions({ iter: Iterator[A] => for (i <- iter) yield fn(i) },
preservesPartitioning = true)
}
そして
def map[A, B](rdd: RDD[A], fn: (A => B))
(implicit a: Manifest[A], b: Manifest[B]): RDD[B] = {
rdd.map(fn)
}
解決方法は?
<ブロッククオートRDDのmapメソッドとmapPartitionsメソッドの違いは何ですか?
メソッドは 地図 は、それぞれの 要素 を関数の適用により結果RDDの1つの要素に変換します. マップパーティション は、それぞれの パーティション を、結果の複数の要素に変換する。
また、flatMapはmapのように動作するのでしょうか、それともmapPartitionsのように動作するのでしょうか?
どちらでもない。
フラットマップ
は単一の要素で動作します (
map
のように)、結果の複数の要素を生成します。
mapPartitions
).
関連
-
[解決済み] 効率的なアウトオブコアソーティング
-
[解決済み] Spark - repartition() vs coalesce()
-
[解決済み】HTTPとHTTPSのパフォーマンス比較
-
[解決済み】SparkのDataFrame、Dataset、RDDの違いについて
-
[解決済み】Goはどうしてそんなに早くコンパイルできるのですか?
-
[解決済み】ウェブサイトのストレステストに最適な方法【重複あり
-
[解決済み] gccのffast-mathは実際に何をするのですか?
-
[解決済み] Scalaのlazy valの(隠れた)代償は何なのか?
-
[解決済み】2次元の点がポリゴン内にあるかどうかを判断するにはどうしたらいいですか?
-
[解決済み] あなたが見た中で最も馬鹿げたペシミゼーションは何ですか?[閉店]
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] spark.sql.shuffle.partitionsとspark.default.parallelismの違いは何ですか?
-
[解決済み】x86_64アセンブリで無駄なMOV命令を導入すると、なぜタイトループが速くなるのでしょうか?
-
[解決済み】ウェブサイトのストレステストに最適な方法【重複あり
-
[解決済み】インターネット接続が遅い場合のシミュレーション【終了しました
-
[解決済み】GHCコアの読み込み
-
[解決済み】なぜMATLABは行列の乗算が速いのか?
-
[解決済み] 与えられた数の除数の数を計算するアルゴリズム
-
[解決済み] SSLはどれくらいのオーバーヘッドを発生させるのですか?
-
[解決済み] x86アセンブリでレジスタをゼロに設定するには、xor、mov、andのどれが一番良い方法ですか?
-
[解決済み] TeamViewerはどうしてこんなに速いのですか?