[解決済み] HadoopのMapreduceジョブでJVMを再利用する。
2022-02-07 20:18:37
質問内容
JVMを再利用するために、プロパティ "mapred.job.reuse.jvm.num.tasks" を設定できることは承知しています。私の質問は次のとおりです。
(1) ここに設定するタスクの数はどのように決めるのでしょうか。-1や他の正の整数がありますか?
(2) Mapreduceジョブにおいて、すでにJVMを再利用し、このプロパティを-1の値に設定することは良いアイデアでしょうか?
ありがとうございました。
解決方法は?
もし、非常に小さなタスクがあり、間違いなく互いに続いて実行される場合、このプロパティを-1に設定すると便利です(生成されたJVMが無制限に再利用されることを意味します)。 つまり、(タスクの数)-JVMの代わりに、(ジョブが利用できるクラスタ内のタスクの数)-JVMを生成すればいいのです。
これは大きな性能向上です。長時間稼働するジョブでは、新しいJVMをセットアップするのに比べて実行時間の割合は非常に低いので、大きな性能向上は望めません。
また、長時間稼働するタスクでは、ヒープの断片化などの問題でパフォーマンスが低下するため、タスク・プロセスを再作成するのがよいでしょう。
また、中途半端な時間稼動のジョブがある場合、2-3個のタスクだけを再利用することも可能で、良いトレードオフの関係にあると言えます。
関連
-
[解決済み] JVM起動時のパラメータ「-Xms」「-Xmx」とは何ですか?
-
[解決済み] Swift Betaのパフォーマンス:配列のソート
-
[解決済み] JVMターゲット1.8でビルドされたバイトコードをJVMターゲット1.6でビルドされているバイトコードにインライン化することができない
-
[解決済み] πの値を最も早く求める方法は何ですか?
-
[解決済み] Intel CPU の _mm_popcnt_u64 で、32 ビットのループカウンターを 64 ビットに置き換えると、パフォーマンスが著しく低下します。
-
[解決済み】HTTPとHTTPSのパフォーマンス比較
-
[解決済み】2つの範囲が重なっているかどうかをテストする最も効率的な方法は何ですか?
-
[解決済み] 与えられた数の除数の数を計算するアルゴリズム
-
[解決済み] Scalaのlazy valの(隠れた)代償は何なのか?
-
[解決済み] Apache Spark: map vs mapPartitions?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] 実行時間(高速化)の計算方法
-
[解決済み] HadoopのMapreduceジョブでJVMを再利用する。
-
[解決済み] spark.sql.shuffle.partitionsとspark.default.parallelismの違いは何ですか?
-
[解決済み】JSFがゲッターを複数回呼び出す理由
-
[解決済み] 3Dゲームってなんであんなに効率的なの?[クローズド]
-
[解決済み] gccのffast-mathは実際に何をするのですか?
-
[解決済み] t-sqlのクエリ実行にかかる時間の測定
-
[解決済み] x86アセンブリでレジスタをゼロに設定するには、xor、mov、andのどれが一番良い方法ですか?
-
[解決済み】2次元の点がポリゴン内にあるかどうかを判断するにはどうしたらいいですか?
-
[解決済み] フィボナッチヒープを実際に効率よく実装した人はいますか?