[解決済み] Spark コンテキスト 'sc' が定義されていない
2022-02-06 07:39:52
質問
Sparkの初心者ですが、以下のサイトを参考にPySparkをインストールしようとしています。
http://ramhiser.com/2015/02/01/configuring-ipython-notebook-support-for-pyspark/
ビルド済みのパッケージと、SBTを使用してSparkパッケージをビルドしてインストールしようとしました。
IPython Notebookでpythonのコードを実行しようとすると、以下のエラーが発生します。
NameError Traceback (most recent call last)
<ipython-input-1-f7aa330f6984> in <module>()
1 # Check that Spark is working
----> 2 largeRange = sc.parallelize(xrange(100000))
3 reduceTest = largeRange.reduce(lambda a, b: a + b)
4 filterReduceTest = largeRange.filter(lambda x: x % 7 == 0).sum()
5
NameError: name 'sc' is not defined
コマンドウィンドウで、以下のエラーが表示されます。
<strong>Failed to find Spark assembly JAR.</strong>
<strong>You need to build Spark before running this program.</strong>
を実行すると、scala のプロンプトが表示されることに注意してください。 スパークシェル コマンド
更新してください。
友人の助けにより、.ipython/profile_pyspark/startup/00-pyspark-setup.py ファイルの内容を修正することで、Spark assembly JAR に関する問題を修正することが出来ました。
これで、Spark Context変数の問題だけになりました。タイトルを変更し、現在の問題を適切に反映させます。
解決方法は?
一つの解決策は
pyspark-shell
をシェル環境変数PYSPARK_SUBMIT_ARGSに追加します。
export PYSPARK_SUBMIT_ARGS="--master local[2] pyspark-shell"
に変更があります。
python/pyspark/java_gateway.py
PYSPARK_SUBMIT_ARGS が必要な場合は、以下のようになります。
pyspark-shell
PYSPARK_SUBMIT_ARGS 変数がユーザによって設定された場合。
関連
-
[解決済み】spark.driver.maxResultSizeとは何ですか?
-
[解決済み] SparkでcreateOrReplaceTempViewはどのように動作するのですか?
-
[解決済み] PySparkのデータフレームで、各キーのパーセンタイルはどのように計算されますか?
-
[解決済み] Spark が "java.net.URISyntaxException" を報告するのはなぜですか?DataFrameを使用する際に「java.net.URIStyntaxException: Relative path in absolute URI」と表示されるのはなぜですか?
-
[解決済み] Apache SparkとAkkaの比較【終了しました
-
[解決済み] Spark: 2つのDataFrameを減算する
-
[解決済み] Sparkのバージョンを確認する方法【終了しました
-
[解決済み] spark.yarn.executor.memoryOverhead "の設定値?
-
[解決済み] TypeError: 'Column' オブジェクトは WithColumn を使用して呼び出すことができません。
-
[解決済み] プロパティspark.yarn.jars - どのようにそれに対処するのですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】spark.driver.maxResultSizeとは何ですか?
-
[解決済み] PySparkのデータフレームで、各キーのパーセンタイルはどのように計算されますか?
-
[解決済み] Spark コンテキスト 'sc' が定義されていない
-
[解決済み] Spark: 2つのDataFrameを減算する
-
[解決済み] sparkでsaveAsTextFileするときのファイル名の付け方は?
-
[解決済み] ShuffledRDD、MapPartitionsRDD、ParallelCollectionRDDの違いは何ですか?
-
[解決済み] spark.yarn.executor.memoryOverhead "の設定値?
-
[解決済み] TypeError: 'Column' オブジェクトは WithColumn を使用して呼び出すことができません。
-
[解決済み] プロパティspark.yarn.jars - どのようにそれに対処するのですか?
-
[解決済み] 複数のテキストファイルを1つのRDDに読み込むには?