[解決済み] ScrapyプロジェクトのデバッグにPyCharmを使用する方法
2022-11-20 15:45:20
質問
Scrapy 0.20をPython 2.7で動かしています。私はPyCharmが良いPythonデバッガを持っていることを知りました。私はそれを使って私のScrapyスパイダーをテストしたい。誰かがそれを行う方法を知っていますか?
私が試したこと
実は、スパイダーをスクリプトとして実行することを試してみました。その結果、そのスクリプトをビルドしてみました。そして、このようなモデルとしてScrapyのプロジェクトをPyCharmに追加してみました。File->Setting->Project structure->Add content root.
しかし、他に何をしなければならないかわからない。
どうすればいいのでしょうか?
この
scrapy
コマンドは Python スクリプトであり、PyCharm 内部から起動できます。
scrapyのバイナリ(
which scrapy
) を調べると、これが実際にはpythonスクリプトであることに気づくでしょう。
#!/usr/bin/python
from scrapy.cmdline import execute
execute()
これは、以下のようなコマンドは
scrapy crawl IcecatCrawler
はこのように実行することもできます。
python /Library/Python/2.7/site-packages/scrapy/cmdline.py crawl IcecatCrawler
scrapy.cmdlineのパッケージを探してみてください。
私の場合、場所はここでした。
/Library/Python/2.7/site-packages/scrapy/cmdline.py
そのスクリプトを script として PyCharm 内に run/debug 設定を作成します。スクリプトのパラメータにscrapyコマンドとspiderを記入します。この場合
crawl IcecatCrawler
.
このように
ブレイクポイントをクローリングコードの任意の場所に置けば、うまくいくはずです™。
関連
-
[解決済み] プログラムの実行やシステムコマンドの呼び出しはどのように行うのですか?
-
[解決済み] リストのリストからフラットなリストを作るには?
-
[解決済み] 辞書を値で並べ替えるにはどうしたらいいですか?
-
[解決済み] リストが空かどうかを確認するにはどうすればよいですか?
-
[解決済み] Node.jsアプリケーションをデバッグするにはどうすればよいですか?
-
[解決済み】ネストされたディレクトリを安全に作成するには?
-
[解決済み】2つの辞書を1つの式でマージする(辞書の和をとる)には?)
-
[解決済み] PythonでのAWS Lambdaのインポートモジュールエラー
-
[解決済み] 2つの線分が交差しているかどうかを確認するにはどうすればよいですか?
-
[解決済み] Pythonの構文に新しいステートメントを追加することはできますか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] PythonでのAWS Lambdaのインポートモジュールエラー
-
[解決済み] Pythonのマルチプロセッシングプールimap_unorderedの呼び出しの進捗を表示しますか?
-
[解決済み] Pythonの構文に新しいステートメントを追加することはできますか?
-
[解決済み] Pythonの要素別タプル演算(sumなど
-
[解決済み] 小数点以下1桁を取得する[重複]。
-
[解決済み] タプルのリストを複数のリストに変換するには?
-
[解決済み] subprocess.run()の出力を抑制またはキャプチャするには?
-
[解決済み] djangoフレームワークでフォームフィールドから値を取得するには?
-
[解決済み] Pandasを使って、既存のExcelファイルに新しいシートを保存する方法は?
-
[解決済み] Pythonで、ウェブサイトが404か200かを確認するためにurllibをどのように使用しますか?