[解決済み] BeautifulSoupとScrapyのクローラの違い?
2022-03-07 22:01:45
質問
amazonとe-bayの商品価格を比較表示するサイトを作りたいのですが、どうすればいいですか? どちらが効果的か、またその理由を教えてください。私は、以下のことに多少精通しています。 ビューティフルスープ にはあまり詳しくないのですが Scrapyクローラー .
解決方法は?
Scrapy は、ウェブスパイダーや ウェブスクレイパーフレームワーク Scrapyにクロールを開始するルートURLを与え、クロールして取得したいURLの数などの制約を指定することができます。これは、ウェブスクレイピングのための完全なフレームワークです。 クローリング .
一方
ビューティフルスープ は パージングライブラリ も、URLから内容を取得するのにかなり良い仕事をしてくれますし、手間をかけずに特定の部分をパースすることができます。これは、あなたが与えたURLの内容を取得し、その後停止するだけです。手動で特定の条件で無限ループに入れない限り、クロールはしません。
簡単に言うと、Beautiful Soupを使えば、Scrapyと同じようなものを作ることができます。 Beautiful Soupは ライブラリ 一方、Scrapyは 完全なフレームワーク .
関連
-
[解決済み] 関数デコレータを作成し、それらを連鎖させるには?
-
[解決済み] staticmethodとclassmethodの違いについて
-
[解決済み] Pythonのリストメソッドであるappendとextendの違いは何ですか?
-
[解決済み] 0から9までのランダムな整数を生成する
-
[解決済み] mixinとは何か、なぜ有用なのか?
-
[解決済み] リストにおけるdel、remove、popの違いについて
-
[解決済み] Pythonのsuper()は多重継承でどう動くのか?
-
[解決済み] リストとタプルの違いは何ですか?
-
[解決済み】__str__と__repr__の違いは何ですか?
-
[解決済み】venv, pyvenv, pyenv, virtualenv, virtualenvwrapper, pipenvなどの違いは何ですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Python Decorator 練習問題
-
Evidentlyを用いたPythonデータマイニングによる機械学習モデルダッシュボードの作成
-
FacebookオープンソースワンストップサービスpythonのタイミングツールKats詳細
-
[解決済み] [Solved] sklearn error ValueError: 入力に NaN、infinity または dtype('float64') に対して大きすぎる値が含まれている。
-
[解決済み】numpy: true_divide で無効な値に遭遇
-
[解決済み】Pythonでgoogle APIのJSONコードを読み込むとエラーになる件
-
[解決済み】インポートエラー。モジュール名 urllib2 がない
-
[解決済み】NameError: 名前 'self' が定義されていません。
-
[解決済み】「OverflowError: Python int too large to convert to C long" on windows but not mac
-
[解決済み】django インポートエラー - core.managementという名前のモジュールがない