Scrapy エラー : exceptions.AttributeError: 'HtmlResponse' オブジェクトには 'urljoin' という属性がありません。
2022-02-22 20:31:03
scrapyフレームワークでファイルをクロールし、絶対URLを構築しています。Scrapy エラー : 例外。'urljoin'
原因
Scrapy> = 0.24.2 では、HtmlResponse クラスにまだ urljoin() メソッドがありません。urlparse.urljoin()を使用することができます。
full_url = urlparse.urljoin(response.url, href.extract())
しかし、urlparseモジュールはインストールするのが少し難しいので、先にurllibモジュールをインストールします:。
from urllib.parse import urljoin
full_url = urljoin(response.url, href)
ここでのhrefは'animate_decay.py'です。
ここでのresponse.urlは'
https://matplotlib.org/examples/animation/animate_decay.html
'
ここでのfull_urlは、'
https://matplotlib.org/examples/animation/animate_decay.py
'
これで、完全なurlが得られます。
関連
-
RuntimeWarning: double_scalars で無効な値が発生しました precision.append(tp[i] * 1.0 / (tp[i])
-
コンピュータシステムの爆弾実験への深い理解
-
jinja2.exceptions.TemplateNotFound: xxxx.html
-
JAVA の小さな問題を解決する
-
ESlint Parsing errorエラーの解決法
-
python prompts ImportError: Image という名前のモジュールがありません。
-
[Python Basic] ValueError: 非キーワード引数は2つしか受け付けません。
-
android:textAlignment パラメータ説明
-
javaHow to create array whose elements are type ArrayList?
-
NullPointerException
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
エラー: collect2:ld が 1 の終了ステータスを返した (要約)
-
よくある例外の問題と解決策
-
メールサーバーの問題点まとめ
-
メインクラス org.codehaus.plexus.classworlds.launcher.Launcher MAC が見つからない、またはロードできないエラーが以下に報告されています。
-
ModuleNotFoundError: google' という名前のモジュールはありません。
-
一致するワイルドカードは厳密ですが、要素 'aop:aspectj' の宣言が見つかりません。
-
予期しないトークン付近の構文エラー 脚注のエラー解決
-
閉じたファイルへのI/O操作。
-
[違反】スクロールブロックの「mousewheel」イベントに非パッシブなイベントリスナーを追加。
-
署名入りAPKの生成: APKのビルド中にエラーが発生しました wear:packageRelease FAILED