[解決済み] TypeError: XXXXX は予期しないキーワード引数 'XXXXXX' を受け取りました。
2022-01-31 23:43:26
質問
コードを実行すると、予期しないキーワード引数が発生します。ソース https://sempioneer.com/python-for-seo/how-to-extract-text-from-multiple-webpages-in-python/ どなたか助けてください。
以下のコードを実行しています。
single_url = 'https://understandingdata.com/'
text = extract_text_from_single_web_page(url=single_url)
print(text)
は以下のようなエラーを発生させます。
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_10260/3606377172.py in <module>
1 single_url = 'https://understandingdata.com/'
----> 2 text = extract_text_from_single_web_page(url=single_url)
3 print(text)
~\AppData\Local\Temp/ipykernel_10260/850098094.py in extract_text_from_single_web_page(url)
42 try:
43 a = trafilatura.extract(downloaded_url, json_output=True, with_metadata=True, include_comments = False,
---> 44 date_extraction_params={'extensive_search': True, 'original_date': True})
45 except AttributeError:
46 a = trafilatura.extract(downloaded_url, json_output=True, with_metadata=True,
TypeError: extract() got an unexpected keyword argument 'json_output'
のコードは、quot;extract_text_from_single_web_page(url=single_url)です。
def extract_text_from_single_web_page(url):
downloaded_url = trafilatura.fetch_url(url)
try:
a = trafilatura.extract(downloaded_url, json_output=True, with_metadata=True, include_comments = False,
date_extraction_params={'extensive_search': True, 'original_date': True})
except AttributeError:
a = trafilatura.extract(downloaded_url, json_output=True, with_metadata=True,
date_extraction_params={'extensive_search': True, 'original_date': True})
if a:
json_output = json.loads(a)
return json_output['text']
else:
try:
resp = requests.get(url)
# We will only extract the text from successful requests:
if resp.status_code == 200:
return beautifulsoup_extract_text_fallback(resp.content)
else:
# This line will handle for any failures in both the Trafilature and BeautifulSoup4 functions:
return np.nan
# Handling for any URLs that don't have the correct protocol
except MissingSchema:
return np.nan
解決方法は?
私のコメントで提案したように、最良の選択肢は、チュートリアルで
trafilatura
というのも、どうやらこの部分が壊れているようなのです。 しかし、この特定の関数を修正してそれを回避し、フォールバックを使用するだけなら、とても簡単です。
def extract_text_from_single_web_page(url):
try:
resp = requests.get(url)
# We will only extract the text from successful requests:
if resp.status_code == 200:
return beautifulsoup_extract_text_fallback(resp.content)
else:
# This line will handle for any failures in the BeautifulSoup4 function:
return np.nan
# Handling for any URLs that don't have the correct protocol
except MissingSchema:
return np.nan
関連
-
Python Decorator 練習問題
-
Python 人工知能 人間学習 描画 機械学習モデル作成
-
pythonサイクルタスクスケジューリングツール スケジュール詳解
-
Python百行で韓服サークルの画像クロールを実現する
-
Python interpreted model libraryによる機械学習モデル出力の可視化 Shap
-
パッケージングツールPyinstallerの使用と落とし穴の回避
-
Pythonショートビデオクローラーチュートリアル
-
[解決済み】LogisticRegression: Pythonでsklearnを使用して、未知のラベルタイプ: '連続'を使用しています。
-
[解決済み】Python - "ValueError: not enough values to unpack (expected 2, got 1)" の修正方法 [閉店].
-
[解決済み] TypeError: 引数に複数の値が指定されました。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
opencvとpillowを用いた顔認証システム(デモあり)
-
python call matlab メソッドの詳細
-
Pythonの学習とデータマイニングのために知っておくべきターミナルコマンドのトップ10
-
Python interpreted model libraryによる機械学習モデル出力の可視化 Shap
-
Python Pillow Image.save jpg画像圧縮問題
-
[解決済み】DataFrameのコンストラクタが正しく呼び出されない!エラー
-
[解決済み】RuntimeWarning: 割り算で無効な値が発生しました。
-
[解決済み】Python regex AttributeError: 'NoneType' オブジェクトに 'group' 属性がない。
-
[解決済み】 AttributeError: モジュール 'matplotlib' には属性 'plot' がない。
-
[解決済み] builtins.TypeError: strでなければならない、bytesではない