[解決済み] Beautiful Soup経由のScraping Stream、バナーアートは空の「trans.gif」ファイル
2022-02-16 11:06:42
質問
現在、Beautiful SoupでSteamのホームページをスクレイピングし、掲載されているゲームに関する基本情報を出力するPythonのコードを書いています。
page_soup = soup(page_html, 'html.parser')
container = page_soup.findAll('a', {'class':'tab_item'})
container.append(page_soup.findAll('a', {'class':'tab_item.app_impression_tracked'}))
[...]
count = 0
for item in container:
price = container[count].find('div','tab_item_discount')
title = container[count].find('div','tab_item_content')
cover = container[count].find('div', 'tab_item_cap')
tags = title.find('div', 'tab_item_top_tags')
print("price: " + price['data-price-final'])
print("Title: " + title.div.text)
print("Cover: " + cover.img['src'])
print("Tags: " + tags.text)
count += 1
どの出力か。
price: 0
Title: RetroArch
Cover: https://store.akamai.steamstatic.com/public/shared/images/trans.gif
Tags: Free to Play, Retro, Singleplayer, Multiplayer
price: 5999
Title: DEATHLOOP
Cover: https://store.akamai.steamstatic.com/public/shared/images/trans.gif
Tags: Action, FPS, First-Person, Stealth
[...]
これはほとんど動作しますが、カバー(バナー画像)が空の1x1 'trans.gif' ファイルとして取得されることを除きます。 私のコードのどこにこのような欠陥があるのか、よくわかりません。
どうすればいいですか?
あなたのコードの欠陥ではありません。 その1x1の画像はおそらくプレースホルダーで、後でページ上のJavascriptによって置き換えられるのでしょう。 BeautifulSoupはJavascriptを実行しません。 もし本当にそれが必要なら、Seleniumのようなものを使ってChromeインスタンスを実行する必要があります。 もっと面倒なので、そのカバーアートが必要なことを確認してください。
関連
-
Python関数の高度な応用を解説
-
Python 可視化 big_screen ライブラリ サンプル 詳細
-
Pythonの学習とデータマイニングのために知っておくべきターミナルコマンドのトップ10
-
Python入門 openを使ったファイルの読み書きの方法
-
Python 入出力と高次代入の基礎知識
-
[解決済み】TypeErrorの修正方法。Unicodeオブジェクトは、ハッシュ化する前にエンコードする必要がある?
-
[解決済み】OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありません。
-
[解決済み】numpy: true_divide で無効な値に遭遇
-
[解決済み】インポートエラー。モジュール名 urllib2 がない
-
[解決済み] 美しいスープとIDによるdivとそのコンテンツの抽出
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Python カメの描画コマンドとその例
-
PythonはWordの読み書きの変更操作を実装している
-
Python jiabaライブラリの使用方法について説明
-
PythonでECDSAを実装する方法 知っていますか?
-
[解決済み] データ型が理解できない
-
[解決済み】socket.error: [Errno 48] アドレスはすでに使用中です。
-
[解決済み】Python: SyntaxError: キーワードは式になり得ない
-
[解決済み】ImportError: bs4という名前のモジュールがない(BeautifulSoup)
-
[解決済み】NameError: 名前 'self' が定義されていません。
-
[解決済み】Python - "ValueError: not enough values to unpack (expected 2, got 1)" の修正方法 [閉店].