[解決済み] Beautiful Soup経由のScraping Stream、バナーアートは空の「trans.gif」ファイル

2022-02-16 11:06:42

質問

現在、Beautiful SoupでSteamのホームページをスクレイピングし、掲載されているゲームに関する基本情報を出力するPythonのコードを書いています。

page_soup = soup(page_html, 'html.parser')
container = page_soup.findAll('a', {'class':'tab_item'})
container.append(page_soup.findAll('a', {'class':'tab_item.app_impression_tracked'}))

[...]

    count = 0
    for item in container:
        price = container[count].find('div','tab_item_discount')
        title = container[count].find('div','tab_item_content')
        cover = container[count].find('div', 'tab_item_cap')
        tags = title.find('div', 'tab_item_top_tags')
        print("price: " + price['data-price-final'])
        print("Title: " + title.div.text)
        print("Cover: " + cover.img['src'])
        print("Tags: " + tags.text)
        count += 1

どの出力か。

price: 0
Title: RetroArch
Cover: https://store.akamai.steamstatic.com/public/shared/images/trans.gif
Tags: Free to Play, Retro, Singleplayer, Multiplayer
price: 5999
Title: DEATHLOOP
Cover: https://store.akamai.steamstatic.com/public/shared/images/trans.gif
Tags: Action, FPS, First-Person, Stealth
[...]

これはほとんど動作しますが、カバー（バナー画像）が空の1x1 'trans.gif' ファイルとして取得されることを除きます。私のコードのどこにこのような欠陥があるのか、よくわかりません。

どうすればいいですか？

あなたのコードの欠陥ではありません。その1x1の画像はおそらくプレースホルダーで、後でページ上のJavascriptによって置き換えられるのでしょう。 BeautifulSoupはJavascriptを実行しません。もし本当にそれが必要なら、Seleniumのようなものを使ってChromeインスタンスを実行する必要があります。もっと面倒なので、そのカバーアートが必要なことを確認してください。

[解決済み] Beautiful Soup経由のScraping Stream、バナーアートは空の「trans.gif」ファイル

質問

どうすればいいですか？

関連

Python関数の高度な応用を解説

Python 可視化 big_screen ライブラリサンプル詳細

Pythonの学習とデータマイニングのために知っておくべきターミナルコマンドのトップ10

Python入門 openを使ったファイルの読み書きの方法

Python 入出力と高次代入の基礎知識

[解決済み】TypeErrorの修正方法。Unicodeオブジェクトは、ハッシュ化する前にエンコードする必要がある？

[解決済み】OSError: [WinError 193] %1 は有効な Win32 アプリケーションではありません。

[解決済み】numpy: true_divide で無効な値に遭遇

[解決済み】インポートエラー。モジュール名 urllib2 がない

[解決済み] 美しいスープとIDによるdivとそのコンテンツの抽出

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

Python カメの描画コマンドとその例

PythonはWordの読み書きの変更操作を実装している

Python jiabaライブラリの使用方法について説明

PythonでECDSAを実装する方法知っていますか？

[解決済み] データ型が理解できない

[解決済み】socket.error: [Errno 48] アドレスはすでに使用中です。

[解決済み】Python: SyntaxError: キーワードは式になり得ない

[解決済み】ImportError: bs4という名前のモジュールがない(BeautifulSoup)

[解決済み】NameError: 名前 'self' が定義されていません。

[解決済み】Python - "ValueError: not enough values to unpack (expected 2, got 1)" の修正方法 [閉店].