[解決済み] Pythonを使って統計トラッキングサイト(cod.tracker.gg)から正しい要素をwebscrapeする方法

2022-03-02 19:23:54

質問

についてこれ特定のページ（またはすべての'matches'ページ）の名前を選択すると、その試合の個々の統計を見ることができます。ウェブスクレイピングを使用して、たとえば「kills」統計を取得するにはどうすればよいですか？

私が使っているほとんどのチュートリアルでは、ウェブスクレイピングは簡単なようです。しかし、このサイト、特に「キル数」の項目を検査すると、次のようなものが表示されます。

<span data-v-71c3e2a1 title="Kills" class ="name".

質問1.) data-v-71c3e2a1』とは何ですか？私のhtml,css,webscrapingのチュートリアルでこのようなものを見たことがありません。サイト内の至る所に異なるバリエーションで表示されます。

質問2) それよりも、この部分のキル数をどうやってつかめばいいのでしょうか？scrapyを使ったり、xpathでつかんだりしてみたのですが。

スクレイプシェル https://cod.tracker.gg/warzone/match/1424533688251708994?handle=PatrickPM

<ブロッククオート

response.xpath("//*[@id="app"]/div[3]/div[2]/div/main/div[3]/div[2]/div[2]/div[6]/div[2]/div[3]/div[2]/div[1]/div/div[1]/span[2]").get()

しかし、これは構文エラーを発生させます。

response.xpath("//*[@id="app"])

SyntaxError: 構文が無効です。

response.css("").get() による取得も難しいです。セレンを使ったほうがいいのでしょうか？それとも普通のリクエスト/BS4？何をやってもつかめない。

ありがとうございます。

どのように解決するのですか？

これで必要なデータが返ってきましたか？

import requests


endpoint = "https://api.tracker.gg/api/v1/warzone/matches/1424533688251708994"
r = requests.get(endpoint, params={"handle": "PatrickPM"})
data = r.json()["data"]

いずれにせよ、利用できるものがあればAPIを利用することをお勧めします。BeautifulSoupやseleniumを使うよりずっと簡単です。

[解決済み] Pythonを使って統計トラッキングサイト(cod.tracker.gg)から正しい要素をwebscrapeする方法

質問

どのように解決するのですか？

関連

[解決済み] Pythonで現在時刻を取得する方法

[解決済み] リストの最後の要素を取得する方法

[解決済み] Pythonの辞書からキーを削除するにはどうしたらいいですか？

[解決済み] インデックスを指定してリストから要素を削除する方法

[解決済み] How can I set the default value for an HTML <select> element?

[解決済み] print関数の出力をフラッシュする（pythonの出力をバッファリング解除する）にはどうすればよいですか？

[解決済み] ローカルディレクトリからrequirements.txtファイルに従ってpipを使用してパッケージをインストールするにはどうすればよいですか？

[解決済み] jQueryを使用してハイパーリンクのhref属性を変更する方法

[解決済み] Pythonでパスから拡張子なしでファイル名を取得する方法は？

[解決済み] Pythonでホームディレクトリを取得するための正しいクロスプラットフォームな方法は何ですか？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

python string splicing.join()とsplitting.split()の説明

PicgoのイメージベッドツールをPythonで実装する

Python機械学習Githubが8.9Kstarsに達したモデルインタープリタLIME

Pythonの学習とデータマイニングのために知っておくべきターミナルコマンドのトップ10

Pythonコードの可読性を向上させるツール「pycodestyle」の使い方を詳しく解説します

[解決済み】numpyの配列連結。"ValueError:すべての入力配列は同じ次元数でなければならない"

[解決済み】 AttributeError: モジュール 'matplotlib' には属性 'plot' がない。

[解決済み】Python elifの構文が無効です【終了しました

[解決済み】ValueError: pickleプロトコルがサポートされていません。3、python2 pickleはpython3 pickleでダンプしたファイルを読み込むことができない？

[解決済み】Python - "ValueError: not enough values to unpack (expected 2, got 1)" の修正方法 [閉店].