[解決済み] PythonとBeautifulSoupを使ってWebページからリンクを取得する [終了しました]。

2022-04-28 10:35:20

質問

Pythonを使ってウェブページのリンクを取得し、リンクのURLをコピーするにはどうすればよいですか？

どのように解決するのですか？

BeautifulSoupのSoupStrainerクラスを使った簡単なスニペットを紹介します。

import httplib2
from bs4 import BeautifulSoup, SoupStrainer

http = httplib2.Http()
status, response = http.request('http://www.nytimes.com')

for link in BeautifulSoup(response, parse_only=SoupStrainer('a')):
    if link.has_attr('href'):
        print(link['href'])

BeautifulSoupのドキュメントは非常に優れており、典型的なシナリオを数多くカバーしています。

https://www.crummy.com/software/BeautifulSoup/bs4/doc/

編集：SoupStrainerクラスを使ったのは、何をパースするのかが事前に分かっていれば、（メモリとスピードの面で）少し効率的だからであることに注意してください。

[解決済み] PythonとBeautifulSoupを使ってWebページからリンクを取得する [終了しました]。

質問

どのように解決するのですか？

関連

PyQt5はユーザーログインGUIインターフェースとログイン後のジャンプを実装しています。

パッケージングツールPyinstallerの使用と落とし穴の回避

Pythonの@decoratorsについてまとめてみました。

[解決済み] プログラムの実行やシステムコマンドの呼び出しはどのように行うのですか？

[解決済み] リスト内のアイテムのインデックスを検索する

[解決済み] ファイルのコピー方法について教えてください。

[解決済み] 割り当て後にリストが予期せず変更されました。その理由と防止策を教えてください。

[解決済み】ネストされたディレクトリを安全に作成するには？

[解決済み】forループを使った辞書の反復処理

[解決済み】2つの辞書を1つの式でマージする（辞書の和をとる）には？）

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

Python百行で韓服サークルの画像クロールを実現する

Python interpreted model libraryによる機械学習モデル出力の可視化 Shap

Pythonの@decoratorsについてまとめてみました。

[解決済み】TypeError: unhashable type: 'numpy.ndarray'.

[解決済み] [Solved] sklearn error ValueError: 入力に NaN、infinity または dtype('float64') に対して大きすぎる値が含まれている。

[解決済み】numpy: true_divide で無効な値に遭遇

[解決済み】TypeError: re.findall()でバイトのようなオブジェクトに文字列パターンを使用することはできません。）

[解決済み】TypeErrorを取得しました。エントリを持つ子テーブルの後に親テーブルを追加しようとすると、 init() missing 1 required positional argument: 'on_delete'

[解決済み】Python elifの構文が無効です【終了しました

[解決済み】cアンダースコア式`c_`は、具体的に何をするのですか？