1. ホーム
  2. python

[解決済み] 美しいスープオブジェクトからHTMLを取得する方法

2023-07-23 18:57:11

質問

以下のようなbs4オブジェクトのリストがあります。

>>> listing
<div class="listingHeader">
<h2>
....


>>> type(listing)
<class 'bs4.element.Tag'>

生のhtmlを文字列として取り出したいのです。試してみました。

>>> a = listing.contents
>>> type(a)
<type 'list'>

ということで、これはうまくいきません。どうすればいいのでしょうか?

どのように解決するのですか?

ただ 文字列表現 :

html_content = str(listing)

これはprettifiedでないバージョンです。

美化されたものが必要な場合は prettify() というメソッドを使います。

html_content = listing.prettify()