[解決済み] Python 3.1 で文字列中の HTML エンティティをアンエスケープするにはどうしたらいいですか？[重複しています]。

2022-03-01 14:25:25

質問

Python 2.6以前のバージョンで、Python 3.Xでこれを行う方法については何もありません。

3.1で、できれば外部ライブラリなしでできるようにしなければなりません。現在、私はhttplib2をインストールし、コマンドプロンプトのcurlにアクセスしています（これは、私がページのソースコードを取得する方法です）。残念ながら、curlはhtmlエンティティをデコードしません、私の知る限り、私はドキュメントでそれをデコードするコマンドを見つけることができませんでした。

はい、私はBeautiful Soupを動作させるために、3.Xで成功しない何度も試してみました。

つまり、はっきり言って、こんな文字列を回す必要があるのです。 Suzy & John は、次のような文字列になります。

どのように解決するのですか？

この関数を使用すると html.unescape :

で Python3.4+の場合 (更新してくれた J.F. Sebastian に感謝します)。

import html
html.unescape('Suzy &amp; John')
# 'Suzy & John'

html.unescape('&quot;')
# '"'

で Python3.3 またはそれ以前のバージョン。

import html.parser    
html.parser.HTMLParser().unescape('Suzy &amp; John')

で Python2 :

import HTMLParser
HTMLParser.HTMLParser().unescape('Suzy &amp; John')

[解決済み] Python 3.1 で文字列中の HTML エンティティをアンエスケープするにはどうしたらいいですか？[重複しています]。

質問

どのように解決するのですか？

関連

Python Pillow Image.save jpg画像圧縮問題

[解決済み] Pythonには文字列の'contains'サブストリングメソッドがありますか？

[解決済み] Pythonで現在時刻を取得する方法

[解決済み] Pythonで2つのリストを連結する方法は？

[解決済み] ファイルのコピー方法について教えてください。

[解決済み] Pythonでファイルやフォルダを削除する方法は？

[解決済み] Pythonで文字列の部分文字列を取得するにはどうすればよいですか？

[解決済み] pipでPythonの全パッケージをアップグレードする方法

[解決済み] Pythonで文字列を小文字にするには？

[解決済み】ネストされたディレクトリを安全に作成するには？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

Python カメの描画コマンドとその例

Evidentlyを用いたPythonデータマイニングによる機械学習モデルダッシュボードの作成

Pythonショートビデオクローラーチュートリアル

[解決済み】 NameError: グローバル名 'xrange' は Python 3 で定義されていません。

[解決済み】「SyntaxError.Syntax」は何ですか？Missing parentheses in call to 'print'」はPythonでどういう意味ですか？

[解決済み] builtins.TypeError: strでなければならない、bytesではない

[解決済み】"No JSON object could be decoded "よりも良いエラーメッセージを表示する。

[解決済み】ValueError: xとyは同じサイズでなければならない

[解決済み】Pythonの文字列でHTMLエンティティをデコードしますか？

[解決済み] Python/Djangoを使用してHTMLデコード/エンコードを行うにはどうすればよいですか？