[解決済み] Python 3.1 で文字列中の HTML エンティティをアンエスケープするにはどうしたらいいですか?[重複しています]。
2022-03-01 14:25:25
質問
Python 2.6以前のバージョンで、Python 3.Xでこれを行う方法については何もありません。
3.1で、できれば外部ライブラリなしでできるようにしなければなりません。現在、私はhttplib2をインストールし、コマンドプロンプトのcurlにアクセスしています(これは、私がページのソースコードを取得する方法です)。残念ながら、curlはhtmlエンティティをデコードしません、私の知る限り、私はドキュメントでそれをデコードするコマンドを見つけることができませんでした。
はい、私はBeautiful Soupを動作させるために、3.Xで成功しない何度も試してみました。
つまり、はっきり言って、こんな文字列を回す必要があるのです。
Suzy & John
は、次のような文字列になります。
どのように解決するのですか?
この関数を使用すると html.unescape :
で Python3.4+の場合 (更新してくれた J.F. Sebastian に感謝します)。
import html
html.unescape('Suzy & John')
# 'Suzy & John'
html.unescape('"')
# '"'
で Python3.3 またはそれ以前のバージョン。
import html.parser
html.parser.HTMLParser().unescape('Suzy & John')
で Python2 :
import HTMLParser
HTMLParser.HTMLParser().unescape('Suzy & John')
関連
-
Python Pillow Image.save jpg画像圧縮問題
-
[解決済み] Pythonには文字列の'contains'サブストリングメソッドがありますか?
-
[解決済み] Pythonで現在時刻を取得する方法
-
[解決済み] Pythonで2つのリストを連結する方法は?
-
[解決済み] ファイルのコピー方法について教えてください。
-
[解決済み] Pythonでファイルやフォルダを削除する方法は?
-
[解決済み] Pythonで文字列の部分文字列を取得するにはどうすればよいですか?
-
[解決済み] pipでPythonの全パッケージをアップグレードする方法
-
[解決済み] Pythonで文字列を小文字にするには?
-
[解決済み】ネストされたディレクトリを安全に作成するには?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
Python カメの描画コマンドとその例
-
Evidentlyを用いたPythonデータマイニングによる機械学習モデルダッシュボードの作成
-
Pythonショートビデオクローラーチュートリアル
-
[解決済み】 NameError: グローバル名 'xrange' は Python 3 で定義されていません。
-
[解決済み】「SyntaxError.Syntax」は何ですか?Missing parentheses in call to 'print'」はPythonでどういう意味ですか?
-
[解決済み] builtins.TypeError: strでなければならない、bytesではない
-
[解決済み】"No JSON object could be decoded "よりも良いエラーメッセージを表示する。
-
[解決済み】ValueError: xとyは同じサイズでなければならない
-
[解決済み】Pythonの文字列でHTMLエンティティをデコードしますか?
-
[解決済み] Python/Djangoを使用してHTMLデコード/エンコードを行うにはどうすればよいですか?