1. ホーム
  2. java

[解決済み] JavaでHTMLの文字実体をアンエスケープする方法は?

2022-04-24 14:33:34

質問

基本的には、与えられたHtmlドキュメントをデコードし、以下のような特殊文字をすべて置き換えたいと思います。 " " -> " " , ">" -> ">" .

.NETでは HttpUtility.HtmlDecode .

Javaでこれに相当する関数は?

どのように解決するのですか?

私は、Apache Commonsの StringEscapeUtils.unescapeHtml4() を使用します。

エンティティを含む文字列のアンエスケープ を含む文字列にエスケープします。 実際のユニコード文字 エスケープに対応する。対応 HTML 4.0 のエンティティ。