[解決済み] どのタグが含まれているかわからない文字列から、すべてのHTMLタグを削除するにはどうすればよいですか?
2022-02-09 04:38:39
質問内容
HTMLタグやHTMLに関連するあらゆるものを文字列から簡単に削除する方法はありますか?
例えば
string title = "<b> Hulk Hogan's Celebrity Championship Wrestling <font color=\"#228b22\">[Proj # 206010]</font></b> (Reality Series, )"
上記は本当にそうあるべきです。
"ハルク・ホーガンのセレブリティ・チャンピオンシップ・レスリング [Proj # 206010] (リアリティ・シリーズ)"。
解答方法
以下のような簡単な正規表現を使用することができます。
public static string StripHTML(string input)
{
return Regex.Replace(input, "<.*?>", String.Empty);
}
この解決策には、それなりの欠陥があることを認識しておいてください。 参照 文字列中のHTMLタグを削除する をご覧ください(特に「Mark E. Haase」/@mehaaseのコメント)。
別の解決策としては
HTMLアジリティパック
.
本ライブラリを使用したサンプルはこちらでご覧いただけます。
HTMLアジリティパック - コンテンツを削除せずに不要なタグを削除する?
関連
-
[解決済み】Ajax処理で「無効なJSONプリミティブ」と表示される件
-
[解決済み] 'SubSonic.Schema .DatabaseColumn' 型のオブジェクトをシリアライズする際に、循環参照が検出されました。
-
[解決済み】C# - パスに不正な文字がある場合
-
[解決済み】Swashbuckle/Swagger + ASP.Net Core: "Failed to load API definition" (API定義の読み込みに失敗しました
-
[解決済み】「...は'型'であり、与えられたコンテキストでは有効ではありません」を解決するにはどうすればよいですか?(C#)
-
[解決済み】別のスレッドがこのオブジェクトを所有しているため、呼び出し側のスレッドはこのオブジェクトにアクセスできない
-
[解決済み] 文字列からHTMLタグを削除する
-
[解決済み] 文字列からストリームを生成するにはどうすればよいですか?
-
[解決済み] 文字列からダッシュ以外のすべての英数字を削除するには?
-
[解決済み】文字列からすべての空白を削除する効率的な方法?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] エンティティタイプ ApplicationUser は、現在のコンテキストのモデルの一部ではありません。
-
[解決済み】Ajax処理で「無効なJSONプリミティブ」と表示される件
-
[解決済み】スクリプトクラスが見つからないので、スクリプトコンポーネントを追加できない?
-
[解決済み] [Solved] 不正な文字列値: '\xEFxBFxBD' for column
-
[解決済み】"指定されたパスのフォーマットはサポートされていません。"
-
[解決済み】5.7.57 SMTP - MAIL FROMエラー時に匿名メールを送信するためにクライアントが認証されない
-
[解決済み】C#のequal to演算子でtextとvarcharのデータ型は互換性がない
-
[解決済み] 2つのリストを結合する
-
[解決済み】2年前のMSDateを把握する【クローズド
-
VSでscanfエラーを恒久的に解決するには、ソースファイルを作成し、自動的に#define _CRT_SECURE_NO_WARNINGS 1を追加してください。