C#でHTMLをテキストに変換するには?
質問
私は、HTML文書をプレーンテキストに変換するC#コードを探しています。
私は、単純なタグのストリッピングではなく、プレーンテキストを出力するものを探しています。 合理的な でプレーン テキストを出力するものを探しています。
出力はこのようになるはずです。
HTML Agility Packを見ましたが、私には必要なものではないと思います。どなたか、他にお勧めはありますか?
EDITです。 HTML Agility Packをダウンロードしたところ コードプレックス からダウンロードして、Html2Txt プロジェクトを実行しました。 なんということでしょう!(少なくともhtmlからtextへの変換を行うモジュールは)期待はずれでした。 タグを取り除き、テーブルを平らにするなどの処理だけでした。 出力は、Html2Txt @ W3Cが作成したものとは全く違っていた。 そのソースが利用できないようで残念です。 私は、より多くの "canned"ソリューションが利用可能であるかどうかを確認するために探していました。
EDIT 2:
皆様、ご指摘ありがとうございました。
フライスワット
は、私が行きたい方向へ私を傾けてくれました。 私は
System.Diagnostics.Process
クラスを使って、lynx.exe を "-dump" スイッチで実行し、テキストを標準出力に送り、標準出力を
ProcessStartInfo.UseShellExecute = false
と
ProcessStartInfo.RedirectStandardOutput = true
. これをすべてC#のクラスで包むことにします。 このコードはたまにしか呼ばれないので、新しいプロセスを生成することと、コードでそれを行うことはあまり関係がありません。 さらに、Lynxは速いです!
どのように解決するのですか?
あなたが探しているのは、Lynx や他のテキスト ブラウザのようにテキストを出力するテキスト モード DOM レンダラーです...これは、あなたが期待するよりもはるかに難しいことです。
関連
-
[解決済み] ...基礎となる接続は閉じられました。予期しないエラーが受信で発生しました
-
[解決済み] Linuxで特定のテキストを含むすべてのファイルを検索するにはどうすればよいですか?
-
[解決済み] 要素を水平方向にセンタリングする方法
-
[解決済み] enumを列挙するには
-
[解決済み] intをenumにキャストするにはどうすればよいですか?
-
[解決済み] JavaScriptで要素のクラスを変更するにはどうすればよいですか?
-
[解決済み] どのラジオボタンが選択されているかをjQueryで知るにはどうしたらよいですか?
-
[解決済み] PHPでHTML/XMLをパースして処理する方法とは?
-
[解決済み】なぜHTMLは "chucknorris "を色と見なすのか?
-
[解決済み】jQueryでチェックボックスがチェックされているかどうかを確認するにはどうすればよいですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] [Solved] 1つ以上のエンティティで検証に失敗しました。詳細は'EntityValidationErrors'プロパティを参照してください [重複]。
-
[解決済み】C#で四捨五入する方法
-
[解決済み】C#におけるtypedefの等価性
-
[解決済み】C# ASP.NET使用時に「WebClientのリクエスト中に例外が発生しました。
-
[解決済み】Unity3DでOnTriggerEnterが動作しない件
-
[解決済み】非静的メソッドはターゲットを必要とする
-
[解決済み】"指定されたパスのフォーマットはサポートされていません。"
-
[解決済み】5.7.57 SMTP - MAIL FROMエラー時に匿名メールを送信するためにクライアントが認証されない
-
[解決済み】プロセスが実行されているかどうかを知るには?
-
VSでscanfエラーを恒久的に解決するには、ソースファイルを作成し、自動的に#define _CRT_SECURE_NO_WARNINGS 1を追加してください。