[解決済み】テキストファイルのエンコーディング/コードページを検出する方法
質問
私たちのアプリケーションでは、テキストファイル (
.txt
,
.csv
など)を様々なソースから入手しています。これらのファイルは、異なるコードページで作成されているため、読み込むとゴミを含むことがあります。
テキストファイルのコードページを(自動的に)検出する方法はありますか?
は
detectEncodingFromByteOrderMarks
にある
StreamReader
のコンストラクタで動作します。
UTF8
といったユニコードでマークされたファイルを検出する方法を探しています。
ibm850
,
windows1252
.
ご回答ありがとうございます、こんな感じです。
私たちが受け取るファイルはエンドユーザーからのもので、彼らはコードページについて何も知らない。受信者もエンドユーザーであり、コードページについて知っているのはこのようなことです。コードページは存在し、そして迷惑な存在なのです。
解決策
- 受信したファイルをメモ帳で開き、文字化けしている部分を見てください。もし誰かがフランソワとかいう名前だったら、あなたの人間的な知性でこれを推測することができます。
- 私は、ユーザーがファイルを開くのに使える小さなアプリを作りました。正しいコードページが使われたときに、そのファイルに表示されることが分かっているテキストを入力します。
- すべてのコードページをループし、ユーザーが提供したテキストで解決策を与えるものを表示します。
- 複数のコードページが表示された場合は、さらにテキストを指定するようにユーザーに要求します。
解決方法は?
コードページがわからない、教えてほしい。バイトを解析して推測することはできますが、その場合、奇妙な(時には面白い)結果が得られることがあります。今は見つけられませんが、メモ帳を騙して英語のテキストを中国語で表示させることができるはずです。
とにかく、これを読めばいいんです。 ソフトウェア開発者が絶対に、絶対に知っておくべき、ユニコードと文字セットについての最低限事項(言い訳禁止!)。 .
具体的にはジョエルが言う。
エンコーディングに関する唯一で最も重要な事実
もし、今説明したことをすっかり忘れてしまったら、1つだけ極めて重要な事実を思い出してください。文字列がどのようなエンコーディングを使っているかを知らずに文字列を持つことは意味がありません。もう砂の中に頭を突っ込んで、"plain"テキストがASCIIであるかのように装うことはできないのです。 プレーンテキストというものは存在しないのです。
メモリ内、ファイル内、電子メールメッセージ内に文字列がある場合、それがどのようなエンコーディングであるかを知っておかなければ、それを解釈したり、ユーザーに正しく表示したりすることができないのです。
関連
-
[解決済み】「The breakpoint will not currently be hit」を改善するには?このドキュメントにはシンボルが読み込まれていません。" という警告はどうすれば改善されますか?
-
[解決済み] 他のスレッドからGUIを更新するにはどうすればよいですか?
-
[解決済み] Linuxで特定のテキストを含むすべてのファイルを検索するにはどうすればよいですか?
-
[解決済み] intをenumにキャストするにはどうすればよいですか?
-
[解決済み] C#で文字列のエンコーディングを手動で指定せずに、一貫性のあるバイト表現を得るには?
-
[解決済み] Microsoft Officeをインストールせずに、C#でExcel(.XLSおよび.XLSX)ファイルを作成するにはどうすればよいですか?
-
[解決済み] ランダムな英数字の文字列を生成するにはどうすればよいですか?
-
[解決済み] .NETコンソールアプリケーションでアプリケーションのパスを取得するにはどうすればよいですか?
-
[解決済み] アセンブリファイルのバージョンを取得する方法
-
[解決済み】Node.jsでBase64エンコードを行うにはどうすればよいですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】スクリプトクラスが見つからないので、スクリプトコンポーネントを追加できない?
-
[解決済み】C#におけるtypedefの等価性
-
[解決済み】「namespace x already contains a definition for x」エラーの修正方法は?VS2010にコンバートした後に発生しました。
-
[解決済み] [Solved] アセンブリ System.Web.Extensions dll はどこにありますか?
-
[解決済み】Visual Studio: 操作を完了できませんでした。パラメータが正しくありません
-
[解決済み】WSACancelBlockingCallの例外について
-
[解決済み】2つ(またはそれ以上)のリストを1つに統合する(C# .NETで
-
VSでscanfエラーを恒久的に解決するには、ソースファイルを作成し、自動的に#define _CRT_SECURE_NO_WARNINGS 1を追加してください。
-
[解決済み】名前 'ViewBag' が現在のコンテキストに存在しない - Visual Studio 2015
-
[解決済み】データが存在しないのに読み込もうとする試みが無効である