[解決済み] UTF-8 の読み込み - BOM マーカー
2023-07-11 13:33:39
質問
私は FileReader を通してファイルを読んでいます。ファイルは UTF-8 にデコードされています (BOM 付き) が、問題は、ファイルを読んで文字列を出力すると、悲しいことに BOM マーカーも出力されることです。なぜこのようなことが起こるのでしょうか?
fr = new FileReader(file);
br = new BufferedReader(fr);
String tmp = null;
while ((tmp = br.readLine()) != null) {
String text;
text = new String(tmp.getBytes(), "UTF-8");
content += text + System.getProperty("line.separator");
}
1行目以降の出力
?<style>
どのように解決するのですか?
Java では、UTF8 BOM が存在する場合、手動で消費する必要があります。この動作は Java バグ データベースで文書化されています。
ここで
と
はこちら
. JavaDocやXMLパーサなどの既存のツールを壊してしまうので、今のところ修正はありません。そのため
Apache IO コモンズ
が提供している
BOMInputStream
を使用して、この状況を処理します。
この解決策を見てみましょう。 BOM のある UTF8 ファイルを処理する
関連
-
実行中にEclipseがポップアップする A Java Exception has occurred
-
java.sql.SQLException: executeQuery()でデータ操作文を発行できません。
-
Java の switch case 文で必要な定数式の問題の解決法
-
Javaジェネリックを1つの記事で
-
JDK8 の Optional.of と Optional.ofNullable メソッドの違いと使い方を説明する。
-
htmlとwordの相互変換の実装(画像あり)
-
Zipファイルの圧縮・解凍にantを使用する
-
[解決済み] Javaでプレーンテキストファイルを読み込む
-
[解決済み] UTF-8とUnicodeの違いは何ですか?
-
[解決済み】PowerShellでBOMなしのUTF-8でファイルを書き込む場合
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
強制型変換について
-
java マイクロソフト払い戻し予期せぬサーバーからのファイルの終了
-
API の戻り値を処理するために ResponseEntity を使用する
-
Javaがリソースリークに遭遇した:'input'が閉じない 解決方法
-
Server Tomcat v9.0 Server at localhost の起動に失敗しました。
-
Java Runtime Environmentを継続するためのメモリが不足しています。
-
Java:未解決コンパイル問題の解決方法
-
linux ant Resolve error: main class not found or couldn't be loaded org.apache.tools.ant.launcher.
-
WeChat小プログラム Bluetooth通信 Bluetoothモジュールデモ
-
[解決済み] Javaでのファイル読み込みを失敗させるバイトオーダーマーク