[解決済み] Json は String の & を \ に変換します。
2022-02-17 16:37:17
質問
pdfからテキストを抽出し、jsonファイルに書き込もうとしています。ユニコード文字を抽出する際に、Jsonが全ての&を "unicode "に変換してしまいます。例えば、私の実際の文字列は
ش
. (これはشを表す)。これは、.txtファイルやコンソールなどに正しくプリントされます。しかし、この文字列をJsonファイルに出力しようとすると、次のように表示されます。
\u0026#1588;
.
私はJavaを使用しており、そのコードは
Gson gson = new Gson();
String json = gson.toJson(pdfDoc);
注
pdfDoc
はオブジェクトで、入力 PDF ドキュメント内の文字のすべての詳細 (位置、色、フォントなど) を含んでいます。 私は
gson-2.2.1.jar
.
解決方法は?
これは実は有効な(必須ではない)エンコーディングなんです。 任意の 文字 かもしれない JSON と有効な JSON パース・ライブラリで unicode エスケープを使用してエンコードされます。 必須 は、これらのエスケープを解釈することができます。
&
が持つ文字には含まれません。
必要
の定義参照)。
string
json.orgにて
しかし、いくつかのJSONライブラリは、そのエンコーディングにおいて、かなり"aggressive"なものがあります。しかし、JSONライブラリの中には、エンコードにかなり積極的なものもあります。これは、JSONパーサーで結果のJSONを本当に処理しないのでなければ、通常は問題にはなりません。
GsonBuilder.disableHtmlEscaping() を使用すると、どうしても必要な場合にこの機能をオフにすることができます。
関連
-
[解決済み】Javaの未処理例外について
-
[解決済み] 正しいJSONコンテンツタイプは何ですか?
-
[解決済み] JSONでコメントを使用することはできますか?
-
[解決済み] JavaScriptで文字列が部分文字列を含むかどうかを確認する方法は?
-
[解決済み] C#のStringとstringの違いは何ですか?
-
[解決済み] JavaでInputStreamを読み込んでStringに変換するにはどうすればよいですか?
-
[解決済み] なぜGoogleはJSONレスポンスにwhile(1);を前置するのでしょうか?
-
[解決済み] なぜパスワードにはStringではなくchar[]が好まれるのですか?
-
[解決済み] JavaでStringをintに変換するにはどうしたらいいですか?
-
[解決済み】JavaScriptで文字列の出現箇所をすべて置換する方法
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】エラー:配列または java.lang.Iterable のインスタンスに対してのみ反復処理を行うことができます。
-
[解決済み】imageio.IIOException: 入力ファイルが読み込めない
-
[解決済み】代入の左手は必ず変数 CharAt
-
[解決済み】StringUtils.isBlank() vs String.isEmpty()
-
[解決済み】エラー「No enclosing instance of type Foo is accessible」の原因と修正方法について教えてください。
-
[解決済み】HTTPステータス500 サーブレットクラスのインスタンス化エラー [重複]。
-
[解決済み] hibernate のプロパティが見つかりません。
-
[解決済み】keytoolエラー 鍵屋が改ざんされたか、パスワードが不正確だった場合
-
[解決済み】Javaのswitch文。定数式が必要だが、定数である
-
[解決済み】 executeQuery()でデータ操作文が発行できない。)