1. ホーム
  2. character-encoding

[解決済み] 0D 0D 0A の改行があるテキストファイル

2022-01-28 07:48:03

質問

顧客から送られてきた.csvファイルの改行が、次のような順序で構成されています。 0xD 0xD 0xA . 私の知る限りでは、改行は 0xA MacやUnixから、または 0xD 0xA Windowsから

0xD 0xD 0xA 既知のエンコーディングは?ファイルの行末を破損するような、何か既知の保存順序があるのでしょうか(お客様はMacを使っていると思うのですが)?

ファイルはエンコードマーカーで始まらず、直接テキストコンテンツで始まります。コードページ1252で開くと、テキストは正しく表示されます。

解決方法は?

の結果としてCRCRLFが知られています。 Windows XPのメモ帳のワードラップのバグ .

今後の参考のため、リンク先のブログから関連性の高いものを抜粋しておきます。

<ブロッククオート

WindowsパソコンでEnterキーを押したとき、実際にはキャリッジリターン(CR)とラインフィード(LF)という2つの文字が格納されます。オペレーティングシステムは、CR LFという文字列を常にEnterキーと同じように解釈し、次の行に移動させます。しかし、CRやLFが単独で余分な文字として存在する場合、問題を引き起こすことがあります。

Windows XP版のメモ帳には、表示窓に余分なCR文字が格納されるバグがあります。このバグは、次のような場合に発生します。

ワードラップオプションをオンにしていて、表示ウィンドウに折り返す長い行がある場合、ファイルを保存すると、メモ帳は表示ウィンドウの各折り返しポイントにCR CR LFという文字を挿入しますが、保存したファイルには挿入されません。

このCR CR LF文字は、他のプログラムにコピー&ペーストすると、おかしなことになることがあります。また、メモ帳のウィンドウサイズを変更した場合にも、行の再ラップが正しく行われません。

ワードラップ機能をオフにし、必要に応じてオンに戻すことで、CR CR LF 文字を削除することができます。ただし、この場合、カーソルは表示ウィンドウの先頭に配置し直されます。