[解決済み】Unicode、UTF、ASCII、ANSIのフォーマットの違いについて
2022-03-24 08:54:32
質問
の違いは何ですか?
Unicode
,
UTF8
,
UTF7
,
UTF16
,
UTF32
,
ASCII
および
ANSI
エンコーディングは?
これらはプログラマーにとってどのような点で有用なのでしょうか?
どのように解決するのですか?
リストを下っていく。
- " ユニコード 残念ながら、多くの文書では、このエンコーディングは、特定のシステムがデフォルトで使用する Unicode エンコーディングを指すものとして、不正確な表現で使用されています。 WindowsとJavaでは、これはしばしばUTF-16を意味し、他の多くの場所では、UTF-8を意味します。 正しくは、Unicodeは抽象的な文字セットそのものを指しており、特定のエンコーディングを指しているわけではありません。
- UTF-16 コード単位は2バイトです。これは、.NETの文字列のネイティブフォーマットであり、一般にWindowsとJavaでも同じです。の外の値は 基本多言語面 (BMP)はサロゲートペアとしてエンコードされます。これらの 以前は しかし、現在では多くの消費者向けアプリケーションが絵文字をサポートするために、BMP以外の文字を認識する必要があります。
- UTF-8 : 可変長エンコーディングで、1コードポイントあたり1〜4バイト。ASCII 値は 1 バイトを使って ASCII として符号化されます。
- UTF-7 : 通常、メールのエンコードに使用されます。メールをやっていない人が必要だと思ったら、それは間違いです。(これはニュースグループなどに投稿している人たちの経験です。メール以外では、本当に全く広く使われていません)。
-
UTF-32
: 1コードポイントあたり4バイトを使用する固定幅エンコーディング。これはあまり効率的ではありませんが、BMPの外では生活が楽になります。私は、.NETの
Utf32String
クラスは、私の MiscUtil ライブラリが必要な場合は、それを使用することができます。(あまり徹底的なテストはしていないのですが。) - ASCII : 下位7ビットのみを使用した1バイトエンコーディング。(ユニコードコードポイント0-127。) アクセントなどはありません。
- ANSI: ANSIエンコーディングは1つではありません。通常、人々が「ANSI」と言った場合、それは「私のシステムのデフォルトのロケール/コードページ」という意味です。 エンコーディング.Default であり、多くの場合 Windows-1252 が、他のロケールである場合もある。
にもあります。 私のユニコードのページ と Unicodeの問題をデバッグするためのヒント .
もう一つの大きなコードのリソースは unicode.org このページには、読み切れないほどの情報が含まれていますが、最も有用なのは コードチャート .
関連
-
[解決済み] UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 20: ordinal not in range(128)
-
[解決済み] ノンチャラクターU+FDD0~U+FDEFは何のためにあるのですか?
-
[解決済み] 文字列リテラルの前にある'b'文字は何を意味するのでしょうか?
-
[解決済み] テキストがボックスで表示されるのはどういう意味ですか?
-
[解決済み] 文字のASCII値を取得する方法
-
[解決済み] Javaでプレーンテキストファイルを読み込む
-
[解決済み] UTF-8とBOMなしUTF-8の違いは何ですか?
-
[解決済み] UTF-8、UTF-16、およびUTF-32
-
[解決済み] ASCIIとUnicodeの違いは何ですか?
-
[解決済み] MySQLのutf8mb4とutf8 charsetsの違いは何ですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】このUnicode結合文字はどうなっているのか、どうすればフィルタリングできるのか?
-
[解決済み] エスケープ文字は何ですか?
-
[解決済み] ノンチャラクターU+FDD0~U+FDEFは何のためにあるのですか?
-
[解決済み] 時間」を表すUnicodeの文字は?
-
[解決済み] UTF-8とUnicodeの違いは何ですか?
-
[解決済み] HTTPのContent-Dispositionヘッダーのファイル名パラメータをエンコードする方法は?
-
[解決済み] Windowsのコマンドラインでunicode文字を使うには?
-
[解決済み】Unicode、UTF、ASCII、ANSIのフォーマットの違いについて
-
[解決済み】Markdownの構文でディレクトリとファイル構造を表現する【終了しました
-
[解決済み】UnicodeとUTF-8の違いは何ですか?重複