[解決済み] ASCIIとUnicode+UTF-8の比較
2022-03-02 23:52:18
質問
読んでいたもの Joel Spolskyの「The Absolute Minimum」で文字コードについて解説しています。 . ASCII は Code-point + Encoding scheme で、現代では Code-point scheme として Unicode を、Encoding scheme として UTF-8 を使っていると理解しています。これは正しいのでしょうか?
どのように解決するのですか?
はい、ただしUTF-8は an エンコード方式です。その他の符号化方式としては、UTF-16(2種類のバイトオーダーを持つ)、UTF-32があります。(混乱を避けるため、マイクロソフト社のソフトウェアでは、UTF-16スキームを「ユニコード」と呼んでいます)。
また、正確には、ASCIIを定義するアメリカ国家規格は、文字の集まりとそのコーディングを7ビット量として規定しており、バイト単位で特定の転送エンコーディングを指定しているわけではありません。かつては、5つのASCII文字を36ビットの記憶単位にまとめたり、8ビットバイトをチェック目的(パリティビット)や転送制御のために余分なバイトを使用するなど、さまざまな方法で使用されていた。しかし現在では、1つのASCII文字を、最初のビットを0に設定した1つの8ビットバイトとしてエンコードするように使用されています。これは デファクト 標準的な符号化方式で、多くの仕様で暗示されていますが、厳密にはASCII規格の一部ではありません。
関連
-
[解決済み] UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 20: ordinal not in range(128)
-
[解決済み] 文字列リテラルの前にある'b'文字は何を意味するのでしょうか?
-
[解決済み] 特定のUnicode文字を含むコメントでのJavaコードの実行が許可されているのはなぜですか?
-
[解決済み] UTF-8とBOMなしUTF-8の違いは何ですか?
-
[解決済み] Pythonのunicode文字列のアクセントを除去(正規化)する最良の方法は何ですか?
-
[解決済み] UTF-8とUnicodeの違いは何ですか?
-
[解決済み] 最近のPerlはなぜデフォルトでUTF-8を避けるのですか?
-
[解決済み] PythonでUnicode(UTF-8)のファイル読み書きをする。
-
[解決済み】文字列フラグ "u "と "r "は一体何をするのでしょうか、そして生の文字列リテラルとは何でしょうか?
-
[解決済み】ユニコード1文字には何バイトかかりますか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] エスケープ文字は何ですか?
-
[解決済み] テキストがボックスで表示されるのはどういう意味ですか?
-
[解決済み] 時間」を表すUnicodeの文字は?
-
[解決済み] ASCIIとUnicode+UTF-8の比較
-
[解決済み] Windowsのコマンドラインでunicode文字を使うには?
-
[解決済み】Unicode、UTF、ASCII、ANSIのフォーマットの違いについて
-
[解決済み】Markdownの構文でディレクトリとファイル構造を表現する【終了しました
-
[解決済み】UnicodeとUTF-8の違いは何ですか?重複
-
[解決済み】「検索」を表すユニコードグリフシンボルはありますか【終了しました
-
[解決済み] 実際に使われている非BMPのUnicode文字で最も多いものは何ですか?[クローズド]