1. ホーム
  2. string

[解決済み] UTF-32とUCS-4の違いは何ですか?

2022-02-19 12:04:32

質問内容

UTF-32とUCS-4の違いは何ですか? UTF-32は固定幅のエンコーディングではないのですか?

どのように解決するのですか?

UTF-32 のサブセットとして開始されました。 UCS-4 . 現在では、UTF-32 標準が Unicode のセマンティクスを追加していることを除けば、同一です。詳しくは ウィキペディア :

オリジナル ISO 10646規格では、31ビットのエンコード形式である UCS-4 この場合、ユニバーサル・キャラクタ・セットの各エンコードされた文字が (UCS)を32ビットのフレンドリコード値で表し、コードスペースは以下の通りです。 0から16進数で7FFFFFFFFまでの整数のことです。

実際に使用されているのは17機だけなので、現在のコードポイントはすべて の間にある。 0 0x10FFFF . UTF-32はUCS-4のサブセットです。 のみを使用する この範囲 のPrinciples and Proceduresという文書があるので JTC1/SC2/WG2 では、今後すべての文字の割り当てが BMPまたは第1-14補助プレーンに制限されるため、UTF-32は は、すべてのユニコード文字を表現することができるようになります。従って UCS-4 とUTF-32は、UTF-32の規格が以下の点を除いて同一になりました。 追加のユニコード・セマンティクス .

しかし、私は正確には、何が additional Unicode semantics を意味します。多分、誰かがより良い答えを提供することができます。