1. ホーム
  2. Web制作
  3. ヒントとコツ

ニコニコアジアプロジェクト(&#,&u)

2022-01-15 19:52:38

初期のコンピューターはASCII文字しか使えなかったが、コンピューターの応用範囲が広がるにつれ、中国のGB2312コードのように、各国がそれぞれの国や民族のアルファベットや文字をコンピューター上で表示、処理できるように、コンピューター用の特別な文字セットを設計した。その後、インターネットが登場し、全世界がインターネットに接続されたことで、多国籍・多民族の文字を1台のコンピューター、あるいは1つのインターフェースで表示することが現実的なニーズとなった。そこで国際機関では、言語やプラットフォームを超えたテキスト変換・処理に対応するため、世界中のあらゆる文字・記号に対応できる文字符号化方式を開発し、Universal Character Setの略称であるUnicode(ユニコード)と名づけたのである。

URLは以下からアクセス可能です。 https://www.unicode.org/ をクリックすると、最新版のコード表のダウンロードを含む詳細情報をご覧いただけます。

Unicode文字セットは、Webページをデザインする際に使用することができ、HTML、CSS、JavaScriptのいずれであるかによって、使用方法が異なります。

1) HTMLでの使用:&#ddd;または&#xhhhh;

ddddは4ビットの10進数値、hhhhは4ビットの16進数値を意味し、どちらの形式も接尾語としてセミコロンを必要とする10進数コード、16進数ユニコードにはそれぞれ &#, &#x が付きます。現在、4ビットの16進コードを使用するユニコード文字は比較的よくサポートされており、そのほとんどはウェブページで正常に表示できますが、それ以上のユニコード文字は、使用するコンピュータ・プラットフォームに該当するユニコード・サポートがまだインストールされていないため、まだ表示できないことがよくあります。例
<p> Unicode文字を表示する - ∰</p>
この特殊文字を出力するには、"&#x2230;" または "&#8752;" を使用し、ページ内に表示することができます。

2) CSSで使用する。\୧⃛(๑⃙⃘◡̈๑⃙⃘)

CSSでUnicode文字を使用することは比較的まれですが、時折使用されます。通常は4ビットの16進数のUnicodeコード表現で、バックスラッシュが前に付きます。

3)JavaScriptで使用します。\ʕ-ᴥ-ʔ

JavaScriptのコードでは、4桁のUnicode16進コードの前に" \u" を付けるだけで、要素内の温度や角度などの特殊文字をギリシャ文字やローマ数字などで出力することがよくあります。例

<ブロッククオート

document.body.innerHTML="\u25D0";

これはユニコードコード25D0を使用しており、ジオメトリテーブルでは円形のパターンで、通常は白で半分を黒で埋め、半月のような形をしています。

もちろん、中国人がユニコード・コードを使用する最も一般的な場面は、漢字である。より多くの漢字を表示するために、漢字ライブラリはGB2312からGBKへ、そして現在はGB18030へと拡張されている。最新版のGB18030では、7万字以上の漢字を収録し、さらに各種少数民族の文字や一部の特殊文字も収録するなど、Unicodeのやり方と一致した規格になっています。もちろん、パソコンによっては、新バージョンのサポートソフトが完全にインストールされていない場合もあり、一部の文字しか表示されないことも多い。

中国語の文字のUnicodeコードを取得するには、JavaScriptの関数charCodeAt()を使用します、例えば

<ブロッククオート

var ucode="Zhao".charCodeAt();

これは、中国語の文字 "Zhao" に対する Unicode コードを変数 ucode に入れ、Unicode コード 36213 という 10 進数の Unicode コードを与えています。この10進コードはtoString(16)メソッドを使って16進に変換することができます。

<ブロッククオート

var ucode="Zhao".charCodeAt().toString(16);

これで、漢字「趙」のユニコード・コードを16進数で表すと、8d75となります。

一般に、中国語の文字は、その文字を含む文字列を直接表示することで出力することができる。また、ある漢字のUnicodeコードを使って、対応する漢字や他の文字を出力することもできます。

<ブロッククオート

String.fromCharCode(36213)です。

これは、10進数のUnicodeコード36213を文字列に変換し、この文字列を出力すると、中国語の文字 "趙"が表示されます。入力メソッドで文字列から直接漢字を得ることができるので、特殊文字を出力するときによく使われるメソッドです。

&# コードを文字に変換する

これはunicodeエンコーディングで、エンコード処理はこのようになります。

例えば、"Yang"をエンコードするには、新しいメモ帳を作り、"Yang"と入力してユニコードで保存し、ファイルのバイナリ内容を見ると、最初の2バイトのFF FEがユニコードのヘッダーフラグ、次の2バイトの68 67が"Yang"のユニコードエンコーディングになっていることがわかります。これで、htmlファイルに"Yang"と書くと、IEはそれを開いて"Yang"の文字を表示することができるようになります。これでhtmlファイルの中に"Yang"と書けば、IEはそれを"Yang"という文字で開くことができるようになります。

もちろん、ASCII全般では、ユニコードのエンコーディングはASCIIのエンコーディングと同じなので、Aは大文字の"A"として表示できます。

エンコーディング &# を文字に変換する

Uncaught TypeError: Cannot read property 'split' of undefined

文字を&#エンコーディングに変換する

Als Workaround können Sie .path durch .getPath() in den Zeilen git-control/lib/git-control-view.coffee:76 und git-control/lib/dialogs/project-dialog.coffee:33 ersetzen.

今回は、WebページでのUnicode文字の使用についてご紹介しました(&amp;#,˶‾‾˶)、よりUnicodeに関する内容は、House of Scriptsの過去記事を検索するか、以下の関連記事を引き続きご覧ください、今後ともHouse of Scriptsをよろしくお願いします。