1. ホーム
  2. fonts

[解決済み] Google Web Fonts のフォントで "latin" と "latin-extended" のグリフがサポートする言語?

2023-07-15 20:38:37

質問

Google Web Fonts の一部のフォントは、複数の "文字セット" をサポートしています。私が使用している Web フォントが、"latin" グリフのみを提供している場合、グリフがサポートされていない言語にページを翻訳するユーザーは、明らかにめちゃくちゃなテキストに気づくだろうということです。

私のウェブフォントは、英語以外の世界で最も人気のある言語、たとえば、スペイン語、ドイツ語、フランス語などをサポートしてほしいのです。

この目的のために、quot;latin" および "latin-extended" が個別に、正確にどの言語に対応しているかを知りたいのですが、どうすればよいでしょうか。

私は、このような答えを期待しています。

Latin Character Set & Supported Languages:

- ..........
- ..........
- ..........

Latin-Extended Character Set & Supported Languages:

- ..........
- ..........
- ..........

Google Web Fontsのドキュメントや、ググってもこの情報は見つかりませんでした。

どのように解決するのですか?

ラテン語

別名:ユニコード ラテン語1-補足 (U+0080 から U+00FF) は、主に西ヨーロッパの言語 (フランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語、アイルランド語、アイスランド語、スカンジナビア諸国の言語、意図せず下のリストにある他の言語も) をサポートすることを意図しています。英語は、標準的なASCIIでサポートされています。ASCII(最初の127文字、そのうちの95文字はU+0020からU+007Eまで)は、Basic LatinというUnicodeの最初のブロックとして配置されました。このブロックはラテン語の一部とみなされ、通常、ラテン語以外のフォントでもサポートされているため、システム フォントとして使用できます(ローカライズされていないほとんどの低レベル プログラムは ASCII をハードコードしています)。

ラテン語の拡張

Googleフォントのラテン語拡張とは、実質的にブロックのことです。 欧文拡張A (U+0100 から U+017F) を意味し、これは ("Latin" と組み合わせて) 欧州ベースのラテン語で書かれたすべてのテキストをサポートするはずのものです。インターネットは米国で生まれたので、ASCIIがそのネイティブコードでした。その後、西ヨーロッパをサポートするために8ビットコードページの上半分のISO-8859-1 (Latin1) 標準が定義され、これはLatin1-Supplement Unicodeブロックに変換されました。その他の8bit ISO-8859 European Latin standard (Latin 2 East, Latin 3 South, Latin 4 North) は統合され、Latin-Extended-Aブロックに移されました。これらのラテン語規格はLatin 1と多くの文字を共有しているため、quot;Latin-Extended"範囲内のほぼすべてのヨーロッパ言語(マルタ語、ラトビア語、リトアニア語を除く)にはLatin 1-Supplementも必要です。つまり、"Latin-Extended" フォントは通常、"Latin" のスーパーセットであり、必ずしもそうとは限りません。

Unicode には Latin-Extended-B ブロックもあり、これは主に非ヨーロッパのラテンアルファベット、Azeri Ə と Romanian Ș, Ț のサポートを追加しました (から 以前の間違いを修正 が、これらの文字はしばしば Extended-A の Ä, Ş, Ţ で置き換えられます (私のルーマニア人の友人は、これは受け入れがたい代物だと言っていましたが)。サポートには、ベトナム語の Ơ、Ư (ただし、これは Google フォントで独自のカテゴリがあります) と、アフリカのいくつかの言語も含まれ、これらは Latin-Extended-Additional ブロックを必要とします。

アフリカのラテン語の言語は、Google の Latin Extended カテゴリではほとんどサポートされていません (互換性のある Google フォントの一覧は以下のとおりです)。さらにエキゾチックな C、D、E 拡張 (合計 252 文字) があり、時代遅れで今日ではほとんど役に立たない文字や記号が含まれています。この表はこれを要約したものです (100% 正しくはありませんが、ブロックの主な意図のアイデアを得るには十分です)。

--------------------------------------------------------------------
| Unicode Latin Set         | Latin Support       | Google Name    |
|==================================================================|
| Basic Latin (aka ASCII)   | English             |                |
| Latin1-Supplement         | Western European    | Latin          |
|------------------------------------------------------------------|
| Latin Extended A          | European based      | Latin Extended |
|------------------------------------------------------------------|
| Latin Extended B          | non-European        | Vietnamese     |
|------------------------------------------------------------------|
| Latin Extended Additional | African             |                |
|------------------------------------------------------------------|
| Latin Extended C, D, E    | Historical, Exotic  |                |
--------------------------------------------------------------------

Googleのフォントの分類方法

ほとんどの作者は Unicode ブロックによってフォントを作成し、そのうちのいくつかは選択した言語のみをサポートします。その言語が Latin Extended A ブロックからのいくつかの文字を含んでいる場合、Google はそれを Latin Extended カテゴリに配置します。たとえば、Lato フォントはポーランド語の文字のみをサポートしていますが (作者はポーランド人です)、Google の "Latin Extended" カテゴリにあり、ウェブ上にはそれに関する情報はありません。(現在あるのは Glyphs タブがありますが、フォント内のすべてのグリフが表示されるわけではありません)。

Google フォントの "language" フィルターは、かなり混乱しており、不明瞭です: それは、Devanagari (これは言語ではなく、書記体系と Unicode ブロック)、"Latin" と "Latin Extended" (これは言語ではなく、Google の疑似ブロック) と他のブロックからいくつかの文字を使用するいくつかの言語があります。ブロックサポートと言語サポートを区別する明確な分離はなく、サポートが完全か部分的かもわかりません。当面は、以下のリストにある文字を表示させてみるしかない。

対応言語

からの ラテン文字のリスト で検査した結果 オムニグロット と他のソースは、私はカウントされません。

  • ラテン語から拡張されたディグラフ で、一般に別の文字に置き換えられる(Æ は Latin1-Supplement でサポートされ、ß は以前はダイグラフだった)。
  • 非ラテン語アルファベット ラテン語かラテン語拡張かについての質問なので。いくつかの言語では2つの文字体系を使用しています。ラテン語が珍しい場合(アブハズなど)、公式なステップが行われるまで(カザフなど)、私はこれらを含めない。
  • 少数言語と死語 (アディゲ語、アラゴン語、アルチ語、アレンテ語、旧バルト語、ビスラマ語、チンブリア語、チャモロ語、チュバシュ語、キプロス語、ダレカリー語、エクストレマト語、ファラ語、エルフダリアン語、フェロー語、フリジア語、ジルベルト語、ジェノバ語、グローサ語、ハイダ語とエスキモー・アイルート語、イキス、イニュピアック。ラトガリア語、イストリオ語、リボニア語、ラディン語、カシュビアン語、マーシャル語、ミランダ語、古ノルド語、ヌクソール語、オック語、ロマンシュ語、ロトカス語、サーミ語、サモア語、上・下ソルビアン語、タヒチ語、タウル語、テトゥム語、トンガ語、ウリツィ語、ヤペ語、ズ二語、インドのラテンアルファベット)。
  • 政治的に宣言された言語 他の言語の方言に過ぎないが、同じ表記法を持つ言語(アメリカ英語、ボスニア語、モンテネグロ語)。
  • ピジンおよびクレオール言語 (アルザス語のような)分類が難しく、アルファベットを含む2つの言語の間で混在しているため(元の言語の中で時間の経過とともに溶解する傾向がある)。
  • 歴史的文字 最新バージョンのアルファベットでは未使用(ダブルグレイブアクセント、ſ、ĸなど)。
  • 通貨記号 言語の不可欠な部分でないため
  • 音訳文字 ほとんど言語学者しか使わない文字、すなわちピンイン、IPA、UPA

何か重要なことが抜けていたり、電子通信で少数言語が使われていたりする場合は、コメントをお願いします。 太字 は、主要な国全体の公用語です。このリストでは、少なくとも数十万人に話されている言語があります。

ASCII (基本ラテン語。非ラテン語のフォントでもしばしばサポートされる)

古典的なラテン語、アイマラ語 (ボリビア) アフリカーンス語 (南アフリカ)、アストゥリアス語 (スペイン)、コルシュ語 (フランス)。 オランダ語 , フィジー語 , 英語 , グリーンランド語 , ゲール語(スコットランド), ジルバータス語 (キリバス)。 ハイチ語 ヒリゲイノン(フィリピン)、ロンバード(イタリア)、マレー、ショナ(ジンバブエ)、シチリア、スワヒリ(中央アフリカ)です。

ラテン語

  • アロマニアン(バルカン半島)Ã
  • ブルトン語(フランス) Â, Ê, Î, Ô, Û, Ù, Ü, Ñ
  • アルバニア語 Ç, Ë (ÇはArbëresh方言にはない)
  • カタロニア語 À, É, È, Í, Ï, Ŀ, Ó, Ò, Ú, Ü, Ç (Ext-A の Ŀ は - 文字で L と書くことができる)
  • セブアノ語(フィリピン) Ñ
  • デンマーク語 Æ, Å, Ø
  • フィンランド語 Å, Ä, Ö, Š, Ž (Ext-A の Š, Ž はほとんど使われず、S, Z が使える)
  • フィリピン語 á, à, â, é, è, ê, ë, í, ì, î, ñ, ó, ò, ô, ú, ù, û
  • フランス語 Æ, Œ, Â, À, É, È, Ê, Ë, Ç, Î, Ï, Ô, Ù, Û, Ü, Ÿ, ", " (Œ は Ext-A から看板に使われているが、メッセージでは通常 oe が代わりに使われ、 Ext-A からの珍しい Ÿ はフランス語名のみ、残りは Latin1-supplement では ÿ を含めている) この[fr]にまつわる話 , ウィキペディアのノート [en] )
  • ドイツ語 Ä, Ö, Ü, ß
  • アイスランド語 æ, á, é, í, ó, ö, ú, ý, þ, ð
  • アイルランド語 Á, É, Í, Ó, Ú
  • イタリア語 Ì, Ù, ª, º(最後の2つはアンダースコアを付けることもあり、英語ではNumero - Nº も一般的です。)
  • カシ語 (インド) Ñ, Ï
  • ルクセンブルク語 Ä, Ë, É
  • ノルウェー語 Æ, Å, Ø
  • ピエモンテ語(イタリア) Ë, Ò
  • ケチュア語 (ボリビア) Ñ
  • ポルトガル語 á, â, ã, à, ç, é, ê, ó, ô, õ, ú, ª, º
  • サルデーニャ語 (イタリア) Ç
  • スペイン語 ガリシア語、バスク語(別名エスカーラ)(スペイン) Ñ、¿、¡、ª、º
  • スウェーデン語 Å, Ä, Ö

ラテン語拡張

  • アゼリ Ç, Ğ, I (ドットなし小文字), İ, Ö, Ş, Ü, Ə (Ext-B の は Ä で置き換え可能、その後トルコ語と同じアルファベットになります。)
  • クリミア・タタール語(ロシア) Â、Ç、Ğ、I(ドットなし小文字)、İ、Ñ、Ö、Ş、Ü
  • チェコ語 á, č, ď, ě, é, í, ň, ó, ř, š, ť, ú, ů, ý, ž
  • エストニア語 ä, ö, õ, ü, š, ž
  • エスペラント語(国際) Ĉ, Ĝ, Ĥ, Ĵ, Ŭ
  • Friulian (Italy) Â, Ê, Î, Ô, Û
  • ガガウズ語 (モルダビア) Ä, Ç, Ê, I(ドットなし小文字), İ, Ö, Ş, Ţ, Ü
  • Guaraní (Paraguay) Á, Í, Ó, Ã, Ẽ, G̃, Ĩ, Ñ,Õ,Ũ, Ỹ (Ext-A, Ext-Additional の Ẽ, G_1 は Unicode にはない, Ext-Aの範囲外の文字は、しばしばcircumflex (Ê, Ĝ, Î, Û, ) で表記されます。)
  • ハワイ語の Ā, Ē, Ī
  • ハンガリー語 á, é, í, ó, ö, ő, ú, ü, ű
  • カザフ語 (2017-2025年キリル文字から移行予定) Ä, Ç, ↪Lu_11E, I(ドットなし小文字), İ, Ŋ, Ö, Ş, Ü(複数回改訂しています。 2019年版 )
  • クルド語 Ç、Ê、Î、Ş、Û
  • ラトビア語 ā, č, ē, ģ, ķ, ī, ļ, ņ, ō, ū, ŗ, š, ž
  • リトアニア語 ą、č、ę、ė、mį、š、ų、ū、ž
  • マルタ語 Ċ, Ġ, Ħ
  • マオリ語 Ā, Ē, Ī, Ō, Ū(少数派だが、2015年から知名度・人気度が上昇)
  • ポーランド語 ą, ć, ę, ł, ń, ó, ś, ź, ż
  • ロマーニ語(国際語) Č, Š, Ž(話し言葉、ただし書き言葉はほとんどない)
  • ルーマニア語 Ă, Â, Î, Ș, Ț (Ș, Ț はラテン語の Ext-B から、Ş,Ţ は Ext-A から使用可能)
  • サーミ語(北部、少数言語、ただしExt-Aでは排他的なŦがある) Á、Č、Đ、、Ŧ、Ž
  • セルビア語-クロアチア語 Ć, Č, Đ, Š, Ž
  • スロバキア語 ä, á, č, ď, é, í, ĺ, ľ, ň, ó, ô, ú, š, ŕ, ť, ý, ž
  • スロベニア語 Č, Š, Ž
  • タタール語(2012年以降) Ä, Ç, ↪Lu_11E, İ, I(ドットなし小文字), Ñ, Ö, Ş, Ü
  • トルコ語 Ç, Ğ, I (ドットなし小文字), İ, Ö, Ş, Ü
  • ベトナム語 Ă, Â, Đ, Ê, Ô, Ơ, Ư (Ơ,Ư in Ext-B plus combining tones 0x300 grave accent À, 0x301 acute accent Á, 0x303 tilde Ã, 0x309 hook above ↪L_12↩, 0x323 dot below↪Lu_1EA0, see combining diacritic mark below Google fonts, has a special category on a font)。
  • ウェールズ語 Â, Ê, Î, Ô, Û, Ŵ, Ŷ

ラテン語拡張、アフリカ語 (ラテン語拡張フォントではほとんどサポートされていません) . の完全サポート アフリカのアルファベット は、Ubuntu、Fira Sans、EB Garamond、Tinos、News Cycle、Didact Gothic、M Plus、Sawarabi、Cousine、Caudex、Judson、Andika(そしてもちろんNotoも、下記参照)を持っています。

  • バーリ (コンゴ) Ŋ, Ö
  • バンバラ語 (マリ) Ɛ, Ɔ (すべてExt-Bより)
  • ベルベル語 (トゥアレグ) (サハラ) Ă, Ḍ, Ɣ, ↪Lu_18E, Š, Ž, Ḥ (Ḷ, Ṣ,Ṭから, Ext-B, 下のドットがある文字は Ext-Additional,)
  • チチェワ語 (チェワ語) (東アフリカ) Ŵ
  • ダグバニ (コンゴ) ↪L_190↩, Ɣ, Ɔ, Ŋ (Ext-B から Ɛ, Ɣ, Ɔ)
  • ディンカ語 (スーダン) Ä, Ë, Ɛ, Ɛ̈, Ɣ, Ï, ↪Lu_14A, Ö, Ɔ,Ɔ̈ (Ext-B,Ɣ,Ɔ̈からƐ, Unicodeではありません、結合発音符付きのみです)
  • Fula (西アフリカ) Ɓ, Ɗ, Ƴ (ŊはExt-Aから、残りはExt-Bから)
  • ハウサ語 (チャド) Ɓ, ↪Lu_18A, Ƴ, Ƙ, R̃ (R̃はユニコードにない、結合発音符のみ、残りは Ext-B から)
  • イグボ語 (ナイジェリア) Ṅ, Ị (エクストリーム・アディショナル)
  • マダガスカル語 (マダガスカル) N̈ (ユニコードにはない。発音区分符号を組み合わせることで、ラテン語の Ñ で代用できる)
  • パン-ナイジェリア Ɓ, Ɗ, ↪Lu_18E, Ẹ, Ƙ, Ṣ,Ụ (Ext-B, Ị, Ext-Additional の Ṣ, Ụ から)
  • ウォルフ語 (セネガル) À, É, Ë, Ñ, Ŋ, Ó
  • ヨルバ (西アフリカ) Ẹ, Ọ (外来語+結合音 Á, À, Ā)

ダイアクリティカルマークの組み合わせ

あるいは、フォントは Combining Diacritical Marks ブロックに対応している場合があります。U+0300 から U+036F まで。例えば Ř は次のように入力することができます。 U+0158 (別名 プリコンポジット文字 ) または R + U+030C . Unicode をサポートするプログラムは、同じものを表示し、扱い、それを処理するための API を提供する必要があります。 文字列.正規化() のように、発音区分符号を分解するための API を提供する必要があります。 レパートリー をサポートしていない場合、結合発音記号は少しずれた場所に配置されてしまうかもしれません ( の低すぎるウムラウトのようなものです。 はこのフォントでは修正されるようです)、この非常に詳細な ユニコード Q&A を参照してください。

ラテン語の言語における非ラテン語の文字

多くのラテン語のフォントは、ラテン語のテキストで一般的であるように、ラテン語の範囲外のいくつかの文字、すなわち、ラテン語の文字をサポートしています。

  • ギリシャ語μ (として使用されます。 マイクロ ギリシャ語とコプト語の Unicode ブロック U+0370 から U+03FF から)、および一般的な記号として使用されるその他の文字(λ、π、α、β、γ、δ、ε、Σ、Ω) - Google の Latin-Extended フォントの半数はこのフォントに対応していない。
  • 弾丸 (ユニコードブロック U+2000 から U+206F まで、このようなリストで使用されます)
  • 開閉引用符 ", ", ', ' と、多分その低開放バージョン " と ' - 引用符の正しい使い方を参照してください。 ウィキペディアで
  • ダッシュ U+2010 から U+2015 まで、ダッシュの正しい使い方を参照してください。 ウィキペディア
  • たぶん、いくつかの 通貨記号 U+20A0 から U+20CF まで (€ は最も一般的で Google フォントによく対応しています)

お使いのフォントがこれらをサポートしていない場合は、この文章のようにフォールバックフォントと組み合わせてみることをお勧めします(弾丸記号を含めてコピー&ペーストする)。

- "私たちはμF-mFの範囲で「安い」コンデンサを販売しており、1パック2ユーロです"

フォントのカスタマイズ

フォントをカスタマイズしたい場合は、次のようにします (ライセンスが許可されている場合)。 フォント リス サービスでカスタマイズしたり、バックアップとして使用することもできます。

文字数が豊富なフォント

  • 見栄えのするセリフが好きです。 キビラ 11+k 文字のオープンタイプフォント, 1.5 MB
  • 多くのコンピューターに Arial Unicode がインストールされています (MS Office の一部、50+k 文字、22 MB)。
  • があります。 能登プロジェクト これは、セリフ、サンセリフ、UI フォントの最新の unicode 文字をすべて含み、ブロックサポートごとにきれいに分類されています (1.1 GB)。
  • 最後の手段としてのバックアップフォントとして、醜い外観の ユニフォント (50+k chars ですが、11 MB しかなく、組み込みデバイスに優しいです)

いくつかの発音区分のサポートがないフォントが本当に好きなら、Font Forge を使ってサポートを追加するのはとても簡単なことです。その場合、フォントのライセンスを注意深く読んでください: 法的な観点から言えば、フォントはソフトウェアです。