81

Google Web Fonts 選択文字セット

Google Web Fonts の一部のフォントは、複数の「文字セット」をサポートしています。問題は、私が使用する Web フォントが「ラテン」グリフのみを提供する場合、グリフがサポートされていない言語にページを翻訳するユーザーは、めちゃくちゃなテキストにはっきりと気付くでしょう。

Web フォントが、英語以外の世界で最も人気のある言語 (スペイン語、ドイツ語、フランス語など) をサポートすることを望みます。

この目的のために、「ラテン語」と「ラテン語拡張」が正確に対応している言語を個別に知りたいと思います。

答えは次のようになると思います。

Latin Character Set & Supported Languages:

- ..........
- ..........
- ..........

Latin-Extended Character Set & Supported Languages:

- ..........
- ..........
- ..........

Google Web Fonts のドキュメントや Google でこの情報を見つけることができませんでした。

4

1 に答える 1

126

ラテン

別名Unicode Latin1-Supplement(U + 0080からU + 00FF)は、主に西ヨーロッパの言語をサポートすることを目的としています(フランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語、アイルランド語、アイスランド語、スカンジナビア諸国の言語、および意図せず他の言語もサポートする予定です)以下のリストに記載されています)。英語は標準 ASCII でサポートされています。ASCII (最初の 127 文字、そのうち 95 文字は U+0020 から U+007E の書記素) は、Basic Latin という名前の Unicode の最初のブロックとして配置されました。このブロックは「Latin」の一部と見なされ、通常は非ラテン フォントでもサポートされており、システム フォントとして使用できます (ローカライズされていないほとんどの低レベル プログラムでは ASCII がハードコードされています)。

ラテン拡張

Latin Extended on Google フォントは、実質的にLatin-Extended-A をブロックすることを意味します(U+0100 から U+017F) は、("Latin" と組み合わせて) すべてのヨーロッパ ベースのラテン語で書かれたテキストをサポートする必要があります。インターネットは米国で登場したため、ASCII はそのネイティブ コードでした。次に、西ヨーロッパをサポートするために、8 ビット コードページの上半分の ISO-8859-1 (Latin1) 標準が定義され、Latin1-Supplement Unicode ブロックに変換されました。その他の 8 ビット ISO-8859 ヨーロッパ ラテン標準 (Latin 2 East、Latin 3 South、Latin 4 North) は統合され、Latin-Extended-A ブロックに移動されました。これらのラテン標準は多くの文字をラテン 1 と共有していたため、「ラテン拡張」範囲のほぼすべてのヨーロッパ言語 (マルタ語、ラトビア語、リトアニア語を除く) には、ラテン 1 補足も必要です。これは、通常、「Latin-Extended」フォントは必ずしも「Latin」カテゴリのスーパーセットではないことを意味します。

Unicode には、ヨーロッパ以外のラテン文字であるアゼリ語 Ə とルーマニア語の Ș, Ț (以前の間違いを修正するため) のサポートを主に追加した Latin-Extended-B ブロックもありますが、これらの文字はしばしば Ä、Ş、Ţ に置き換えられます。 Extended-A (私のルーマニア人の友人は、それは受け入れられない代替品だと言いましたが)。サポートには、ベトナム語 Ơ、Ư (ただし、これは Google フォントに独自のカテゴリがあります) と、Latin-Extended-Additional ブロッ​​クも必要とするいくつかのアフリカ言語も含まれます。

アフリカのラテン語は、ほとんどの場合、Google の拡張ラテン語カテゴリではサポートされていません (互換性のある Google フォントのリストは以下にあります)。時代遅れで今日ではほとんど役に立たない文字や記号を含む、さらに風変わりな C、D、および E 拡張機能 (合計 252 文字) があります。この表はこれをまとめたものです (ブロックの主な意図を理解するためだけに、100% 正しいわけではありません)。

--------------------------------------------------------------------
| Unicode Latin Set         | Latin Support       | Google Name    |
|==================================================================|
| Basic Latin (aka ASCII)   | English             |                |
| Latin1-Supplement         | Western European    | Latin          |
|------------------------------------------------------------------|
| Latin Extended A          | European based      | Latin Extended |
|------------------------------------------------------------------|
| Latin Extended B          | non-European        | Vietnamese     |
|------------------------------------------------------------------|
| Latin Extended Additional | African             |                |
|------------------------------------------------------------------|
| Latin Extended C, D, E    | Historical, Exotic  |                |
--------------------------------------------------------------------

Google によるフォントの分類方法

ほとんどの作成者は Unicode ブロックでフォントを作成しており、一部の作成者は選択した言語のみをサポートしています。言語にラテン語拡張 A ブロックの文字が含まれている場合、Google はそれをラテン語拡張カテゴリに分類します。たとえば、Lato フォントはポーランド語の文字 (著者はポーランド人) のみをサポートしていますが、Google の "Latin Extended" カテゴリに含まれており、Web 上には情報がありません。(フォントの詳細に [グリフ] タブが追加されましたが、すべてのグリフがフォントに表示されるわけではありません。)

Google フォントの「言語」フィルターはかなり混乱していて不明確です。デーバナーガリー語 (言語ではありませんが、書記体系と Unicode ブロックです)、「ラテン語」と「ラテン語拡張」 (言語ではありませんが、Google の疑似ブロック) が含まれています。および他のブロックの文字を使用する一部の言語。ブロックのサポートと言語のサポートを区別するための明確な分離はなく、サポートが完全か部分的かもわかりません。とりあえず、これを見つける唯一の方法は、以下のリストから文字を表示することです.

言語サポート

Omniglotやその他の情報源で 調べた以下のラテン文字のアルファベットのリストから、私は数えません:

  • 一般に個別の文字に置き換えられるLatin Extended の digraphs (Æ は Latin1-Supplement でサポートされ、ß は以前 digraph でした)
  • 質問はラテン語と拡張ラテン語に関するものであるため、ラテン語以外のアルファベット。一部の言語では 2 つの書記体系が使用されます。正式な措置が講じられるまで (カザフ語など)、ラテン語がまれな場合 (アブハズ語など) にはこれらを含めません。
  • 少数派および死んだ言語(アディゲ語、アラゴン語、アルキ語、アレンテ語、古いバルト諸語、ビスラマ語、キンブリア語、チャモロ語、チュヴァシ語、キプロス語、ダレカルリア語、エクストレマデュラ語、ファラ語、エルフダリア語、フェロー語、フリジア語、ギルバート語、ジェノバ語、グロサ語、ハイダ語、エスキモー アレウト語)言語、イキズ語、イヌピアク語、ラトガリア語、イストリオット語、リヴォニア語、ラディン語、カシュビア語、マーシャル語、ミラン語、古ノルド語、ヌクサルク語、オック語、ロマンシュ語、ロトカス語、サーミ語、サモア語、ソルブ語上および下語、タヒチ語、タウル語、テトゥム語、トンガ語、ウルリシア語、ヤップ語、ズニ語、インド固有のラテン文字)
  • 他の言語の方言であり、同じ正書法を共有する、政治的に宣言された言語 (アメリカ英語、ボスニア語、モンテネグロ語)
  • ピジン言語とクレオール言語(アルザス語など) は、分類が難しく、2 つの言語のサブセットとしてアルファベットを使用して 2 つの言語を混在させることが難しいためです (それらは元の言語で時間とともに解消される傾向があります)。
  • アルファベットの最新バージョンでは使用されていない歴史的な文字 (ダブル グレイブ アクセント、ſ、ĸ など)
  • 言語の不可欠な部分ではないための通貨記号
  • ピンイン、IPA、UPAなど、ほぼ言語学者専用の音訳文字

重要な情報が欠けている場合や、電子通信で少数言語が使用されている場合はコメントしてください。太字は、国全体の公用語です。このリストには、少なくとも数十万人が話す言語があります。

ASCII (Basic Latin、非ラテン フォントでもサポートされることが多い)

古典ラテン語、アイマラ語(ボリビア)、アフリカーンス語(南アフリカ)、アストゥリアス語(スペイン)、コルス語(フランス)、オランダ語フィジー語、英語グリーンランド語、ゲール語(スコットランド)、ギルバート語(キリバス)、ハイチ語、ヒリガイノン語(フィリピン)、ロンバルド語(イタリア)、マレー、ショナ(ジンバブエ)、シチリア、スワヒリ(中央アフリカ)。

ラテン

  • アルーマニア語 (バルカン) Ã
  • ブルトン語 (フランス) Â、Ê、Î、Ô、Û、Ù、Ü、Ñ
  • アルバニア語Ç, Ë (Ç は Arbëresh 方言ではありません)
  • カタロニア語 À, É, È, Í, Ï, Ŀ, Ó, Ò, Ú, Ü, Ç (Ext-A の Ŀ は、インターパンクト · 文字を使用して L と記述できます)
  • セブアノ語 (フィリピン) Ñ
  • デンマーク語Æ、Å、Ø
  • フィンランド語Å、Ä、Ö、Š、Ž (Ext-A のŠ、Ž はめったに使用されず、S、Z を使用できます)
  • フィリピン語Á, À, Â, É, È, Ê, Ë, Í, Ì, Î, Ñ, Ó, Ò, Ô, Ú, Ù, Û
  • フランス語のÆ, Œ, Â, À, É, È, Ê, Ë, Ç, Î, Ï, Ô, Û, Ü, Ÿ, », « (内線 A の Œ は標識で使用されますが、人々は通常、代わりにメッセージに oe、まれに Ext-A の Ÿ はフランス語の名前のみ、残りはラテン語の ÿ を含む 1-補足、この背後にある話 [fr]ウィキペディアの注釈 [en] )
  • ドイツ語Ä、Ö、Ü、ß
  • アイスランド語Æ、Á、É、Í、Ó、Ö、Ú、Ý、Þ、Ð
  • アイルランド語Á、É、Í、Ó、Ú
  • イタリア語のÌ、Ù、ª、º (最後の 2 つはアンダースコアが付けられることがあります。英語では、Numero でも人気があります - Nº)
  • Khasi (インド) Ñ, Ï
  • ルクセンブルク語Ä、Ë、É
  • ノルウェー語Æ、Å、Ø
  • ピエモンテ語 (イタリア) Ë, Ò
  • ケチュア語 (ボリビア) Ñ
  • ポルトガル語Á、Â、Ã、À、Ç、É、Ê、Ó、Ô、Õ、Ú、ª、º
  • サルデーニャ語 (イタリア) Ç
  • スペイン語、ガリシア語、バスク語 (別名エスカラ) (スペイン) Ñ, ¿, ¡, ª, º
  • スウェーデン語Å、Ä、Ö

ラテン拡張

  • Azeri Ç, Ğ, I (ドットなしの小文字), İ, Ö, Ş, Ü, Ə (Ext-B の Ə は Ä で置き換え可能で、トルコ語と同じアルファベット)
  • クリミア・タタール語 (ロシア) Â、Ç、Ğ、I (ドットなしの小文字)、İ、Ñ、Ö、Ş、Ü
  • チェコ語Á、Č、Ď、Ě、É、Í、Ň、Ó、Ř、Š、Ť、Ú、Ů、Ý、Ž
  • エストニア語Ä、Ö、Õ、Ü、Š、Ž
  • エスペラント語 (国際) Ĉ、Ĝ、Ĥ、Ĵ、Ŝ、Ŭ
  • フリウリ語 (イタリア) Â、Ê、Î、Ô、Û
  • ガガウズ(モルダビア語) Ä、Ç、Ê、I (ドットなしの小文字)、İ、Ö、Ş、Ţ、Ü
  • Guaraní (パラグアイ) Á, Í, Ó, Ã, Ẽ, G̃, Ĩ, Ñ, Õ, Ũ, Ỹ (Ext-A からの Ĩ, Ũ, Ext-Additional からの Ẽ, Ỹ, G̃ は Unicode ではなく、組み合わせのみExt-A 範囲外の文字は、曲折アクセント記号 (Ê、Ĝ、Î、Û、Ŷ) で表記されることがよくあります。
  • ハワイ語 Ā, Ē, Ī
  • ハンガリー語Á、É、Í、Ó、Ö、Ő、Ú、Ü、Ű
  • カザフ語(2017 年から 2025 年にキリル文字から移行予定) Ä、Ç、Ğ、I (ドットなしの小文字)、İ、Ŋ、Ö、Ş、Ü (複数回改訂、2019 年版)
  • クルド語Ç, Ê, Î, Ş, Û
  • ラトビア語Ā、Č、Ē、Ģ、Ķ、Ī、Ļ、Ņ、Ō、Ū、Ŗ、Š、Ž
  • リトア語Ą、Č、Ę、Ė、Į、Š、Ų、Ū、Ž
  • マルタ語Ċ, Ġ, Ħ
  • マオリ語 Ā, Ē, Ī, Ō, Ū (少数派ですが、2015 年以降は知名度と人気が高まっています)
  • ポーランド語Ą、Ć、Ę、Ł、Ń、Ó、Ś、Ź、Ż
  • Romani (国際語) Č, Š, Ž (話し言葉ですが、めったに書かれた言語)
  • ルーマニア語Ă, Â, Î, Ș, Ț (ラテン語 Ext-B の Ș, Ț、Ext-A の Ş, Ţ を使用できます)
  • サーミ語 (北部の少数民族言語ですが、Ext-A に排他的な Ŧ があります) Á、Č、Đ、Ŋ、Š、Ŧ、Ž
  • セルビア・クロアチア語Ć、Č、Đ、Š、Ž
  • スロバキア語Ä、Á、Č、Ď、É、Í、Ĺ、Ľ、Ň、Ó、Ô、Ú、Š、Ŕ、Ť、Ý、Ž
  • スロベニア語Č、Š、Ž
  • タタール語 (2012 年以降) Ä、Ç、Ğ、İ、I (ドットなしの小文字)、Ñ、Ö、Ş、Ü
  • トルコ語Ç、Ğ、I (ドットなしの小文字)、İ、Ö、Ş、Ü
  • ベトナム語Ă, Â, Đ, Ê, Ô, Ơ, Ư (Ext-B の Ơ, Ư に加えて、声調の組み合わせ以下の分音記号を組み合わせて、Google フォントに特別なカテゴリがあります)
  • ウェールズ語 Â、Ê、Î、Ô、Û、Ŵ、Ŷ

Latin Extended、African (ほとんどの場合、Latin-Extended フォントではサポートされていません) . アフリカ アルファベットの完全なサポートには、Ubuntu、Fira Sans、EB Garamond、Tinos、News Cycle、Didact Gothic、M Plus、Sawarabi、Cousine、Caudex、Judson、Andika (そしてもちろん Noto、以下を参照) があります。

  • バーリ語 (コンゴ) Ŋ, Ö
  • バンバラ(マリ) Ɛ, Ɲ, Ɔ (すべて Ext-B から)
  • ベルベル語 (トゥアレグ) (サハラ) Ă, Ḍ, Ɣ, Ǝ, Š, Ž, Ḥ, Ḷ, Ṣ, Ṭ, Ẓ (外線 B の Ɣ, Ǝ、内線追加のドット付き文字)
  • チチェワ (チェワ) (東アフリカ) Ŵ
  • ダグバニ(コンゴ) Ɛ, Ɣ, Ɔ, Ŋ, Ʒ (内線 B の Ɛ, Ɣ, Ɔ)
  • Dinka (スーダン) Ä, Ë, Ɛ, Ɛ̈, Ɣ, Ï, Ŋ, Ö, Ɔ, Ɔ̈ (Ext-B の Ɛ, Ɣ, Ɔ, Ɛ̈, Ɔ̈ は Unicode ではなく、ダイアクリティカルマークを組み合わせた場合のみ)
  • Fula (西アフリカ) Ɓ, Ɗ, Ƴ, Ŋ (Ŋ は Ext-A から、残りは Ext-B から)
  • ハウサ語(チャド語) Ɓ、Ɗ、Ƴ、Ƙ、R̃ (R̃ は Unicode にはありません。分音記号を組み合わせた場合のみ、残りは Ext-B から)
  • イボ語(ナイジェリア) Ṅ, Ị (Ext-Additional)
  • マダガスカル語 (マダガスカル) N̈ (Unicode にはありません。発音区別記号を組み合わせた場合のみ、ラテン語の Ñ に置き換えることができます)
  • 汎ナイジェリア語 Ɓ, Ɗ, Ǝ, Ẹ, Ị, Ƙ, Ṣ, Ụ (Ext-B の Ɓ, Ɗ, Ǝ, Ƙ、Ext-Additional の Ẹ, Ị, Ṣ, Ụ)
  • Wolof (セネガル) À, É, Ë, Ñ, Ŋ, Ó
  • ヨルバ語(西アフリカ) Ẹ、Ọ、Ṣ (Ext-Additional + 結合トーン Á、À、Ā)

分音記号の組み合わせ

または、フォントが Combining Diacritical Marks ブロック (U+0300 から U+036F) をサポートしている場合があります。たとえば、(別名、構成済みの文字) または+Řとして入力できます。Unicode をサポートするプログラムは、同じものを表示および処理し、それを処理するための API を提供する必要があります(分音記号を分解するためのString.normalize()など)。間違った配置 ( Ɛ̈ のウムラウトが低すぎるように、このフォントでは修正されるようです) については、このトピックに関する非常に詳細なUnicode Q&Aを参照してください。U+0158RU+030C

ラテン語の非ラテン文字

多くのラテン語フォントは、ラテン語のテキストでは一般的であるため、ラテン語の範囲外のいくつかの文字をサポートしています。

  • ギリシャ語 μ (ギリシャ語およびコプト語の Unicode ブロック U+0370 から U+03FF のマイクロとして使用) と、一般的な記号として使用されるその他の文字 (λ、π、α、β、γ、δ、ε、Σ、Ω) - 半分Google の Latin-Extended フォントのうち、このフォントはサポートされていません
  • bullet (Unicode ブロック U+2000 から U+206F までのこのようなリストで使用されます)
  • 開始引用符と終了引用符“, ”, ', ' およびおそらくそれらの低い開始バージョン „ と ‚ -ウィキペディアで引用符の正しい使用法を参照してください
  • U+2010 から U+2015 までのダッシュ。ウィキペディアでダッシュの正しい使い方を参照してください
  • たぶん、U+20A0 から U+20CF までのいくつかの通貨記号(€ が最も一般的で、Google フォントで十分にサポートされています)

あなたのフォントがそれらをサポートしていない場合は、この文のように代替フォントとどのように組み合わせるかを試してみることをお勧めします (箇条書きを含めてコピーして貼り付けます)。

• 「μF ~ mF の範囲の「安い」コンデンサを 1 パック 2 ユーロで販売しています」</p>

フォントのカスタマイズ

Font Squirrelサービスで一部のフォントをカスタマイズしたり (ライセンスで許可されている場合)、それらをバックアップとして使用したりすることができます。

大量の文字を含むフォント:

  • 11+k 文字、1.5 MB の見栄えの良いセリフQuiviraオープンタイプ フォントが本当に気に入っています。
  • 多くのコンピュータには Arial Unicode がインストールされています (MS Office の一部、50+k 文字、22 MB)。
  • Google によるNoto プロジェクトがあり、セリフ、サンセリフ、UI フォントの最新の Unicode 文字をすべて含み、ブロック サポート (1.1 GB) で適切にソートされています。
  • 最後の手段のバックアップ フォントとして、見栄えの悪い Unifont (50+k 文字、ただし 11 MB のみで、組み込みデバイスに適している)を検討することができます。

一部の分音記号がサポートされていないフォントが本当に好きな場合は、Font Forge を使用してサポートを追加するのは非常に簡単です。その場合は、フォントのライセンスを注意深く読んでください。法的な観点からは、フォントはソフトウェアです。

于 2013-02-15T15:24:04.327 に答える