PDFファイルを処理していますが、可能な限り文字をUnicodeに変換したいと考えています。MathematicalPIファミリーの文字セットは、独自のシンボル名(「H11001」など)を使用しているように見えます。探索によって、次のようなテーブル(MathematicalPI-One用)を作成しました。
<chars>
<char charname="H11001" codepoint16="0X2B" codepoint="43" unicodeName="PLUS"/>
<char charname="H11002" codepoint16="0x2D" codepoint="45" unicodeName="MINUS"/>
<char charname="H11003" codepoint16="0XD7" codepoint="215" unicodeName="MULTIPLICATION SIGN"/>
<char charname="H11005" codepoint16="0X3D" codepoint="61" unicodeName="EQUALS"/>
</char>
誰かが私にこのような既存の変換テーブルを指摘できますか(理想的にはすべてのMathematicalPIセットに対して)。[グリフをグラフィカルに表示したくないのは、グリフをUnicodeの等価物として検索する必要があるためです。]
また、charnamesがC223(著作権用)の形式である同様のシンボルリソースがあるようです。これに関する情報をいただければ幸いです。
更新:@ user1808924の答えをはるかに超えるものが必要です-私はすでに独自の(部分的な)変換テーブルでコンパイルしているので、それを構築することは確かに可能です。MathematicalPI(数百)でグリフのリストをダウンロードして表示し、Unicode仕様を調べて同等性を作成することができます(ほとんどの場合、明確な同等性があると思います)。満足のいく答えには、何百もの同等物を含む表、またはこれがフォント作成者の著作権を侵害するという明確な声明が含まれます。
更新:@minopretと@Miguelの間で、マッピングを作成することは確かに可能です。MathPiセットは明確に定義されており(数百)、shapecatcherを使用すると、絵で最高のグリフを簡単に見つけることができます。マッピングは決定的なものではありませんが(つまり、Adobeのスタンプを使用)、価値があります。また、2つの異なるグリフが本質的に同一であるため、視覚的なマッピングが機能しない場合があると思います。たとえば、正三角形のINCREMENTまたはGREEK CAPITAL LETTER DELTAですか?
私が個人的に完全な表を完成させるとは思えません-いくつかの記号が何を意味するのかわかりません。しかし、私は科学技術医学(STM)出版で使用されるサブセットを作成したいと思っています。
@user1808924あなたがSOの初日にこれに答えたのに気づきました。バウンティ質問は通常(この場合のように)決定的な答えはあるが見つけるのが難しい難しい質問に対して提供されます。その分野の専門知識がない限り、通常、意見や推測を提供することは役に立ちません。