pdfファイルを解析しているときに、事前定義されたCMap(UniCNS-UTF16-H、ここで見つけることができますhttp://sourceforge.net/projects/cmap.adobe/files/cmapresources_cns1-6.tar.z/download)に遭遇します。調べてみると、単一のCIDを複数のUnicodeで参照できることがわかりました。
私の質問は、これの目的は何ですか?キャラクターをどのユニコードにマップする必要があるかをどのように知ることができますか?
cid2code.txtファイルのヘッダーには、「単一のCIDが単一のCMapファイル内の複数のエンコードポイントで参照されている場合があります。これらの場合は、同じ列内でコンマで区切られています。」しかし、それは理由を述べていません。
テクニカルノート#5080「CIDキーフォント用のAdobe-CNS1-6文字コレクション」を調べましたが、答えが見つかりませんでした。ですから、誰かが私にこれが説明されている箇所とそれに対処する方法を教えてくれれば、私は大いに感謝されます。