プログラムを使用してポストスクリプトファイルにメタデータを挿入し、AdobeDistillerを使用してPDFに抽出します。ThomasMerzの「WebPublishingwithAcrobat-PDF」のオンラインの章から取得したこのコードを使用しています。
/pdfmark where {pop} {userdict /pdfmark /cleartomark load put} ifelse
[ /Title (mot accenté)
/Author (mot accenté)
/Subject (mot accenté)
/Keywords (mot accenté)
/DOCINFO pdfmark
結果のPDFのメタデータを見ると、アクセント付きの文字が「?」に変わります。[件名]フィールドと[キーワード]フィールドに入力しますが、[タイトル]フィールドと[作成者]フィールドには入力しません。文字は同じASCII233です
それらを8進数のエンコーディング(\ 351)に置き換えてみましたが、同じ結果になりました(タイトルと作成者は大丈夫、件名とキーワードはめちゃくちゃです)。
ファイルのエンコーディングはlatin-1、unix eol
アドビのフォーラムで言及を見つけましたが、その答えは私には意味がありませんでした。
http://forums.adobe.com/message/1165593 および http://forums.adobe.com/thread/307687
エンコーディングをutf-8に変更し、文字をバイナリで挿入しました(VIM:<Ctrl-v>
u00e9)。変更はありません。いくつかの場所にBOMを挿入しようとしましたが、機能しませんでした。
これは、Acrobat Pro 9(9.3.3177)のDistillerを使用したものです。
AcrobatPro7ではこの問題に気づきませんでした。
ポストスクリプトファイルを変更するときにアクセント付き文字をすべてのメタデータフィールドに入れる回避策を知っている人はいますか、それとも間違っているかどうか教えてください。
異なるフィールドが同じバイトを受け入れないのは奇妙に思えます。
おそらく関連するSOの質問:PDFのUnicode
すべてのフォントを埋め込みます。