私の文書管理アプリでは、ASCII 以外の Unicode 文字 (日本語) を含む .docx ファイルを、docsplit を使用して (必要に応じて Ruby gem を介して) PDF に変換しています。私のMacでは問題なく動作します。私の Ubuntu マシンでは、結果の PDF には、Ruby を介して呼び出された場合でも、コマンド ラインで直接呼び出された場合でも、文字が配置されるはずの場所に正方形のボックスが表示されます。奇妙なことに、.docx ファイルを LibreOffice で直接開いて PDF エクスポートを実行すると、正常に動作します。そのため、docsplit が LO を呼び出す方法には、Unicode 文字が不適切に処理される原因となる側面があるように思われます。指定する必要がある可能性のあるオプションについて、ドキュメントとコードのさまざまな部分を精査しましたが、うまくいきませんでした。なぜこれが起こっているのかについてのアイデアはありますか?
FWIW、docsplit は、次のオプション行で LO を呼び出しますpdf_extractor.rb
。
options = "--headless --invisible --norestore --nolockcheck --convert-to pdf --outdir #{escaped_out} #{escaped_doc}"
出力形式の後にオプションで出力フィルタ a in を付けることができることにpdf:output_filter_name
気付きました -- これは使用について考える必要がありますか?