できるだけ多くのフォーマットを保持しながら、PDF を処理して .doc を出力する方法を探しています。
何か案は?
openofficeをヘッドレス モードで使用できます。unoconvはシェル ユーティリティまたはpdftotextです。または、 jodconvereterを使用することもできます。私は小さな Ruby ラッパーconvert_officeを作成しました。サポートされている形式をチェックしてください。jodconverter は、openoffice を必要とする Java ライブラリです。