プログラムでPDFをHTMLに変換しようとしています。これまでpdftohtmlを使用してきましたが、ユーザーは結果に満足していません。
これが私が必要とするものです:
私はRubyonRailsを使用していますが、Unixで動作するツールはすべて、コマンドラインから呼び出すことができるので動作します。しかしもちろん、素敵な宝石やプラグインは完璧でしょう。
私はそれがオープンソースであることを望みます
画像を処理できる必要があります
必要に応じて画像を破棄するオプションがあればいいのですが
安定している必要があります
元のpdfに近いレイアウトでhtmlを返す必要があります(私はpdftohtmlを試しましたが、多くの場合、結果はそれほど良くありません)