Microsoft Office XML ファイル (この場合は .docx) をプログラムで画像にレンダリングするのにかかる労力を調査しています。説明のために、上記のファイルの Apple の QuickLook プレビューに似たものを実現したいと考えています。要件:
- 移植可能である必要があります (具体的には、Windows や、Microsoft Office を使用するその他のプラットフォームでは実行されません)。
- ヘッドレスで、適度にリソースを制限する必要があります (VPS を考えてみてください!)。
- できれば、自己完結型の、よく管理されたオープンソース ソリューション:)
- テキスト抽出はいいでしょう(ただし、そのために別のライブラリを使用できます-私はすでにこれを持っています)
- 優れたオフライン ソリューションが見つからない場合、最後の手段として優れたオンライン サービスを利用できます。
- 精度は良いですが、ここでの主な目標ではありません。
そのようなライブラリを見つけようとする私の試みは、完全には成功していません。OpenOffice から派生したと思われる Java ベースのプロジェクトがいくつかありますが、それらはすべて少し重いように見えるか、フォーカスが間違っているように見えます (つまり、テキスト抽出、検索、ドキュメント生成)。
繰り返しますが、ドキュメントを (たとえば PNG に)レンダリングしようとしています。速度とメモリの使用は、OLE 画像、数式、高度な書式設定などの機能よりも重要です。