ppt、pptx、doc、docxファイルを開いて解析し、そこからすべてのオブジェクトを抽出できるライブラリを探しています。
たとえば、pptでは、画像、テキスト、テーブルのオートシェイプなどのすべてのオブジェクトプロパティを抽出できます。次に、オブジェクトの場所/サイズとフォントサイズ/色/太字などのフォーマットを提供し、画像の場合は各画像を保存する機能を提供しますjpgファイルに。ライブラリは、スライド全体のスナップショットも取得できる必要があります。
私はこれを行うためにassoseを試みましたが、この情報を取得するのは正確ではありませんでした。すべてのプロパティを抽出するわけではなく、画像が正確でないためエクスポートされます。そのためにオープンオフィスライブラリを使用することについて何かアイデアはありますか?
私はJavaまたはC++ライブラリを使用できます。