2

ppt、pptx、doc、docxファイルを開いて解析し、そこからすべてのオブジェクトを抽出できるライブラリを探しています。

たとえば、pptでは、画像、テキスト、テーブルのオートシェイプなどのすべてのオブジェクトプロパティを抽出できます。次に、オブジェクトの場所/サイズとフォントサイズ/色/太字などのフォーマットを提供し、画像の場合は各画像を保存する機能を提供しますjpgファイルに。ライブラリは、スライド全体のスナップショットも取得できる必要があります。

私はこれを行うためにassoseを試みましたが、この情報を取得するのは正確ではありませんでした。すべてのプロパティを抽出するわけではなく、画像が正確でないためエクスポートされます。そのためにオープンオフィスライブラリを使用することについて何かアイデアはありますか?

私はJavaまたはC++ライブラリを使用できます。

4

2 に答える 2

1

職場では、openoffice Java APIを使用して、ppt/pptxファイルから画像を抽出しました。ここからドキュメントを使用しました。そのガイドの情報を使用して、必要なことを実行できると確信しています。

幸運を。

于 2011-01-21T08:19:06.783 に答える
1

1つのオプションはapachepoiライブラリです-周りに例があり、openofficeAPIよりも多くの資料があるようです。

于 2011-04-15T14:04:06.237 に答える