0

ドキュメントのコンテンツを検索するためのアプリケーションを作成し ています。メモ帳で編集可能なドキュメントを検索するためのコードを既に作成しています。

docx ファイルについても同じことをしたいと考えています。いくつかの研究の後、私はこれらの2つのことを思いついた

  1. http://www.infoq.com/articles/cracking-office-2007-with-java この方法では、docx ファイルを抽出してから xml ファイルを検索する必要がありますが、これには抽出部分の余分なオーバーヘッドが伴い、率直に言って、私はそうしません。 xml ファイルの処理方法を知っている (属性コンテンツの破棄など)

  2. http://www.javadocx.com/download このメソッドを使用すると、jar ライブラリをプロジェクトにインポートでき、それを使用して docx ファイルを作成できると思われますが、それを使用して docx ファイルを開く方法がわかりません

同じアクションを実行するための代替方法を誰かに勧めたり、上記の2つの方法を手伝ってもらえますか?

4

1 に答える 1

1

http://tika.apache.org/または docx4j または POI を試してください。

于 2011-07-07T22:45:44.407 に答える