ドキュメントのコンテンツを検索するためのアプリケーションを作成し ています。メモ帳で編集可能なドキュメントを検索するためのコードを既に作成しています。
docx ファイルについても同じことをしたいと考えています。いくつかの研究の後、私はこれらの2つのことを思いついた
http://www.infoq.com/articles/cracking-office-2007-with-java この方法では、docx ファイルを抽出してから xml ファイルを検索する必要がありますが、これには抽出部分の余分なオーバーヘッドが伴い、率直に言って、私はそうしません。 xml ファイルの処理方法を知っている (属性コンテンツの破棄など)
http://www.javadocx.com/download このメソッドを使用すると、jar ライブラリをプロジェクトにインポートでき、それを使用して docx ファイルを作成できると思われますが、それを使用して docx ファイルを開く方法がわかりません
同じアクションを実行するための代替方法を誰かに勧めたり、上記の2つの方法を手伝ってもらえますか?