私はTikaを初めて使用し、Outlookファイルの解析に取り組んでいます。Outlook Extractorを使用して、*。msgファイルを解析できますが、*。pstは解析できません。tikaでpstファイルを解析することは可能ですか?はいの場合、どのように?
ありがとう
私はTikaを初めて使用し、Outlookファイルの解析に取り組んでいます。Outlook Extractorを使用して、*。msgファイルを解析できますが、*。pstは解析できません。tikaでpstファイルを解析することは可能ですか?はいの場合、どのように?
ありがとう
あなたが質問した時点では、それは不可能でした。Tika Enhancement request - PST サポートを追加するためのTIKA-623は、Tika 1.6 でのみ解決されました。古いバージョンの Tika の場合は、そこからパッチを取得する必要があります。(すべての依存関係は現在 Maven Central にあります - これは長い間主要なブロッカーでした)
Apache Tika 1.6 以降のユーザーにとっては、PST サポートが組み込まれており、PST がTika でサポートされているメール形式の 1 つになったことは朗報です。
pstファイルパーサーはTika 1.6で利用可能です
https://tika.apache.org/1.6/api/org/apache/tika/parser/mbox/OutlookPSTParser.html
http://grepcode.com/project/repo1.maven.org/maven2/org.apache.tika/tika-app/から最新の jar をダウンロードし ます。