私は現在、Pythonプログラムのテキストインデクサーを探しています。LuceneプロジェクトであるSolrと、PythonにネイティブなWhooshを最終候補に挙げました。doc、docx、pdfファイルのサポートに関する多くのドキュメントを検索しましたが、SolrはTikaパッケージを指摘し続けました。TikaパッケージのバージョンはSolrと統合されています。
いずれかのパッケージに3つの形式のサポートが組み込まれている場合、結果には特定の用語が記載されていません。WhooshとSolrはそれらをサポートしていますか?これらの形式をネイティブに読み取る他のオープンソースインデクサーはどれですか?