何百万もの PDF ファイルをインデックス化して保存できるソリューションを探しています。現在、Lucene+Tika を使用していますが、PDF をファイル システムに BLOB (ZODB BLOB) として保存しています。
Crate.io は、大量 (数百万) の PDF ファイルのインデックス作成と保存の両方に使用できますか?
何百万もの PDF ファイルをインデックス化して保存できるソリューションを探しています。現在、Lucene+Tika を使用していますが、PDF をファイル システムに BLOB (ZODB BLOB) として保存しています。
Crate.io は、大量 (数百万) の PDF ファイルのインデックス作成と保存の両方に使用できますか?
はい、確かに、それはシナリオクレートが実際に作成された1つのシナリオです. たぶん、この最近の機能リクエスト/ディスカッションもあなたにとって興味深いでしょう: https://github.com/crate/crate/issues/1206