Lucene には、インクリメンタル インデックス作成の優れた機能があります。これは通常、IR システムをゼロから開発する際の苦痛です。低レベルの Lucene API を使用して、逆インデックス、つまり、逆リスト、位置情報、単語の頻度、idfs、フィールド ストレージなどのストレージとしてのみ使用できるかどうかを知りたいです...
要点は、ドキュメントの独自の重み付けとスコアリングを実装したいということです。私はSimilarity
クラスを認識していますが、それは私が望む柔軟性を与えません。