0

特定の用語に注釈を付け、この方法でスパンを保存するプラグインを lucene で作成しました<term>,<span>;<term>,<span>;..

ここで、デフォルトの lucene に格納されたスパンではなく、これらのスパンのみを使用して、クエリに近いスパンを処理する必要があります。これは、類似するすべての用語に注釈が付けられているわけではないためです。したがって、基本的に k トークン内の用語をクエリすると、対応するスパンを差し引くことでスパン距離を取得できるはずです。ルセンでこれを行うにはどうすればよいですか? 私は初心者なので、できるだけ説明してください。

ありがとう、アナント。

4

1 に答える 1

0

私が Lucene で従う良い一般的な規則は、特別に処理されたデータを独自のフィールドに入れることで、混同の可能性がほとんどないようにします。このようにして、希望する方法で近接クエリを実行できます。(これにより、インデックスが大きくなります。)

于 2012-12-04T23:12:39.590 に答える