0

以下は私の問題文です。Lucene 4.3.1 でこれを達成する方法を教えてください。さまざまなデフォルト クエリを確認しましたが、私の要件を満たすものはないようでした。これが Lucene で不可能な場合、これを達成するのに役立つ他のソフトウェアはありますか? また、これには非常に厳しい納期があるため、検索はかなり迅速に行う必要があることに注意してください. 私は最大で約10ミリ秒を見ています

名前のリスト (「名」「ミドルネーム」「姓」の形式) を含むファイルがあり、約 10K になる場合があります。これらの名前は、受信クエリの検索を実行できるように、インデックスを作成する必要があります。

例えば

索引付けされる名前のリスト

  • ファースト M ラスト
  • 最初の MI 最後
  • ファースト N ラス
  • といくつかの他の名前

ケース 1: 以下のクエリは、インデックスから First M Last を返す必要があります

  • こんにちは、First M Last 今日の調子はどうですか
  • こんにちは、Last First M 今日の調子はどうですか
  • こんにちは、今日のLst M Firstの調子はどうですか

ケース 2: 以下のクエリでは何も返されません。名前の間には他のテキストが含まれていることに注意してください。

  • こんにちは、お元気ですか最初のテキスト M いくつかのテキスト 最後に今日

ケース 3: あいまい検索もできるはずです。以下のクエリは、インデックスから First M Last を返す必要があります。

  • こんにちは、フェスト M ラスト今日はお元気ですか
  • こんにちは、ラストフェストMの今日の調子はどうですか?
  • こんにちは、Last M Ferst 今日の調子はどうですか

近接クエリを試してみましたが、入力が非常にランダムであるため、使用できません。

4

1 に答える 1

0

おそらく、 http://lucene.apache.org/solr/4_3_1/tutorial.htmlのようなインデックス サービスを実行し、必要に応じてデータを入力してクエリを実行するためのスクリプトを記述したほうがよいでしょう。

あなたが言うことは、クエリが結果のように見えるので、あなたの期待が何であるかが明確ではないことに注意してください. 通常、入力したデータのみを取得します。

于 2013-07-11T20:15:55.787 に答える