私のフォーラムでは、Google App Engine Search Api を使用しています。したがって、当然、部分的なスペルミスの単語を見つけられるようにしたいと考えています。しかし、APIはそれをしません。このAPIの回避策またはより良い代替手段を知っている人はいますか?
部分一致の場合、フォーラム コメントの各単語を一連の部分文字列に分解することを想像できます。しかし、それはかなり高価なようです。考えてみてください: コメントが 60 語 (たとえば合計 500 文字) の場合、その 1 つのフォーラム投稿を保存すると、ドキュメントに巨大なテキスト フィールドが追加されます。
Document.Builder builder = Document.newBuilder();
builder.addField(Field.newBuilder().setName(“comment”).setText(comment))
これはかなりばかげています。特に正規表現マッチャーの方がはるかに経済的です。ここで疑問が生じます: 部分的な単語を検出できるように、クエリが正規表現マッチングを使用しないのはなぜですか? スペルミスに関しては、これを行うためのアルゴリズムがいくつかありますが、App Engine Seach API がそれを提供していないのはなぜですか?
もちろん、私が間違っていて、Search Api が実際にこれらすべての機能を提供していることを誰かが教えてくれることを期待して、ここに投稿しています。私はオンラインで多くのチュートリアルを見てきましたが、これまでのところあまりありません。もう一度質問します。App Engine Search API はpartial text matching
and を許可しmisspelled text matching
ますか? そうでない場合、どうすればハッキングできますか?