Stackoverflow の驚くべき機能を紹介されたとき、今日は質問をするつもりでした。質問のタイトルを書いたとき、stackoverflow はいくつかの関連する質問を提案してくれましたが、すでに 2 つの同様の質問があることがわかりました。それは見事でした!
それから、そのような機能をどのように実装するかを考え始めました。関連性によって質問を並べ替える方法:
- 新しい質問と一致する単語数が多い質問
- 一致数が同じ場合、単語の順序が考慮されます
- タイトルに含まれる言葉ほど関連性が高い
それは単純なワークフローですか、それとも複雑なスコア アルゴリズムですか? おそらく、リコールを増やすためのいくつかのステミングですか?この機能を実装するライブラリはありますか? 他にどのような点を考慮しますか?たぶん、ジェフは自分で答えることができます!これをどのように Stackoverflow に実装しましたか? :)