2

関連/共通のキーワードまたはタグの空間マップを構築するための戦略またはアイデアを理解しようとしています。例として SO を使用します。https://stackoverflow.com/tagsに移動して「python」と入力すると、その単語が含まれるすべてのタグが取得されますが、密接に関連している可能性のあるタグ (WSGI、Google の App Engine、飛行など) は取得されません。 .

私の質問に沿って、検索から密接に関連するタグ/キーワードを重み順に並べて見つけるために照会できる空間マップをどのように構築できますか? しかし、タグ foo の重みを潜在的に多数のタグに格納し、システムの応答性を維持するにはどうすればよいでしょうか?

David Weinberger による Google Tech-talk を既に見ましたが、これは素晴らしい Tech Talk であり、考えさせられました。 http://video.google.com/videoplay?docid=2159021324062223592&ei=qseASZvgI6e4qAP91a2PDg&q=google+tech+talk

4

4 に答える 4

1

O'Reilly の"Programming Collective Intelligence"からクラスタリングの概念を確認してください。

于 2009-02-02T12:28:51.380 に答える
0

このような関係に関するデータを構築する最も可能性の高い方法は、最も頻繁に一緒に表示されるタグを分類し、他のタグと一緒に表示されるタグの数が最も少ないように思われます。

つまり、"c++" と "stl" は一緒に現れることが多く、"c++" なしで "stl" が現れることはめったにない (?) ため、これらは (少なくとも 1 つの方向で) 関連しています。「c++」と「アルゴリズム」も一緒に出てくることが多いですが、バラバラに出てくることが多いので関係ありません。

于 2009-01-28T23:21:36.610 に答える
-2

優れた検索エンジンが必要です。;)

自分でやる:類似性アルゴリズムの1つを実装する。例:レーベンシュタイン距離またはダイス係数

または、 Luceneのようにすぐに使用できるものを使用します。

于 2009-01-28T22:09:44.007 に答える