15

一連のキーワード(主に趣味、最新ニュースなど、人々が話したいと思うかもしれないもの)に対してPythonベースのセマンティック検索を実装したいと思います。同じもののオントロジーデータベースと、同じもののオープンソース検索アルゴリズム/実装が存在するかどうかを知りたいです。

例えば。私のセット={話す、飲む、つぶやく、カトリーナカイフ、カトリーナサイクロン、岩の収集、コインの収集}

したがって、「accumulate」を検索すると、出力として岩石収集とコイン収集が得られる可能性があります。

編集:用語は複数の単語を持つことができます。つまり、「大統領。米国のバラク・オバマ」は有効なクエリです。

4

2 に答える 2

4

「ランダムインデックス」を使用することをお勧めします。必要なことを正確に行うことができ、各単語の特徴ベクトルを計算し、2 つの単語間の意味的類似性のメトリックを定義します。

必要なのは、An Introduction to Random Indexingのコピーと、semanticvectorsパッケージを入手して開始することだけです ...

これがお役に立てば幸いです。さらにアドバイスが必要な場合は、コメントしてください...

于 2012-01-16T16:30:52.360 に答える
1

私は願っていますが、これがあなたに役立つかどうかはわかりません.

グノウシス

  • まだ大規模な開発中
于 2012-01-20T23:46:33.367 に答える