短いテキスト スニペットを投稿しているユーザーに (Freebase、ウィキペディア、または別のシステムへのリンクを介して) 提案されたセマンティック タグのリストを生成することに興味があります。テキストが実際に言っていることを「理解」したり、自動的にタグ付けしたりするつもりはありません。ユーザーの投稿に最も可能性の高いセマンティックタグをユーザーに提案したいだけです。私の主な目標は、ユーザーに意味的にタグを付けさせることです。したがって一貫性を保ち、あいまいなテキスト文字列を書き込まないようにします。合理的に機能し、手頃な価格のツールが市場に出回っていれば、私はそれを使用します。私はそのようなツールを見つけていないので、自分で書くことを検討しています。
私の質問は、まず第一に、私が遭遇したことのないツールがあるかどうかです。Zemanta、AlchemyAPI、OpenCalais を見てきましたが、必要なサービスを提供しているようには見えませんでした。
私が自分で書いていると仮定すると、私はPythonでそれをやっているでしょう(他の何かを使う本当にやむを得ない理由がない限り)。私の最初の推測は、Freebase で「エンティティ」に一致する n-gram を検索し、それらをタグとして提案することです。おそらくエンティティの説明も検索して、もう少し「賢く」することでしょう。それが不十分であることが判明した場合、私は読んでつま先を存在論の水に浸します. これは非常に難しい問題であり、私のアプリケーションがその解決策を必要としているとは思えないため、実際の意味解析はできるだけ控えたいと考えています。
セマンティック データベース システムを扱った経験のある方はいらっしゃいますか?