Solr インストールにセマンティック分析を追加することを検討していますが、どこから始めればよいか正確にはわかりません。
基本的に、Solr が「類似した」単語 (索引付けされた文書の本文から取得) を見つけられるようにしたいと考えています。たとえば、「音楽」を検索すると、セマンティック エンジンにクエリを実行して、「ロック」、「ポップ」などを取得できるはずです (もちろん、これらの単語がインデックス付きドキュメントの一部で音楽に近い場合)。
このプロジェクトを見つけましたが、開始するのに適切な場所かどうかわかりません: http://code.google.com/p/semanticvectors/