5

Django で書かれた Web サイトの検索ソリューションを実装したいと考えています。利用可能なオプション (Solr、Sphinx、Xapian、PostgreSQL/Tsearch3、MySQL を調査しました) から、Sphinx が最も優れているように見えます。ただし、ポーランド語のステミングはサポートされていません。ポーランド語は、検索可能にしたいデータの言語です。

Sphinx でサポートされていない言語を処理する最善の方法は何ですか? Ispell 辞書からステミング コーパスを作成できるという直感がありました。Sphinxでそれを機能させるにはどうすればよいですか?

4

1 に答える 1

0

http://snowball.tartarus.org/ mailistで検索してください。誰かがポリッシュステマーを作成しようとした場合、いくつかの情報が見つかる可能性があります。2つの無料のステマーが利用可能ですが、それらはJavaで作成されています(少なくとも1つはsolr / lucene用に作成されていると思います)。Ispellから、ステミングコーパスが役立つかどうかはわかりません。ワードフォームまたは例外に使用するファイルを作成できます。

于 2011-09-26T12:49:55.377 に答える