存在するかどうか知っている人はいますか?
私はこれを何ヶ月もグーグルで調べてきました...
ありがとう
ヘブモーフを更新
あなたの質問に刺激された好奇心から、約 1 年前に Lucene のヘブライ語アナライザーに取り組んでいたときに Lucene メーリング リストで活動していた Itamar Syn-Hershko に連絡しました。私は彼にアナライザーを完成させたか尋ねました。以下は、彼の応答の関連部分です。
要するに、私はしませんでした。確かに言えることですが、Lucene 用のまともなフリー/オープンソースのヘブライ語アナライザーはありません。この件に関するあなたのバックグラウンドが何であるかはわかりませんが、これを行う簡単な方法はないと私が言うとき、私を信じてください。Lucene はヘブライ語検索用に構築されていない可能性もありますが、解決策を提供する必要があることに同意します。確かに、ヘブライ語のテキストを索引付けおよび検索する最も安全な方法は、特殊なステマーを使用することであり、これを行った後でも Lucene との統合は簡単ではありません。市場にはヘブライ語検索用の非常に優れたソリューションがいくつかありますが、私が知っているのは Lucene をコアに使用しているものだけです。最近問い合わせてみたのですが、返事がありません...
言及されている Lucene ベースの商用製品は ATTIVIO と呼ばれ、ATTIVIO の Web サイトはヘブライ語をサポートしていると主張しています。SIGTRS (Hebrew Text Retrieval Interest Group)では、ATTIVIOが Lucene ベースであると主張する議論がありました。
したがって、明らかに、Lucene 用の適切なヘブライ語アナライザーを作成することは可能ですが、現時点で利用できる無料のアナライザーはありません。
dtsearch には、ヘブライ語のステミング プラグイン コール「pensim」があります。「wizcomtech.com」によって開発されたようです。