4

-Lucene.net でサポートされているすべての言語は?

-たとえば。中国語、ロシア語、日本語、アラビア語、フランス語、ドイツ語など

-そうでない場合、他の言語をインデックス化する方法はありますか?

4

2 に答える 2

6

Lucene は英語やその他の言語に限定されません。テキストを適切に索引付けするには、索引付けするテキストの言語に適したアナライザーを使用する必要があります。Lucene のデフォルトのアナライザーは英語に適しています。Lucene Sandbox には、中国語、日本語、韓国語用のアナライザーなど、他にも多数のアナライザーがあります。

以下は、Lucene.NET と統合できるアナライザーのリストです: https://svn.apache.org/repos/asf/incubator/lucene.net/trunk/src/contrib/Analyzers/

上記のように、多くの言語が既にアナライザーに含まれています。含まれていない場合は、作成してください。リストにない場合は、まだ誰も試していないことを意味しますが、サポートされていないことを意味するわけではありません。

Lucene.net を使用した多言語コンテンツのインデックス作成に関するこの SO ディスカッションもお読みください。

于 2012-06-10T18:47:42.777 に答える