問題タブ [kuromoji]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1434 参照

elasticsearch - Elasticsearch: 黒文字読み形フィルターを使用して検索できない

クロモジ プラグイン 1.4.0 で Elasticsearch 0.90.1 を使用しています。

defaultアナライザーに Kuromoji を使用して、新しいインデックスを作成します。

結果:

読み形トークン フィルターは正常に動作しているようです (漢字はカタカナに正規化されています)。

結果:

ドキュメントにインデックスを付ける:

結果:

インデックス付きドキュメントは、ワイルドカード クエリに一致します。

結果:

ただし、日本語を使用して検索すると一致しません。

結果:

結果:

結果:

アナライザーが検索クエリに使用されていないのではないかと思いましたが、アナライザーを指定しても役に立ちません。

結果:

ちなみに、トークン フィルターを無効にすると、すべて正常に動作します。

私は何を間違っていますか?

0 投票する
1 に答える
258 参照

java - elasticsearch-analysis-kuromoji の動作が期待どおりではない

Elasticsearch-analysis-kuromoji を使用して日本語で検索を実行していますが、2 つの非常に奇妙な動作が発生しています。最初の 1 つは、検索する文字が機能しないことです。各文字の間にスペースを入れて「輸出貿易易」として渡します。また、「と」などの文字は検索対象外です。

これは私の構成です:

構成が間違っているのでしょうか、それとも「輸出貿易とント」のような文字には別のトークナイザーが必要ですか?

ありがとうございました

0 投票する
1 に答える
380 参照

ruby-on-rails - モジュール Kuromoji が正しくインストールされていない可能性があるため、インデックス作成時の Elasticsearch エラー

Elasticsearch 1.3 と 2 つのモジュール (kuromoji と smartcn) を使用するアクセス権を取得したばかりの Rails アプリケーション用にローカル環境をセットアップしようとしています。

モジュールとともにElasticsearchをインストールするための指示に従いました.elasticsearchを起動すると、次の出力が得られます.

しかし、rake タスクを実行してデータをインデックス化してインポートしようとすると、次のエラーが表示され、Kuromoji がロードされていないか、何か他のことが起こっていると思われます。

ここで問題を特定するための助けに感謝します。

0 投票する
2 に答える
236 参照

elasticsearch - Elasticsearch/黒文字: Unidic で黒文字を使用する方法

エラスティックサーチ 1.7

Elasticsearch で Unidic を使用して Kuromoji をテストしたいと考えています。kuromoji をコンパイルすると、さまざまな辞書を含むいくつかの jar ファイルが得られます。

ipadic ベースのクロモジを unidic ベースのクロモジに置き換える簡単な方法はありますか?

ありがとう。

0 投票する
1 に答える
141 参照

elasticsearch - 検索クエリでフィールドを指定したElasticSearch 2.4.1およびKuromojiプラグイン

2 週間前にプロジェクトで ElaticSearch (バージョン 2.4.1) を使用したばかりですが、クエリ文字列でフィールドを指定すると問題が発生します。
クロモジプラグインとn-gramトークナイザーを使って日本語データを検索したいです。

私のクエリでは、フィールドを指定しないと (例: "コンテンツ")、結果に 2 つのレコードが返されます。

しかし、上記のクエリで「コンテンツ」フィールドを使用すると、結果にレコードがありません。(私のプロジェクトでは、「コンテンツ」フィールドで検索したい。)

ステップ 1 で「ハイライト」属性も使用していますが、結果に「ハイライト」ブロックが含まれていません。

質問したいのですが、ステップ 2 (上記) で、クエリ文字列に指定されているフィールドは何ですか? product.Content、 または、他の何か?

黒文字プラグインを使用しない場合、手順 2 のクエリの結果は 2 つのレコードになります。だからクロモジプラグインが結果に関係していると思います。誰でもこの問題で私を助けることができますか?

yaml での私のマッピングと構成は次のとおりです。