問題タブ [kuromoji]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - Elasticsearch: 黒文字読み形フィルターを使用して検索できない
クロモジ プラグイン 1.4.0 で Elasticsearch 0.90.1 を使用しています。
default
アナライザーに Kuromoji を使用して、新しいインデックスを作成します。
結果:
読み形トークン フィルターは正常に動作しているようです (漢字はカタカナに正規化されています)。
結果:
ドキュメントにインデックスを付ける:
結果:
インデックス付きドキュメントは、ワイルドカード クエリに一致します。
結果:
ただし、日本語を使用して検索すると一致しません。
結果:
結果:
結果:
アナライザーが検索クエリに使用されていないのではないかと思いましたが、アナライザーを指定しても役に立ちません。
結果:
ちなみに、トークン フィルターを無効にすると、すべて正常に動作します。
私は何を間違っていますか?
java - elasticsearch-analysis-kuromoji の動作が期待どおりではない
Elasticsearch-analysis-kuromoji を使用して日本語で検索を実行していますが、2 つの非常に奇妙な動作が発生しています。最初の 1 つは、検索する文字が機能しないことです。各文字の間にスペースを入れて「輸出貿易易」として渡します。また、「と」などの文字は検索対象外です。
これは私の構成です:
構成が間違っているのでしょうか、それとも「輸出貿易とント」のような文字には別のトークナイザーが必要ですか?
ありがとうございました
ruby-on-rails - モジュール Kuromoji が正しくインストールされていない可能性があるため、インデックス作成時の Elasticsearch エラー
Elasticsearch 1.3 と 2 つのモジュール (kuromoji と smartcn) を使用するアクセス権を取得したばかりの Rails アプリケーション用にローカル環境をセットアップしようとしています。
モジュールとともにElasticsearchをインストールするための指示に従いました.elasticsearchを起動すると、次の出力が得られます.
しかし、rake タスクを実行してデータをインデックス化してインポートしようとすると、次のエラーが表示され、Kuromoji がロードされていないか、何か他のことが起こっていると思われます。
ここで問題を特定するための助けに感謝します。
elasticsearch - Elasticsearch/黒文字: Unidic で黒文字を使用する方法
エラスティックサーチ 1.7
Elasticsearch で Unidic を使用して Kuromoji をテストしたいと考えています。kuromoji をコンパイルすると、さまざまな辞書を含むいくつかの jar ファイルが得られます。
ipadic ベースのクロモジを unidic ベースのクロモジに置き換える簡単な方法はありますか?
ありがとう。
elasticsearch - 検索クエリでフィールドを指定したElasticSearch 2.4.1およびKuromojiプラグイン
2 週間前にプロジェクトで ElaticSearch (バージョン 2.4.1) を使用したばかりですが、クエリ文字列でフィールドを指定すると問題が発生します。
クロモジプラグインとn-gramトークナイザーを使って日本語データを検索したいです。
私のクエリでは、フィールドを指定しないと (例: "コンテンツ")、結果に 2 つのレコードが返されます。
しかし、上記のクエリで「コンテンツ」フィールドを使用すると、結果にレコードがありません。(私のプロジェクトでは、「コンテンツ」フィールドで検索したい。)
ステップ 1 で「ハイライト」属性も使用していますが、結果に「ハイライト」ブロックが含まれていません。
質問したいのですが、ステップ 2 (上記) で、クエリ文字列に指定されているフィールドは何ですか? product.Content
、 または、他の何か?
黒文字プラグインを使用しない場合、手順 2 のクエリの結果は 2 つのレコードになります。だからクロモジプラグインが結果に関係していると思います。誰でもこの問題で私を助けることができますか?
yaml での私のマッピングと構成は次のとおりです。