0

Elasticsearchでのトークナイザーとアナライザーの可能性を理解するのに苦労しています。

製品のインデックス付きデータのセットがあるとします。各製品には、説明テキストのあるフィールドがあります。説明では、色に名前が付けられています。

組み込みのアナライザーの1つまたはカスタムのトークナイザー/アナライザーを使用してその色情報を抽出し(たとえば、一連のキーワード[赤、緑、青、黄色など]に基づいて)、その新しい色情報を次のように添付することは可能ですか?製品とは別のフィールドですか?

一般的なプロパティ(色、素材など)で受信データを補強するための優れた機能になります

4

1 に答える 1

0

あなたが説明するプロセスは、エンティティの認識ともっと関係があります。テキストを提供するさまざまなライブラリがあります:OpenNLPUIMAなど。

必要なことを正確に実行するelasticsearchOpenNLPプラグインを確認することをお勧めします。エンティティを検出し、対応するフィールドを受信ドキュメントに追加します。

于 2013-03-15T09:40:34.997 に答える