60

カスタム アナライザーを構成し、いくつかのドキュメントをインデックスに入れました。ここで、設定をデバッグして、実際にどの n-gram がインデックスに組み込まれたかを確認したいと考えています。

以前 Solr を使用していたときは、キーとしてインデックスに保存された文字列とその頻度を確認できる可能性がありました。

4

4 に答える 4

12

まだインデックスにあまり多くのデータをインデックスしていない場合は、デバッグしたいフィールドでターム ファセット クエリを使用して、トークンとその頻度を確認できます。

curl -XDELETE 'http://localhost:9200/test-idx'
echo
curl -XPUT 'http://localhost:9200/test-idx' -d '
{
    "settings": {
        "index.number_of_shards" : 1,
        "index.number_of_replicas": 0
    },
    "mappings": {            
        "doc": {
            "properties": {
                "message": {"type": "string", "analyzer": "snowball"}
            }
        }
    }

}'
echo
curl -XPUT 'http://localhost:9200/test-idx/doc/1' -d '
{
  "message": "How is this going to be indexed?"
}
'
echo
curl -XPOST 'http://localhost:9200/test-idx/_refresh'
echo
curl -XGET 'http://localhost:9200/test-idx/doc/_search?pretty=true&search_type=count' -d '{
    "query": {
        "match": {
            "_id": "1"
        }
    },
    "facets": {
        "tokens": {
            "terms": {
                "field": "message"
            }
        }
    }
}
'
echo
于 2013-01-29T02:08:19.223 に答える
1

用語のサイズを追加することもできます (索引付けされた用語)。Elastic Search をご覧ください: インデックス付きデータを表示する方法

于 2014-11-03T13:44:42.640 に答える