1

Elasticsearchに保存されているJSONファイルにある人のすべてのIDを出力するPythonスクリプトがあります。しかし、デフォルトでは 10 件の結果しか表示されないことがわかっているため、10 件の結果 (切り捨て) しか取得できません。

from elasticsearch import Elasticsearch
import sys
es = Elasticsearch()
res = es.search(index="my_docs", body={"query": {"match_all": {}}})
print("%d documents found" % res['hits']['total'])
for doc in res['hits']['hits']:
        print (" Doc ID: %s" % (doc['_id']))

5000 個のドキュメントが見つかりましたが、10 個の ID しか返されません。

Elasticsearch のコレクションからすべてのドキュメントのドキュメント ID を印刷するにはどうすればよいですか?

4

2 に答える 2

0
  1. ドキュメント数が 10000 を超える場合は Scroll API を使用します。
  2. 制限付きの検索 API を使用して、指定されたカウントを取得します。
于 2017-11-16T12:37:09.587 に答える