Elasticsearch でちょうど 100 個のドキュメントが既にインデックス化されており、次の関数を使用して新しい単純なフィールドを追加して各ドキュメントを更新する必要があります。
def add_new_field( ):
ES_HOST = {"host" : "localhost", "port" : 9200}
ES= Elasticsearch(hosts = [ES_HOST], timeout = 180)
for i in range(100):
ES.update(
index='history',
doc_type='resources',
id=i,
body={ "doc" : {"square" : i**2} }
)
問題は、この関数を実行した後、一部の用語の 'doc_freq' が予想される document_frequency を超えていることです (注: 'dfs = True' に設定しました)。
例: 'term1' はすべてのドキュメントに存在します (したがって、'doc_freq' は 100 である必要があります)、代わりに 'doc_freq'=113 を取得しました