2

索引付けされたドキュメントのコーパスがあります。索引付け時に用語ベクトルも保存しました。ここで、いくつかのフィルタリング オプションを満たすすべてのドキュメントの用語ベクトルを取得したいと考えています。ドキュメント ID を指定することで、単一のドキュメントまたは一連のドキュメントの用語ベクトルを取得できました。しかし、ドキュメント ID を提供せずにすべてのドキュメントの用語ベクトルを取得する方法はありますか? 最終的に私がやりたいことは、インデックス内のすべてのドキュメント (つまり、単語の袋の行列) について、フィールド内のすべての用語の頻度カウントを取得することです。

クライアントとしてelasticsearch-pyを使用しています。

ポインタに感謝します。ありがとう!

4

0 に答える 0