問題タブ [elasticsearch-py]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Elasticsearch HTTP API または Python API
私はリアルタイム分散検索エンジンelasticsearchの初心者ですが、技術的な質問をしたいと思います.
Web ページを解析し、ネイティブ情報を使用して JSON オブジェクトを作成する Python モジュール クローラーを作成しました。私のモジュール クローラーの次のステップは、elasticsearch を使用してネイティブ情報を保存することです。
本当の質問は次のとおりです。私の状況に適したテクニックはどれですか? Elasticsearch RESTful API またはエラスティック検索用の python API (elasticsearch-py) ?
python - elasticsearch-dsl-py で agg を取得する方法
集計の結果を取得するにはどうすればよいですか?
私のコードは次のとおりです。
これを試すと、次のエラーが発生します。
sorting - Elasticsearch が結果をソートしていない
Elasticsearch クエリに問題があります。結果を並べ替えたいのですが、elasticsearch は並べ替えタグを無視しています。ここで私のクエリ:
ただし、クエリ部分を削除してソートタグのみを送信すると機能します。誰かが私に正しい方法を指摘できますか?
私はまた、私が持っている完全なクエリである次のクエリを試しました:
設定
マッピング
前もって感謝します!
python - Elasticseacrch-dsl-py からデフォルトの「match_all」クエリを削除します
次のクエリから「match_all」を削除するにはどうすればよいですか。
python - elasticsearch-py を使用してクエリを集約する
バージョン 2.1.1 の Elasticsearch インスタンスを照会するために、elasticsearch-py バージョン 2.1.0 を使用して次の集計クエリを試しています。
それは言って例外を与えます:
これを修正する方法は?
注: cURL を使用すると、同じクエリが正常に機能します。
python - Python の elasticsearch クライアントによる一括更新
ドキュメント プロパティの状態変更に基づいて一括更新を試みています。Create
正常に動作しますが、bulk
おかしくなります。「スクリプトまたはドキュメントが見つかりません」というエラーが表示されますが、すべて問題ないようです。
一括更新を試みる方法は次のとおりです。
結果を繰り返し処理している理由は、リスト内包表記で if を使用しているためですが、返された結果を確認できるので、それが問題ではないことがわかります。これは私が働いている会社のものであるため、結果を表示できず、プロパティ名を変更する必要がありました。
トレースバックは次のとおりです。
省略記号は、リスト内のすべての要素に対して同じエラーが失敗したことを示しています。
python - Elasticsearch-py ライブラリを使用した ElasticSearch ConnectionPool
私は ElasticSearch の初心者であり、ElasticSearch ConnectionPool [経由Transport class
] からの同時接続を使用して、ElasticSearch のインデックスにエントリを追加しようとしています。
これが私のコードです:
そして、私は以下のエラーを受け取ります:
ElasticSearch でTransport class
インスタンス化する正しい方法かどうかはわかりません。ただし、トランスポートクラスが個々の接続のインスタンス化を処理し、それらを保持するための接続プールを作成することをConnectionPool
ドキュメントから読みました。
ConnectionPool
をインスタンス化し、プールから接続を効率的に使用する正しい方法がわかりません。読書とグーグルは、私の好意では役に立ちませんでした。
helpers.bulk() APIについても認識していますが、インデックスにエントリを追加するだけでなく、無効なエントリも削除しているため、使用について混乱しています。