問題タブ [pycassa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pycassa を使用して Cassandra 列ファミリーに格納されているすべてのキーを取得するにはどうすればよいですか?
pycassaを使用した経験がある人はいますか? データベースに保存されているすべてのキーを取得するにはどうすればよいですか?
この小さなスニペットでは、関連付けられた列を取得するためにキーを指定する必要があります (ここでは、キーは「foo」と「bar」です)。これで問題ありませんが、私の要件は、すべてのキー (キーのみ) を一度に取得することです。 Python リストまたは同様のデータ構造として。
ありがとう。
python - Python で Cassandra の UUID を生成する
へー、使ってる
cf.insert(uuid.uuid1().bytes_le, {'column1': 'val1'})
(ピカッサ)
Cassandra の TimeUUID を作成しますが、エラーが発生します
では動作しません
また。
CompareWith="TimeUUIDType" フラグで使用する有効な TimeUUID を作成する最良の方法は何ですか?
ありがとう、
ヘンリック
java - Django 用の Cassandra のセットアップ - 「ImportError: pycassa という名前のモジュールがありません」
私はこのガイドに従いました: https://github.com/ercflo/twissandra
すべての依存関係を含む Pycassa がインストールされました。すべてがスムーズに実行されpython manage.py sync_cassandra
ていますが、実行中はメッセージが表示されます:
そのため、Python インタラクティブ インタープリターを実行して入力するimport pycassa
と、そのコマンドはエラーなしで正常に実行されます。
ランニング
メッセージが表示されます:
はsite-packages
リストにあります。しかし、これは仮想環境であるため、少し混乱しました
何が起こったのか、何をすべきかわかりません
django - Django用にCassandraをセットアップする-「pythonmanage.pysync_cassandra」または「sudopythonmanage.pysync_cassandra」
https://github.com/thobbs/twissandraのガイドをフォローしています
私はまだ立ち往生しています:
python manage.py sync_cassandra
生成されます
sudo python manage.py sync_cassandra
生成されます
はい、それはエラーでした..しかし、私は少し混乱しているか、そうではsudo
ありませんsudo
...python manage.py sync_cassandra
またはsudo python manage.py sync_cassandra
django - Django 用の Cassandra のセットアップ - 「AttributeError: 'SystemManager' object has no attribute 'describe_keyspace'」
https://github.com/thobbs/twissandraのステップバイステップガイドに従いました
メッセージを受け取った場所で立ち往生してpython manage.py sync_cassandra
います:
これについてはわかりません。何をすべきか?
cassandra - Cassandraで見つからないキーを知るには?
私はpycassaを使用しています。行からいくつかの列を要求しています:
指定された行キーまたは開始列キーと終了列キーのいずれかが存在しない場合、NotFoundExceptionが発生します。行キーまたは列キー(名前)のどちらのキーが見つからなかったかを判断する方法はありますか?
python - uwsgi で pycassa を使用する際の問題
uwsgiでpycassaを使用しています。約 16 個の uwsgi プロセスがあります。
あるプロセスが、別のプロセスによって照会されたデータを取得できるのは奇妙です。たとえば、列ファミリー A に 1 つの行があり、次のようになります。
{row_key, {'column_a': 1, 'column_b': 2}}
プロセス 1 実行: get(row_key, columns=['column_a', ])
プロセス 2 実行: get(row_key, columns=['column_b', ])
ただし、プロセス 1 が column_b の値を取得し、プロセス 2 が column_a の値を取得する場合があります。
これは接続プールの既知の問題ですか?
任意の応答をいただければ幸いです。
benchmarking - pycassa によるストレス テスト
かなり大規模な cassandra データベース用のストレス テスターを作成しようとしています。最初はゼロからやっていたのですが、クラスターのストレステストを行うためのstress.pyを見つけました。ただし、すべてのベンチマークと同様に、テスト データは、このデータベースで発生する負荷を表すものではありません。そこで、自分の使用パターンにより現実的なものになるように変更することにしました。
私はこのプロジェクトのほとんどで pycassa を使用しています。ただし、stress.py は低レベルの thrift インターフェイスを直接使用するため、かなり面倒です。pycassa を使用して cassandra をストレステストするプロジェクトはありますか? ありがとう!
cassandra - カサンドラマルチゲットパフォーマンス
行数がかなり少ないカサンドラクラスターがあります(200万程度、カサンドラにとっては「小さい」と思います)。各行には一意のUUIDがキー設定されており、各行には約200列があります(いくつか与えるか、いくつか取る)。全体として、これらはかなり小さな行であり、バイナリデータや大量のテキストはありません。ただ短い文字列。
古いデータベースからcassandraクラスターへの最初のインポートが完了しました。私は各マシンでカサンドラから地獄を調整しました。何億もの書き込みがありましたが、読み取りはありませんでした。これを使用するときが来たので、読み取り速度は絶対にひどいことに気づきました。一度に500から10000行のどこでもpycassaを使用してマルチゲットを実行しています。500行でも、パフォーマンスはひどく、30秒以上かかることもあります。
このタイプの動作の原因は何ですか?このような大規模なインポートの後に、どのようなことをお勧めしますか?ありがとう。
python - 何百万もの列のCassandraバッファリング読み取り
行数が少ない (< 100) cassandra クラスターがあります。各行には約 200 万列あります。行全体 (200 万列すべて) を取得する必要がありますが、読み取りを完了する前に、あちこちで問題が発生し始めます。私はある種のバッファリングされた読み取りをしたいと思います。
理想的には、Pycassa を使用して次のようなことをしたいと思います (いいえ、これは を呼び出す適切な方法ではありませんget
。アイデアを得ることができるようにするためです)。
Pycassa (ひいては Cassandra) では、これを行うことはできません。代わりに、 と の列名を指定する必要がありcolumn_start
ますcolumn_finish
。開始列名または終了列名が実際にどうなるかわからないため、これは問題です。特別な値""
は、行の開始または終了を示すことができますが、中間の値では機能しません。
では、1 行のすべての列のバッファリングされた読み取りを実行するにはどうすればよいでしょうか? ありがとう。