問題タブ [pycassa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pycassa - セカンダリ インデックスで複数の行を削除しますか?
セカンダリ インデックス 'ポインター' を持つ列ファミリーがあります。同じ「ポインター」値 (abc など) を持つ複数の行を削除するにはどうすればよいですか?
私が知っている唯一のオプションは次のとおりです。
しかし、これは非常に非効率的であり、同じ「ポインター」値を持つ行が何千もある場合、時間がかかることはわかっています。他のオプションはありますか?
python - pycassaでCassandra 1.2テーブルを読む
Cassandra 1.2 を使用しています。次の方法で CQL 3 を使用してテーブルを作成しました。
今、私はpycassaを通してデータをクエリしようとしています:
これは私に与えます
これはどのように達成できますか?
nosql - Cassandra-キーが0の結果を返す状態でCFにアクセスしますが、pycassaを使用してテーブル全体を取得するときにキーが存在します
Cassandra1.2.0にテーブルがあります。これにはVarIntキーがあります。キーを検索すると、それらが存在することがわかります。
テーブルの説明:
鍵
12040911
60619595
3220132
4602232
3997404
6312372
1128185
1507755
1778092
4701841
キー60619595の行を取得しようとすると、正常に機能します。
cqlsh:users>uからキーを選択します。ここでkey= 60619595;
鍵
60619595
pycassaを使用してテーブル全体を取得すると、行にアクセスできます。
正しい結果を返します。
私は何が間違っているのですか?エラーが何であるかわかりません。
どんな助けもいただければ幸いです、
よろしく
マイケル。
PS:私が試してみると、pycassaでそれを言う必要があります:
ファイル"test.py"、10行目、userscf.get(3997404)ファイル "/usr/local/lib/python2.7/dist-packages/pycassa/columnfamily.py"、655行目、get raise NotFoundException() pycassa.cassandra.ttypes.NotFoundException:NotFoundException(_message = None)
平均よりも小さいIntにあるようです。
python - pycassaを使用してcassandraの分散カウンターデータのスライスとダイシングは可能ですか?
私はたくさん読んでグーグルで調べましたが、条件に基づいてカウンターデータをスライスしてダイスする方法を見つけることができませんでした。Cassandraでこれを行う方法はありますか? もしそうなら、私を助けてください。例: カウンタを使用して合計ページ ビューを保存している場合、特定のページ URL のページ ビューの数を取得する方法や、特定の日付のすべてのページ ビューを取得する方法はありますか?
前もって感謝します!
cassandra - cassandraのTimeUUID列を更新しています
次の列ファミリーに時系列データを保存しようとしています。
私はこの方法でデータを正常に挿入しています:
ご覧のとおり、datetimeオブジェクトを列名として使用すると、pycassaはtimeUUIDオブジェクトに正しく変換されます。
場合によっては、アプリケーションが一部のデータを更新する必要があります。問題は、同じ日時オブジェクトを渡してその列を更新しようとすると、pycassaが別のUUIDオブジェクト(時間部分は同じ)を作成するため、列を更新する代わりに別のUUIDオブジェクトを作成することです。
問題は、日時オブジェクトを渡すpycassaでTimeUUIDベースの列を更新するにはどうすればよいですか?または、これが正しい方法ではない場合、推奨される方法は何ですか?
cassandra - 列ファミリーを作成する前に、pycassaShell を使用して DDL をダンプできますか?
PycassaShell は SYSTEM_MANAGER.create_column_family() を使用して、Cassandra で列ファミリーを作成します。
Cassandraでコミットする前にDDLをダンプする方法はありますか? pycassaShell 内部を変更する必要がありますか?
cassandra - pycassa get_rangeを使用して逆ソート順で行を取得する方法は?
pycassa の get_range によって返された行を逆順にソートしたい..つまり、最初から最後まで。逆ソート順で列を取得するためのパラメーター column_reversed が存在することは知っていますが、行に対してこれを行うにはどうすればよいですか?
cassandra - Cassandra のいくつかの非主キー列、および Pycassa を使用
私の要件は、次のような列ファミリーを持つことです。
私はこれを許可しないと思いCOMPACT STORAGE
ます。また、pycassaを使いたいです。Cassandra 1.2
とを使用して上記を達成できる方法はありますかPycassa?
cassandra - Cassandra の挿入がクラスターでスロットルされる
Cassandra で奇妙な問題が発生しています。私の理解では、Cassandra は挿入に対して拡張可能でした。つまり、2 台のサーバーのクラスターで 1500 回の書き込み/秒を取得していた場合、これを 4 台のサーバーに増やして 1500 回の書き込み/秒に近づけることができます。書き込み/秒がクラスター内のノード数に比例して増加しない可能性があることは理解していますが、現在、ノードを追加しても書き込み/秒の数は増加していません。
私の現在のセットアップは次のようなものです:
20 行のバッチ サイズを使用して、Pycassa でバッチ挿入します。レプリケーション ファクター 2 の永続的な書き込み
一部の ColumnFamilies には通常の列があり、一部には数十万列までの幅の広い列があります。幅の広い列を持つ ColumnFamilies の挿入は、100,000 列の 20 行ではなく、複数のバッチで挿入されます。
Cassandra クラスターは、m1.xlarge と SSD ドライブ (RAID なし) を使用して EC2 でホストされる 2 ノード クラスターであり、コミット ログは sstables と同じドライブにあります。
クラスターを最大 10 ノードまでスケーリングしてみましたが、2 ノードと同じパフォーマンスが得られます。また、データをインポートするインスタンスの数を増やしてみましたが、書き込み操作ごとのレイテンシがはるかに高くなることを除いて、パフォーマンスは同じです。しかし、私が何をしても、書き込みを 1500/s より速くすることはできません。
cassandra - Python 用の最高の Cassandra 1.2 ドライバー、CQL のことは忘れたほうがいいですか?
Python 用の適切なドライバーを探しています。
1) ピカッサ。それは CQL をサポートしていません。
2) https://code.google.com/a/apache-extras.org/p/cassandra-dbapi2/ .
私は cassandra-dbapi2 を使用することを考えていましたが、ここで「接続プーリングの負荷分散の高度な機能をサポートしていない」という人がいます。一方、PyCassa は使用できますが、CQL はサポートしていません。Pycassa を試して、クライアントの CQL を忘れるべきですか?
私は ORM 機能を失うことは気にしませんが、実際には、SQL は人々が知っているものであるため、チームが新しいこと (使用している ORM API の新機能) を学ぶ必要があるため、さらに悪化する可能性があると思います。すでに SQL/CQL を知っているのに、なぜ新しい言語を学ぶのでしょうか? でもあくまでも意見です…。
最良の選択肢は何だと思いますか? CQLを忘れるべきですか?