“pycassa”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

238 参照

python - pycassa - セカンダリインデックスで複数の行を削除しますか?

セカンダリインデックス 'ポインター' を持つ列ファミリーがあります。同じ「ポインター」値 (abc など) を持つ複数の行を削除するにはどうすればよいですか?

私が知っている唯一のオプションは次のとおりです。

しかし、これは非常に非効率的であり、同じ「ポインター」値を持つ行が何千もある場合、時間がかかることはわかっています。他のオプションはありますか？

2012-12-22T11:53:25.897

0 投票する

5 に答える

2656 参照

python - pycassaでCassandra 1.2テーブルを読む

Cassandra 1.2 を使用しています。次の方法で CQL 3 を使用してテーブルを作成しました。

今、私はpycassaを通してデータをクエリしようとしています:

これは私に与えます

これはどのように達成できますか？

python cassandra pycassa

2013-01-06T18:25:01.857

0 投票する

2 に答える

185 参照

nosql - Cassandra-キーが0の結果を返す状態でCFにアクセスしますが、pycassaを使用してテーブル全体を取得するときにキーが存在します

Cassandra1.2.0にテーブルがあります。これにはVarIntキーがあります。キーを検索すると、それらが存在することがわかります。

テーブルの説明：

鍵

12040911

60619595

3220132

4602232

3997404

6312372

1128185

1507755

1778092

4701841

キー60619595の行を取得しようとすると、正常に機能します。

cqlsh：users>uからキーを選択します。ここでkey= 60619595;

鍵

60619595

pycassaを使用してテーブル全体を取得すると、行にアクセスできます。

正しい結果を返します。

私は何が間違っているのですか？エラーが何であるかわかりません。

どんな助けもいただければ幸いです、

よろしく

マイケル。

PS：私が試してみると、pycassaでそれを言う必要があります：

ファイル"test.py"、10行目、userscf.get（3997404）ファイル "/usr/local/lib/python2.7/dist-packages/pycassa/columnfamily.py"、655行目、get raise NotFoundException（） pycassa.cassandra.ttypes.NotFoundException：NotFoundException（_message = None）

平均よりも小さいIntにあるようです。

nosql cassandra pycassa

2013-02-22T17:38:43.860

0 投票する

1 に答える

146 参照

python - pycassaを使用してcassandraの分散カウンターデータのスライスとダイシングは可能ですか?

私はたくさん読んでグーグルで調べましたが、条件に基づいてカウンターデータをスライスしてダイスする方法を見つけることができませんでした。Cassandraでこれを行う方法はありますか? もしそうなら、私を助けてください。例: カウンタを使用して合計ページビューを保存している場合、特定のページ URL のページビューの数を取得する方法や、特定の日付のすべてのページビューを取得する方法はありますか?

前もって感謝します！

python cassandra pycassa

2013-03-01T11:44:32.707

0 投票する

1 に答える

1153 参照

cassandra - cassandraのTimeUUID列を更新しています

次の列ファミリーに時系列データを保存しようとしています。

私はこの方法でデータを正常に挿入しています：

ご覧のとおり、datetimeオブジェクトを列名として使用すると、pycassaはtimeUUIDオブジェクトに正しく変換されます。

場合によっては、アプリケーションが一部のデータを更新する必要があります。問題は、同じ日時オブジェクトを渡してその列を更新しようとすると、pycassaが別のUUIDオブジェクト（時間部分は同じ）を作成するため、列を更新する代わりに別のUUIDオブジェクトを作成することです。

問題は、日時オブジェクトを渡すpycassaでTimeUUIDベースの列を更新するにはどうすればよいですか？または、これが正しい方法ではない場合、推奨される方法は何ですか？

cassandra pycassa timeuuid

2013-03-04T19:38:47.750

0 投票する

1 に答える

125 参照

cassandra - 列ファミリーを作成する前に、pycassaShell を使用して DDL をダンプできますか?

PycassaShell は SYSTEM_MANAGER.create_column_family() を使用して、Cassandra で列ファミリーを作成します。

Cassandraでコミットする前にDDLをダンプする方法はありますか? pycassaShell 内部を変更する必要がありますか?

cassandra pycassa

2013-03-05T18:00:23.987

0 投票する

1 に答える

359 参照

cassandra - pycassa get_rangeを使用して逆ソート順で行を取得する方法は?

pycassa の get_range によって返された行を逆順にソートしたい..つまり、最初から最後まで。逆ソート順で列を取得するためのパラメーター column_reversed が存在することは知っていますが、行に対してこれを行うにはどうすればよいですか?

cassandra pycassa

2013-03-08T00:21:52.107

0 投票する

0 に答える

76 参照

cassandra - Cassandra のいくつかの非主キー列、および Pycassa を使用

私の要件は、次のような列ファミリーを持つことです。

私はこれを許可しないと思いCOMPACT STORAGEます。また、pycassaを使いたいです。Cassandra 1.2とを使用して上記を達成できる方法はありますかPycassa?

cassandra pycassa

2013-03-08T06:11:49.803

0 投票する

1 に答える

441 参照

cassandra - Cassandra の挿入がクラスターでスロットルされる

Cassandra で奇妙な問題が発生しています。私の理解では、Cassandra は挿入に対して拡張可能でした。つまり、2 台のサーバーのクラスターで 1500 回の書き込み/秒を取得していた場合、これを 4 台のサーバーに増やして 1500 回の書き込み/秒に近づけることができます。書き込み/秒がクラスター内のノード数に比例して増加しない可能性があることは理解していますが、現在、ノードを追加しても書き込み/秒の数は増加していません。

私の現在のセットアップは次のようなものです：

20 行のバッチサイズを使用して、Pycassa でバッチ挿入します。レプリケーションファクター 2 の永続的な書き込み

一部の ColumnFamilies には通常の列があり、一部には数十万列までの幅の広い列があります。幅の広い列を持つ ColumnFamilies の挿入は、100,000 列の 20 行ではなく、複数のバッチで挿入されます。

Cassandra クラスターは、m1.xlarge と SSD ドライブ (RAID なし) を使用して EC2 でホストされる 2 ノードクラスターであり、コミットログは sstables と同じドライブにあります。

クラスターを最大 10 ノードまでスケーリングしてみましたが、2 ノードと同じパフォーマンスが得られます。また、データをインポートするインスタンスの数を増やしてみましたが、書き込み操作ごとのレイテンシがはるかに高くなることを除いて、パフォーマンスは同じです。しかし、私が何をしても、書き込みを 1500/s より速くすることはできません。

cassandra pycassa

2013-03-25T17:03:30.593

0 投票する

1 に答える

2255 参照

cassandra - Python 用の最高の Cassandra 1.2 ドライバー、CQL のことは忘れたほうがいいですか?

Python 用の適切なドライバーを探しています。

1) ピカッサ。それは CQL をサポートしていません。

2) https://code.google.com/a/apache-extras.org/p/cassandra-dbapi2/ .

私は cassandra-dbapi2 を使用することを考えていましたが、ここで「接続プーリングの負荷分散の高度な機能をサポートしていない」という人がいます。一方、PyCassa は使用できますが、CQL はサポートしていません。Pycassa を試して、クライアントの CQL を忘れるべきですか?

私は ORM 機能を失うことは気にしませんが、実際には、SQL は人々が知っているものであるため、チームが新しいこと (使用している ORM API の新機能) を学ぶ必要があるため、さらに悪化する可能性があると思います。すでに SQL/CQL を知っているのに、なぜ新しい言語を学ぶのでしょうか? でもあくまでも意見です…。

最良の選択肢は何だと思いますか? CQLを忘れるべきですか？

cassandra pycassa

2013-03-31T15:03:02.880

問題タブ [pycassa]

Reference