3

SQLからNo-SQL、つまりCassandraにデータを読み込もうとしています。しかし、どういうわけか、一致していない行はほとんどありません。Cassandraの特定のcolumn_familyの行キーの数を数える方法を誰かに教えてもらえますか?

get_countとget_multicountを試しましたが、これらのメソッドを渡すにはキーが必要です。私の場合、キーがわかりません。代わりに、row_keysの行数が必要です。list column_family_nameはリストを提供しますが、100行に制限されています。方法はありますか、100の制限を上書きできます。

4

2 に答える 2

1

私の知る限り、列ファミリーの行数を取得する方法はありません。代わりに、列ファミリー全体に対して範囲クエリを実行する必要があります。

cfがコラムファミリーの場合、次のようなものが機能するはずです。

num_rows = len(list(cf.get_range()))

ただし、get_rangeのドキュメントには、行が多すぎる場合に問題が発生する可能性があることが示されています。とを使用して、チャンクで実行する必要がある場合がstartありrow_countます。

于 2011-11-21T22:55:24.540 に答える
0

すべての行を読み取らずに、Cassandraの行を数えることができます。

これを非常に効率的に行うSparkの実装を参照してください。cassandraCount()

于 2016-03-17T16:06:46.897 に答える