問題タブ [cql3]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Datastax API を使用した Cassandra データベースへの Upsert/Cassandra データベースからの読み取り (新しい Binary プロトコルを使用)
で働き始めましたCassandra database
。Datastax APIを使用してupsert/read
into/fromする予定ですCassandra database
。私はこれDatastax API
(新しいバイナリプロトコルを使用する)にまったく慣れておらず、いくつかの適切な例を含む多くのドキュメントも見つけることができません。
以下は、新しいバイナリ プロトコルを使用Singleton class
する Cassandra データベースに接続するために作成したものです。Datastax API
最初の質問singleton class
- 新しい Binary プロトコルを使用する Datastax API を使用して Cassandra データベースに接続しているときに、上記で不足しているものがあれば教えてください。
2 番目の質問upsert and read data
- Cassandra データベースに出入りしようとしています -
これらは、上記のシングルトン クラスを使用する DAO のメソッドです。
誰でもこれで私を助けることができますか?私は、新しいバイナリ プロトコルを使用しているこの Datastax API にまったく慣れていないため、これには多くの問題があります。
助けてくれてありがとう。
python - 複数の(python)クライアントを並行して使用してcassandraからすべての行をロードする
Cassandra が推奨する RandomPartitioner (または Murmur3Partitioner)を使用する場合、キーの md5 ハッシュを使用して行がクラスター全体に分散されるため、キーに対して意味のある範囲クエリを実行することはできません。これらのハッシュは「トークン」と呼ばれます。
それにもかかわらず、それぞれにトークンの範囲を割り当てることによって、多くのコンピューティング ワーカー間で大きなテーブルを分割することは非常に便利です。CQL3 を使用すると、トークンに対して直接クエリを発行できるように見えますが、次の pythonは機能しません... 編集: cassandra データベースの最新バージョンに対するテストに切り替えた後に機能し (doh!)、構文も更新します以下のメモ:
私はよりpythonicなインターフェースを好むので、理想的にはこれをpycassaで動作させたいと思っています。
これを行うより良い方法はありますか?
hadoop - haoop 統合に使用する cassandra クライアントはどれですか?
Cassandra をバックエンド ストアとして使用して、データ サービス レイヤーを構築しようとしています。私は Cassandra を初めて使用し、cassandra にどのクライアントを使用すればよいかわかりません - thrift または cql 3? Cassandra からデータを大量に読み書きする Amazon Elastic MapReduce (EMR) を使用する多くの mapreduce ジョブがあります。Cassandra に数十億の行がある場合、合計データ量は 100 TB を超えます。mapreduce ジョブは、高い qps (>1000 qps) で読み取りまたは書き込みが重くなる可能性があります。要件は次のとおりです。
- クライアント コードのシンプルさ。thrift には、sstableloader ( http://www.datastax.com/dev/blog/bulk-loading ) を使用して大量のデータをロードするための Hadoop との統合が組み込まれているようです。
- 実行時に新しい列を定義する機能。アプリケーションの要件によっては、さらに列を追加する必要がある場合があります。cql3 では、実行時に列を動的に定義できないようです。
- 一括読み取り/書き込みのパフォーマンス。どのクライアントが優れているかはわかりません。ただし、thrift client は大量のデータに対してより優れたパフォーマンスを発揮すると主張する次の投稿を見つけました: http://jira.pentaho.com/browse/PDI-7610?page=com.atlassian.jira.plugin.system.issuetabpanels:all-タブパネル
この質問に答える信頼できる情報源は見つかりませんでした。これはほとんどの人にとって共通の問題であり、コミュニティ全体に利益をもたらすと確信しているため、これを手伝っていただければ幸いです。
よろしくお願いします。
-プラテック
cassandra - Cassandra CQL を使用した埋め込みオブジェクトのコレクション
CQL を使用してドメイン モデルを Cassandra に入れようとしています。USER_FAVOURITES テーブルがあるとしましょう。それぞれのお気に入りは、ID を PRIMARY KEY として持っています。複数のフィールド、field_name、field_location などの最大 10 レコードのリストを順番に格納したい。
このようなテーブルをモデル化するのは良い考えですか
オブジェクトは、一致するインデックスのリスト項目から構築されます (例:
いつも一緒にお気に入りを検索します。ある位置、開始、終了、または中間に項目を追加したい場合があります。
これは良い習慣ですか?のようには見えませんが、この場合にオブジェクトをグループ化する方法がわかりません。また、たとえば、field_location またはより複雑な順序付けルールによって順序付けを維持したい場合も同様です。