問題タブ [spark-cassandra-connector]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

884 問題

0 投票する

5 に答える

15067 参照

cassandra - Spark-Cassandra コネクタ : Cassandra へのネイティブ接続を開くことができませんでした

Spark と Cassandra は初めてです。Spark ジョブを送信しようとすると、Cassandra への接続中にエラーが発生します。

詳細：

バージョン:

Spark と Cassandra は仮想クラスター上にありますクラスターの詳細:

クライアントマシン (ラップトップ) - 172.16.0.6 からジョブを送信しようとしています。このエラーをグーグルで検索した後、クライアントマシンからクラスタ上のすべてのマシンに ping を実行できることを確認しました: スパークマスター/スレーブノードと cassandra ノード、およびすべてのマシンでファイアウォールを無効にしました。しかし、私はまだこのエラーに苦しんでいます。

Cassandra.yaml

最小限のサンプルジョブを実行しようとしています

ジョブを送信するには、spark-shell を使用します (:spark シェルにコードを貼り付けます)。

私が得ているエラー：

ここで私が間違っていることを誰でも指摘できますか?

2015-06-18T23:37:19.703

0 投票する

0 に答える

899 参照

java - Spark を使用して Cassandra 列ファミリーで SQL クエリを実行するさまざまな方法の比較

私のプロジェクトの一環として、非常に大きな Cassandra データセット用の SQL クエリインターフェイスを作成する必要があるため、Spark を使用して cassandra 列ファミリーで SQL クエリを実行するためのさまざまな方法を検討しており、3 つの異なる方法を考え出しました。

静的に定義されたスキーマで Spark SQLContext を使用する

定義を次のように使用します。
/li>
動的に定義されたスキーマで Spark SQLContext を使用する
/li>
spark-cassandra-connector から CassandraSQLContext を使用する
/li>

ある方法と別の方法の長所/短所を知りたいです。また、CassandraSQLContextメソッドについては、クエリが CQL に限定されているか、Spark SQL と完全に互換性があります。また、私の特定のユースケースに関する分析もお願いします。62 列の約 1,760 万のタプルを持つ cassandra 列ファミリーがあります。このような大規模なデータベースを照会するには、どの方法が最も適切ですか?

java cassandra apache-spark apache-spark-sql spark-cassandra-connector

2015-06-22T10:53:31.010

0 投票する

1 に答える

1243 参照

scala - ネストされたケースクラスを UDTValue 型に変換する方法

カスタムケースクラスを使用して、Spark (1.4.0) を使用して Cassandra (2.1.6) に書き込むのに苦労しています。spark-cassandra-connector 1.4.0-M1これまでのところ、DataStaxと次のケースクラスを使用してこれを試しました。

これを機能させるために、次のコンバーターも実装しました。

コンバーターを手動で検索すると、それを使用してのインスタンスをに変換できますEventが、関連するオブジェクトUDTValueを使用sc.saveToCassandraしてのインスタンスを渡すとRsvpResponse、次のエラーが発生します。

UDTValueコネクタライブラリが内部で処理する方法が原因で、コンバータが呼び出されることさえないようです。ただし、上記のソリューションは、Cassandra テーブル (ユーザー定義型を含む) からのデータの読み取りには機能します。コネクタドキュメントに基づいて、ネストされたケースクラスをcom.datastax.spark.connector.UDTValue型に直接置き換えました。これにより、説明されている問題は修正されますが、データの読み取りが中断されます。データの読み取りと書き込みのために 2 つの別々のモデルを定義するつもりだとは想像できません。それとも、ここで明らかな何かが欠けていますか?

scala cassandra spark-cassandra-connector

2015-06-23T23:20:13.973

0 投票する

1 に答える

1055 参照

java - java で cassandra の spark をセットアップする際に助けが必要です

Javaでcassandraにアクセスするようにsparkを設定すると、NoClassDefFoundErrorがスローされます

2 つの jar ファイルが追加されます。spark-cassandra-connector-java-assembly-1.4.0-M1-SNAPSHOT.jar & spark-core_2.10-0.9.0-incubating.jar. spark-cassandra-connector-java-assembly-1.4.0-M1-SNAPSHOT.jar は、scala 2.10 に対してビルドされています。コマンドプロンプトで scala -version と入力すると、scala コードランナーバージョン 2.11.6 が表示されます。spark-shell から spark にアクセスしても問題ありません。spark-shell からの cassandra 列ファミリへのアクセスも正常に機能しています。

エラーの原因は何ですか??

java eclipse apache-spark spark-cassandra-connector

2015-06-24T12:25:15.723

0 投票する

1 に答える

4162 参照

java - IN 句を使用した Spark Cassandra コネクタのフィルタリング

Java のスパーク cassandra コネクタフィルタリングでいくつかの問題に直面しています。Cassandra では、IN 句を使用してパーティションキーの最後の列でフィルタリングできます。例えば

spark の CQL クエリで使用される IN 句を指定する回数を教えてください。範囲クエリもどのように指定できますか?

java cassandra apache-spark cql spark-cassandra-connector

2015-06-25T10:45:16.470

1 2 3 4 5 6 7 8 9 10

問題タブ [spark-cassandra-connector]

cassandra - Spark-Cassandra コネクタ : Cassandra へのネイティブ接続を開くことができませんでした

java - Spark を使用して Cassandra 列ファミリーで SQL クエリを実行するさまざまな方法の比較

scala - ネストされたケース クラスを UDTValue 型に変換する方法

java - java で cassandra の spark をセットアップする際に助けが必要です

java - IN 句を使用した Spark Cassandra コネクタのフィルタリング

Reference

scala - ネストされたケースクラスを UDTValue 型に変換する方法