DStream[String, Int
単語数のペアを持つ] があり("hello" -> 10)
ます。これらのカウントをステップ インデックスを使用して cassandra に書き込みたいと考えています。インデックスは次のように初期化されvar step = 1
、マイクロバッチが処理されるたびに増分されます。
次のように作成された cassandra テーブル:
CREATE TABLE wordcounts (
step int,
word text,
count int,
primary key (step, word)
);
ストリームをテーブルに書き込もうとすると...
stream.saveToCassandra("keyspace", "wordcounts", SomeColumns("word", "count"))
...わかりjava.lang.IllegalArgumentException: Some primary key columns are missing in RDD or have not been selected: step
ました。
step
3 つの列をまとめて書き込むために、ストリームの先頭にインデックスを追加するにはどうすればよいですか?
私はspark 2.0.0、scala 2.11.8、cassandra 3.4.0、およびspark-cassandra-connector 2.0.0-M3を使用しています。