apache-spark - ストリーミングデータセットを Cassandra に書き込むには?

翻译自：https://stackoverflow.com/questions/45113538 2017-07-15T01:16:53.547

2823 次

したがって、 spark-cassandra-connector を使用dfして Cassandra テーブルに配置するすべてのデータを含む Python Stream-sourced DataFrameがあります。私は2つの方法でこれをやろうとしました:

df.write \
    .format("org.apache.spark.sql.cassandra") \
    .mode('append') \
    .options(table="myTable",keyspace="myKeySpace") \
    .save() 

query = df.writeStream \
    .format("org.apache.spark.sql.cassandra") \
    .outputMode('append') \
    .options(table="myTable",keyspace="myKeySpace") \
    .start()

query.awaitTermination()

ただし、それぞれこのエラーが発生し続けます。

pyspark.sql.utils.AnalysisException: "'write' can not be called on streaming Dataset/DataFrame;

と

java.lang.UnsupportedOperationException: Data source org.apache.spark.sql.cassandra does not support streamed writing.

Streamed DataFrame を Cassandra テーブルに送信できる方法はありますか?

apache-spark - ストリーミング データセットを Cassandra に書き込むには?

2 に答える 2

Related

Reference

apache-spark - ストリーミングデータセットを Cassandra に書き込むには?