1 つのマスターと 2 つのワーカーを持つ 3 ノードのスタンドアロン Spark クラスターと、2 ノードの cassandra リングを使用しています。これは、私がやろうとしていることのサンプル コードです。
SparkConf conf = new SparkConf(true);
SparkContext sc = new SparkContext(HOST, APP_NAME, conf);
String query = "Select address from " + CASSANDRA_KEYSPACE + "." + CASSANDRA_COLUMN_FAMILY + " where ras_ = '01'";
CassandraSQLContext sqlContext = new CassandraSQLContext(sc);
DataFrame resultsFrame = sqlContext.sql(query);
JavaRDD<Row> resultsRDD = resultsFrame.javaRDD();
JavaRDD<String> dataRDD = resultsRDD.map(row -> row.getString(0));
dataRDD.saveAsTextFile("output");
から、System.out.println
クエリの結果としていくつかのデータがあることはわかっていますが、プロジェクトのホームのoutput
ディレクトリでは、取得しているファイルは と だけで、ファイルは_SUCCESS
あり._SUCCESS.crc
ませんpart-*
。これは予想される動作ですか? そうでない場合、どこが間違っていますか?