1

ドキュメントには、Hadoop API と互換性のあるファイル システム ( HDFS 、 S3 など) をチェックポイント ディレクトリとして使用できることが記載されています。

私の質問は、HDFS と S3 以外に、Kafka と Cassandra を使用した Spark ストリーミング アプリケーションの実用的な代替手段は何かということです。

ありがとう

4

1 に答える 1

0

GlusterGFSLustreなどの任意のタイプの分散ファイル システムを使用できますが、基盤となるファイル システムで使用されるプロトコルが Spark API でサポートされている必要があります。

于 2016-01-07T01:34:03.930 に答える