spark-submit を使用する場合、依存関係を --packages で送信する必要があります。どのパッケージを使用すればよいですか?
依存関係を含む uber jar を作成しようとしましたが、次のエラーが発生します。
java.lang.IllegalArgumentException: Please specify an existing file
エラーは、次のコードの結果です。
String path = "hdfs:///user/data.txt";
SentenceIterator iter = new LineSentenceIterator(new File(path));