指示に従って Tachyon と Spark をインストールしました。
http://tachyon-project.org/documentation/Running-Spark-on-Tachyon.html
しかし、初心者として、彼らが言ったように、ファイル「X」をTachyonファイルシステムに入れる方法がわかりません:
$ ./spark-shell
$ val s = sc.textFile("tachyon-ft://stanbyHost:19998/X")
$ s.count()
$ s.saveAsTextFile("tachyon-ft://activeHost:19998/Y")
私がしたことは、既存のファイル (管理 UI で見つけたもの) を指すことでした。
scala> val s = sc.textFile("tachyon-ft://localhost:19998/root/default_tests_files/BasicFile_THROUGH")
s: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[1] at textFile at <console>:21
count を実行すると、以下のエラーが発生しました。
scala> s.count()
java.lang.NullPointerException: connectionString cannot be null
パスが間違っていたと思います。2つの質問:
ファイルを Tachyon にコピーする方法は?
その FS の適切なパスは何ですか?
すみません、とても初心者です!!
更新 1
tachyon-ft://localhost:19998/root/default_tests_files/BasicFile_THROUGH
正しいパスかどうかはわかりません。ブラウザ経由でも取得できませんwget
これは私がファイルシステムブラウザで見たものです