私はこのようにここに述べられているように私の用語ベクトルを作成しました:
~/Scripts/Mahout/trunk/bin/mahout seqdirectory --input /home/ben/Scripts/eipi/files --output /home/ben/Scripts/eipi/mahout_out -chunk 1
~/Scripts/Mahout/trunk/bin/mahout seq2sparse -i /home/ben/Scripts/eipi/mahout_out -o /home/ben/Scripts/eipi/termvecs -wt tf -seq
それから私は走ります
~/Scripts/Mahout/trunk/bin/mahout lda -i /home/ben/Scripts/eipi/termvecs -o /home/ben/Scripts/eipi/lda_working -k 2 -v 100
そして私は得る:
MAHOUT-JOB:/home/ben/Scripts/Mahout/trunk/examples/target/mahout-examples-0.6-SNAPSHOT-job.jar 11/09/04 16:28:59 INFO common.AbstractJob:コマンドライン引数:{ --endPhase = 2147483647、-input = / home / ben / Scripts / eipi / termvecs、-maxIter = -1、-numTopics = 2、-numWords = 100、-output = / home / ben / Scripts / eipi / lda_working、-startPhase = 0、-tempDir = temp、-topicSmoothing = -1.0} 11/09/04 16:29:00 INFO lda.LDADriver:LDA Iteration 1 11/09/04 16:29 :01 INFO input.FileInputFormat:処理する入力パスの合計:4 11/09/04 16:29:01 INFO mapred.JobClient:ステージング領域ファイルのクリーンアップ:/ tmp / hadoop-ben / mapred / staging /ben692167368/。 staging /job_local_0001スレッド"main"の例外java.io.FileNotFoundException:ファイルファイル:/ home / ben / Scripts / eipi / termvecs / tokenized-documents/dataが存在しません。org.apache.hadoop.fs.RawLocalFileSystemで。
It's right, that file doesn't exist. How am I supposed to create it?