hadoop - MahoutLDAはFileNotFound例外を出します

Question

私はこのようにここに述べられているように私の用語ベクトルを作成しました：

~/Scripts/Mahout/trunk/bin/mahout seqdirectory --input /home/ben/Scripts/eipi/files --output /home/ben/Scripts/eipi/mahout_out -chunk 1
~/Scripts/Mahout/trunk/bin/mahout seq2sparse -i /home/ben/Scripts/eipi/mahout_out -o /home/ben/Scripts/eipi/termvecs -wt tf -seq

それから私は走ります

~/Scripts/Mahout/trunk/bin/mahout lda -i /home/ben/Scripts/eipi/termvecs -o /home/ben/Scripts/eipi/lda_working -k 2 -v 100

そして私は得る：

MAHOUT-JOB：/home/ben/Scripts/Mahout/trunk/examples/target/mahout-examples-0.6-SNAPSHOT-job.jar 11/09/04 16:28:59 INFO common.AbstractJob：コマンドライン引数：{ --endPhase = 2147483647、-input = / home / ben / Scripts / eipi / termvecs、-maxIter = -1、-numTopics = 2、-numWords = 100、-output = / home / ben / Scripts / eipi / lda_working、-startPhase = 0、-tempDir = temp、-topicSmoothing = -1.0} 11/09/04 16:29:00 INFO lda.LDADriver：LDA Iteration 1 11/09/04 16:29 ：01 INFO input.FileInputFormat：処理する入力パスの合計：4 11/09/04 16:29:01 INFO mapred.JobClient：ステージング領域ファイルのクリーンアップ：/ tmp / hadoop-ben / mapred / staging /ben692167368/。 staging /job_local_0001スレッド"main"の例外java.io.FileNotFoundException：ファイルファイル：/ home / ben / Scripts / eipi / termvecs / tokenized-documents/dataが存在しません。org.apache.hadoop.fs.RawLocalFileSystemで。

It's right, that file doesn't exist. How am I supposed to create it?

score 0 · Accepted Answer

ベクトルの作成に問題がある可能性があるため、ベクトルが空である可能性があります。ベクターがフォルダーに正常に作成されているかどうかを確認します (ファイルサイズが 0 バイトではありません)。このエラーは、入力フォルダーにいくつかのファイルが不足している場合に発生することがあります。その場合、これらの 2 つの手順は機能しますが、有効な出力は作成されません。

hadoop - MahoutLDAはFileNotFound例外を出します

1 に答える 1

Related

Reference