solr を使用してコーパスのインデックスを作成したいと考えています。
シーケンス ファイルを作成するには、次のコマンドを使用しました。
./behemoth -i file://path/to/my/file/where/the corpus/is/located -o /user/user-name/file-to-which-the-putput-is-stored
この後、インデックス作成のために次のコマンドを実行しました:
./behemoth solr /user/user-name/pTH-to-which-output-is-stored-in-previous-command http://localhost:8983/solr
しかし、次のエラーが発生しています:
15/06/04 11:51:07 INFO mapreduce.Job: Job job_local183059797_0001 running in uber mode : false
15/06/04 11:51:07 INFO mapreduce.Job: map 0% reduce 0%
15/06/04 11:51:08 INFO mapred.LocalJobRunner:
15/06/04 11:51:08 INFO impl.ConcurrentUpdateSolrServer: Status for: file:///usr/local/ASR/data/Corpus/en_TheTelegraph_2001-2010/telegraph_2007-2010/telegraph_1st_oct_2007_to_31st_dec_2007/foreign/1071015_foreign_story_8435523.utf8 is 404
15/06/04 11:51:08 ERROR impl.ConcurrentUpdateSolrServer: error
java.lang.Exception: Not Found
上記のファイルがそのパスに存在するため、問題を特定できません。助けてください