私はApache Nutchとsolrを使用しています。私の要件は、flvとepubファイルの内容を解析することです。以下のコマンドを使用してファイルを解析しています
bin/nutch crawl urls -solr http://localhost:8983/solr/
私はnutchのurlsフォルダにファイルのURLを保持しています。上記のコマンドは機能していますが、次のコマンドでsolrを使用して解析されたコンテンツを表示しようとすると、ファイルのURLが表示されるだけです。
bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/*
私に提案してください....
ありがとう