0

Apache Nutch を使用していくつかの Web サイトをクロールしています。そのうちの 1 つの Web サイトを後押しする必要があります。100 個の URL のうち、シードに Wiki の URL があるとします。ウィキからのすべてのデータを起動して、それらが一番​​上に表示されるようにしたいと思います。私はsolr 4.10.3を使用しています。

数日後にこれらの Web サイトを再クロールします。したがって、solr によるインデックス ブートは機能しないと思います。それを行うのは Nutch になります。何か案が ?

4

0 に答える 0