2

ニッチな検索エンジンを作ろうと思っています。クローラーとして apache-nutch-1.6 を使用し、サーチャーとして apache-solr-3.6.2 を使用しています。これらのテクノロジーに関する Web 上の最新情報はほとんどないと言わざるを得ません。

このチュートリアルhttp://wiki.apache.org/nutch/NutchTutorialに従い、ubuntu システムに apache と solr を正常にインストールしました。また、シード URL を webdb に挿入してクロールを実行することにも成功しました。

で solr インターフェイスを使用しhttp://localhost:8983/solr/adminて、クロールされた結果を照会することもできます。しかし、これは私が受け取る出力です。ここに画像の説明を入力.

ここで何か不足していますか?以前の apache-nutch-0.7 には、このような明確な html 出力を生成する戦争がありました。ここに画像の説明を入力. どうすればこれを達成できますか...または、最新のチュートリアルまたはガイドブックを教えていただければ幸いです。

4

2 に答える 2

2

いくつかのこと:

  • 始めたばかりの場合は、Solr 3.6 を使用せず、最新の 4.1+ に直行してください。多くのことが変更され、多くの新機能が追加されました。
  • あなたは、Solr + UI を一般的な Web に直接公開すると言っているようです。Solr は完全に保護されておらず、Web ベースの削除クエリを許可しているため、これは非常に悪い考えです。あなたは本当に真ん中にビジネス層が欲しい.
  • Solr 4.1 では、きれいな管理 UI があり、Solr がサポートするページを実行するために Velocity を使用する方法を示す /browse ページもあります。または、Solr で UI を取得する方法の例については、Project Blacklightなどをご覧ください。
于 2013-02-06T12:34:55.703 に答える
0

私の質問に答えたリンク http://cmusphinx.sourceforge.net/2012/06/building-a-java-application-with-apache-nutch-and-solr/を以下で見つけました。

上記のリンクで利用可能なコンテンツを読んだ後、私は同意します、私は私に非常に腹を立てました。Solrパッケージは、solrを照会するために必要なすべてのオブジェクトを提供します。

実際、必須のjarは、solr-solrj-3.4.0.jar、commons-httpclient-3.1.jar、およびslf4j-api-1.6.4.jarです。

誰でもこれらのオブジェクトを使用してJava検索エンジンを構築し、データベースにクエリを実行して、洗練されたUIを使用できます。

再度、感謝します。

于 2013-02-09T07:06:48.967 に答える