3

一部のサイトをクロールしてインデックス化するための Nutch と Lucene のセットアップがあり、nutch に付属の JSP サイトの代わりに .net Web サイトを使用したいと考えています。

誰かがいくつかのソリューションを推奨できますか?

.Net サイトがリモート処理を使用して接続するインデックス サーバーでアプリが実行されているソリューションを見てきました。

速度は明らかに考慮事項ですが、これでもうまく機能しますか?

編集: NHibernate.Search はこれで機能しますか?

編集: Solrnetライブラリを使用して、ASP.net サイトで使用されている Solr インデックス サーバーを使用することになりました。

4

6 に答える 6

5

他の回答から完全に明確でない場合、Lucene.NET と Lucene (Java) は同じインデックス形式を使用するため、既存の (Java ベースの) メカニズムを引き続き使用してインデックスを作成し、Luceneを使用できるはずです。.NET Web アプリケーション内の .NET を使用して、インデックスをクエリします。

Lucene.NET インキュベーター サイトから:

C# への API とクラスの移植に加えて、Java Lucene のアルゴリズムが C# Lucene に移植されています。つまり、Java Lucene で作成されたインデックスは 、C# Lucene と相互に互換性があります。読み取り、書き込み、更新の両方で。実際、Lucene インデックスは、Java Lucene および C# Lucene プロセスを使用して同時に検索および更新できます。

于 2008-10-27T19:25:34.810 に答える
3

Lucene を使用する代わりに、Solrを使用して nutch でインデックスを作成できます (こちらを参照)。その後、使用可能な 2 つのライブラリのうちの 1 つ ( SolrSharpおよびSolrNet ) を使用して、Solr に非常に簡単に接続できます。

于 2008-10-15T12:54:52.287 に答える
1

SolrNet と SolrSharp の比較を検索してここにたどり着きました。感想をここに残しておきます。

SolarSharp は終了したプロジェクト (長い間更新されていなかった) のように見えるため、SolarNet が唯一の選択肢です。

これが誰かの役に立てば幸いです。受け入れられた回答にコメントを残していましたが、まだ十分な評判がありません:)

于 2012-05-12T15:48:37.820 に答える
1

私もこれに取り組んでいます。

http://today.java.net/pub/a/today/2006/02/16/introduction-to-nutch-2.html

クエリを Nutch に送信して、RSS の結果を取得できるようです。

編集:

概念実証として、Windows フォームで今日これが機能するようになりました。2 つのテキスト ボックス (searchurl とクエリ)、1 つはサーバー URL 用、もう 1 つはクエリ用です。1 つのデータグリッド ビュー。

private void Form1_Load(object sender, EventArgs e)
        {
            searchurl.Text = "http://localhost:8080/opensearch?query=";


    }

    private void search_Click(object sender, EventArgs e)
    {
        string uri;

        uri = searchurl.Text.ToString() + query.Text.ToString();
        Console.WriteLine(uri);

        XmlDocument myXMLDocument = new XmlDocument();

        myXMLDocument.Load(uri);

        DataSet ds = new DataSet();

        ds.ReadXml(new XmlNodeReader(myXMLDocument));

        SearchResultsGridView1.DataSource = ds;
        SearchResultsGridView1.DataMember = "item";

    }
于 2009-02-24T16:39:27.483 に答える
0

Solr を使用する代わりに、cron ジョブで実行される Java ベースのインデクサーと、クエリ用の Java ベースの Web サービスを作成しました。実際には、.net サイトがページを構築するために使用するさまざまな種類のデータほど、ページのインデックスを作成しませんでした。したがって、実際には 4 つの異なるインデックスがあり、それぞれが異なるドキュメント構造を持ち、すべてほぼ同じ方法でクエリできます (ユーザー、投稿、メッセージ、写真など)。

Web サービス応答の XSD を定義することで、ドキュメントの表現を格納するクラスを .net と Java の両方で生成することができました。Web サービスは基本的に、適切なインデックスでクエリを実行し、ヒットから応答 xml を入力します。.net クライアントはそれを解析してオブジェクトに戻します。クライアント側 JavaScript 用の json インターフェイスもあります。

于 2008-10-15T14:41:29.683 に答える
0

java lucene から dot net バージョンに切り替えてみませんか。確かにそれは投資ですが、ほとんどの場合、クラス置換の演習です。最後に必要なのは、単なる接着剤である以外に付加価値のないレイヤーを追加することです。接着剤を減らして、より多くのものを目指すべきです...

于 2009-05-18T06:38:53.417 に答える