0

これは一種の一般的な質問です、私はそれが正しい精神で受け取られることを望みます。私はsolrの完全な初心者であり、それを使用して最初のアプリケーションを構築しようとしています。検討したアプローチを確認したいので、足し算と引き算をお気軽にご提案ください。

1)DIH-インデックス付けするすべてのデータを把握します。これには、クエリされるデータとメタデータ(存在する場合)が含まれている必要があります。各データの揮発性と、cronタスクが同じデータを更新および削除する方法を理解します。この知識に基づいてデルタ/部分インポートの戦略を構築します。

2)スキーマ-データを配置します。また、必要に応じてメタデータを配置します。必要に応じてアナライザーを使用して処理し、該当する場合はクエリアナライザーを設定します。

3)クエリの調整-サンプルデータのテストを開始して、アプリケーションをさらに微調整します。

4)同義語を追加し、同じものをテストします。

5)ファセット

6)検索ボックス(ajax)の提案は、インデックスが付けられたアイテムに対してのみ提供されます。

4

1 に答える 1

2

新しく始める場合は、おそらく基本的なインデックス作成に集中して、データを検索可能にする必要があります。

  • Solr のスタンドアロン セットアップから始めます。
  • データのインデックス作成 - 所有しているデータによって異なります。DB (DIH)、リッチ ドキュメント (Extratc Handler)、Web ページ (Nutch あり) ...
  • Schema.xml の構成
    • 設定する必要があるフィールド
    • どのような目的 (表示、検索、ファセット、ハイライトなど)
    • フィールドで実行する分析は何ですか?
    • ストップワード、ASCII フィルター、ステマー、類義語を段階的に適用できます。
  • solrconfig.xml の構成
    • 検索の動作方法。
    • どのフィールドを検索しますか? 複数のフィールド ?
    • 検索標準に使用するパーサーは何ですか? ディスマックス? Eディスマックス?
  • 適切に構成され、クエリを適切に作成するだけで、フィールドでファセット、フィルタリング、並べ替え、および強調表示が有効になります

  • 高度 :-

    • 検索関連性の調整
    • Solr セットアップ - 高度なマルチコア ステップ、マスター/スレーブ構成、分散検索、Solr クラウドが必要かどうかを確認できます
    • インデックス作成時間のパフォーマンス チューニング
    • クエリ時間のパフォーマンス チューニング
    • 自動提案、もしかして、その他の機能は solr から利用できるか、アプリケーション側から簡単に構築できます。
于 2012-12-05T07:01:43.667 に答える