search - Solrでの設計へのアプローチ

Question

これは一種の一般的な質問です、私はそれが正しい精神で受け取られることを望みます。私はsolrの完全な初心者であり、それを使用して最初のアプリケーションを構築しようとしています。検討したアプローチを確認したいので、足し算と引き算をお気軽にご提案ください。

1）DIH-インデックス付けするすべてのデータを把握します。これには、クエリされるデータとメタデータ（存在する場合）が含まれている必要があります。各データの揮発性と、cronタスクが同じデータを更新および削除する方法を理解します。この知識に基づいてデルタ/部分インポートの戦略を構築します。

2）スキーマ-データを配置します。また、必要に応じてメタデータを配置します。必要に応じてアナライザーを使用して処理し、該当する場合はクエリアナライザーを設定します。

3）クエリの調整-サンプルデータのテストを開始して、アプリケーションをさらに微調整します。

4）同義語を追加し、同じものをテストします。

5）ファセット

6）検索ボックス（ajax）の提案は、インデックスが付けられたアイテムに対してのみ提供されます。

score 2 · Accepted Answer

新しく始める場合は、おそらく基本的なインデックス作成に集中して、データを検索可能にする必要があります。

Solr のスタンドアロンセットアップから始めます。
データのインデックス作成 - 所有しているデータによって異なります。DB (DIH)、リッチドキュメント (Extratc Handler)、Web ページ (Nutch あり) ...
Schema.xml の構成
- 設定する必要があるフィールド
- どのような目的 (表示、検索、ファセット、ハイライトなど)
- フィールドで実行する分析は何ですか?
- ストップワード、ASCII フィルター、ステマー、類義語を段階的に適用できます。
solrconfig.xml の構成
- 検索の動作方法。
- どのフィールドを検索しますか? 複数のフィールド ?
- 検索標準に使用するパーサーは何ですか? ディスマックス? Eディスマックス?
適切に構成され、クエリを適切に作成するだけで、フィールドでファセット、フィルタリング、並べ替え、および強調表示が有効になります
高度：-
- 検索関連性の調整
- Solr セットアップ - 高度なマルチコアステップ、マスター/スレーブ構成、分散検索、Solr クラウドが必要かどうかを確認できます
- インデックス作成時間のパフォーマンスチューニング
- クエリ時間のパフォーマンスチューニング
- 自動提案、もしかして、その他の機能は solr から利用できるか、アプリケーション側から簡単に構築できます。

1 に答える 1