問題タブ [dih]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - Solr 4.5 と Tomcat 8 DataImportHandler と MSSQL 2008 R2
インターネットで他のすべての質問といくつかのチュートリアルを試しました。すべてが同じエラーで終了します。クラスが見つからないという例外。C:\solrIch は、ホーム ディレクトリの下に solr をC:\solr_homeインストールし、Tomcat のインストールは下C:\Tomcat
にあります。Microsoft ドライバーをC:\Tomcat\libフォルダーにコピーしました。
C:\solr_home\collection1\conf\solrconfig.xml
...
C:\solr_home\collection1\conf\data-config.xml
次のエラーが表示されます
xml - DataImportHandler を使用した Solr での XML ファイルのインデックス作成
いくつかの XML ファイルにインデックスを付ける必要があります。ファイルの構造は次のとおりです。
Solr 構成ファイルを編集しました。
データ構成.xml
および schema.xml
そして、リクエストハンドラーを次のように構成しました。
http://localhost:8983/solr/dataimport?command=full-import初めてSolr ( ) にフル インポート リクエストを発行すると、次のような応答が返されます。
そして、2度目に、私はこの応答を受け取ります:
Solr にクエリを実行すると、インデックスが作成されたドキュメントがないことがわかりました。誰でもこれで私を助けてくれますか? スキーマとデータ構成は正しいですか?
xpath - Concat Children Nodes XPathEntityProcessor Solr DIH
SOLR フィールドの値に、DIH を介して XML の親子関係に関する情報を含めようとしています。
ここにdataConfigがあります:
サンプル XML:
どのように指定しますか:
そのため、仕様の対応するインスタンスを次のようにすることができます。
と
と
と
理想的には、次のような名前とサブネームの間の区切り文字を使用します。
html - DIHを使用してApache slorでhtmlファイルにインデックスを付ける方法
私はapache solrを初めて使用し、DIHを使用してapche solrでhtmlファイルのインデックスを作成しようとしています.誰かが適切な指示を手伝ってくれます.
solr - SOLR: splitBy を使用して複数の値を持つフィールドにデータを入力する際の矛盾
splitBy 機能を使用して、パイプで区切られたデータソースから複数の値を持つフィールドを設定するのに問題があります。私の実装は、フィールドの 1 つで部分的に機能しているように見えますが、他のフィールドでは機能しません。以下の私の実装例。
次のデータを含む db ビューがあります。
recordId relist dbaName
1 PA21|MD29 香港ドラゴン|皮をむいたリンゴ
私の設定:
私の schema.xml スニペット:
私の期待では、データが分割されて保存されると、ドキュメントは次のようになります。
しかし、これは私が得るものです:
私の問題:
- relist は分割されていますが、リストには元の区切り値も含まれています
- dbaName は分割されていません
どんな助けでも大歓迎です。
ありがとう
solr - 無関係なエンティティフィールドでのsolrソート
私の文書構造はこのようなものです
entity1 列のみを含むクエリで、entity2 列を sort 句に追加すると、結果がまったく影響を受けるのはなぜですか? 私のクエリは、entity2 とは関係のない entity1 列のみです。solrが最初に「ドキュメント」全体にソート句を適用してから、クエリ条件を適用する場合はありますか?
ドキュメントの読み取り -
sortMissingLast="false" および sortMissingFirst="false" (デフォルト) の場合、デフォルトの lucene ソートが使用され、フィールドのないドキュメントが昇順ソートの最初に配置され、降順ソートの最後に配置されます。誰かが太字のテキストについて詳しく説明してもらえますか?
mysql - Solr DIH Mysql 構成
これは私の DIH data-config.xml
です。id、user_id をインポートしていますが、uid はインポートしていません。schema.xml の flagged_by は
solr - SOLR DIH クラスター環境
Solr クラウド環境を構成し、稼働させていますが、まったく問題はありません。しかし今、ループでデルタ インポートを実行する必要があります。このインポート プロセスが終了するたびに、別のプロセスを開始します。
考慮事項:
- すべてのノードで同じ DIH 構成。
- 3 つの solr ノードがロード バランサーの背後で実行されています (コマンドは任意のノードで実行できます)。
- インポーターが 1 つのノードで既に実行されている場合、2 番目のノードでインポーターを実行したくありません。
- 最後の実行が終了したらすぐに DIH を実行したいと思います。
- インポート中に 1 つのノードがダウンした場合、..これには時間がかかりすぎます..別のインポート プロセスを開始しましょう.(プロセスが実行されていたノードを特定する方法がある場合)ダウンしたので、それを確認してその情報を保存して理由を見つけることができます..それは素晴らしいことです)
- データベースで毎分非常に多くのイベントが発生しています。Solr でこれらすべてのイベント (DB レコード) が本当に必要です (最新のドキュメント)。
オプションと考え方
- JBoss EAP 5.1 を使用して TimerService で外部アプリを実行することを考えています。クラスターがあり、これが永久に実行され、ステータスを要求し、ループで DIH プロセスを再起動することを確認できます。
DHIイベントリスターを見てテストしていました
/li>
com.me.MyNotificationService これは、プロセスがいつ終了したかを知らせてくれますが、これを JBoss AS コンテナー (再びSolr ノードがダウンすると、通知も失われます )。
このループが壊れないようにする方法があれば。これがすべてSolrクラスターによって管理されている場合(およびインポートの途中でノードがダウンしたときなどの状況に注意してください)、その外部の「Run solr import app」を忘れますが、それが可能だとは本当に思いません.
Solr クラスターに対して、このノード (ノード 2 としましょう) でこのインポート プロセスを実行し、完了したときに通知するか、ステータスを尋ねる方法 (その特定のノード 2 でも) を伝える機能は非常に便利です。ロードバランサーのため、これをノード 1 に要求している場合)
どんな推薦や考えも大歓迎です。
ありがとう。
solr - Solr DIH はアトミック更新を実行できますか?`
Solr 4 では、インデックス内の既存のドキュメントに対してアトミック (部分) 更新を行う機能が追加されました。つまり、ドキュメント ID を照合して、1 つのフィールドだけのコンテンツを置換したり、複数の値を持つフィールドにさらにエントリを追加したりできます: http://wiki.apache.org/solr/Atomic_Updates
DataImportHandler (DIH) からアトミック更新を実行できますか?