問題タブ [dataimporthandler]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rss - PySolr rss dataimport
PySolrを使用して検索を実行しています。RSSフィードのインデックスを作成したいのですが、PySolrを使用してこれが可能かどうか疑問に思っていました。可能であれば、どのように実行しますか。
Solrでこれを行う方法の説明をhttp://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Exampleで見つけました。
しかし、PySolrで同等のことを行う方法については何も見つかりません
ありがとう
solr - Solr DataImportHandler を使用した URL フィールドがありません
Solr は初めてで、DataImportHandler に問題があります。サーバーの起動時に次のメッセージが表示されます:
Jan 27, 2010 12:27:22 PM org.apache.solr.handler.dataimport.DataImportHandler processConfiguration
情報: solrconfig.xml から構成を処理しています: {config=dih-gensigdb-jdbc.xml} 2010 年 1 月 27 日 12:27:22 PM org.apache.solr.handler.dataimport.DataImporter loadDataConfig 情報: データ構成が正常に読み込まれました 1 月 27 日、2010 12:27:22 PM org.apache.solr.handler.dataimport.DataImporter verifyWithSchema 情報: url は SolrSchema の必須フィールドです。しかし、DataConfig には見つかりませんでした
私の dataConfig には url フィールドが含まれていませんが、なぜそれが必要なのかわかりません。DIH コンソールを使用して構成をデバッグしようとすると、ドキュメントのインポート中に次のエラーが発生します。
org.apache.solr.common.SolrException: ドキュメント [null] 必須フィールドがありません: url
私のdataConfigは次のようになります:
<dataConfig>
<dataSource name="jdbc" driver="oracle.jdbc.driver.OracleDriver"
url="jdbc:oracle:thin:@localhost:1521:xe"
user="genesigdb" password="genesigdb"/>
<document name="PMID">
<entity name="PMID" dataSource="jdbc" query="SELECT PMID FROM PUBLICATION">
</entity>
</document>
</dataConfig>
solr - Solr dataimport が data-config.xml のエンティティをスキップする
私の data-config.xml は、ドキュメント タグの下に 3 つの異なるエンティティを定義します (それらを foo、bar、および baz と呼びましょう)。基本的なフル インポート localhost:8983/solr/dataimport?command=full-import を発行すると、3 つのエンティティのうち 2 つだけがインデックスに登録されます (foo と bar はインデックスに登録されていますが、baz では作成されません)。ただし、localhost:8983/solr/dataimport?command=full-import&entity=baz&clean=false を介して baz をインポートするコマンドを発行すると、baz ドキュメントが正常に追加され、インデックスには 3 つのタイプがすべて含まれます。
一般的なデータ インポートで 1 つのエンティティがスキップされる理由について考えている人はいますか? 確認できるエラー/警告ログはありますか? /solr/logs/ に悪いものは何も表示されませんが、それらは単にリクエスト ログのように見えます。
lucene - Solr DatImportHandler、同じタイプの複数の結果?
やあみんな、ここでの助けはいつものように大いに感謝されるでしょう。
Solrを使用してデータベースからデータにインデックスを付けています。最初のテーブルの各行event_titlesには、テーブルevent_datesに含まれる複数の開始日を関連付けることができます。Data-configは次のとおりです。
DIH Develpment Consoleを使用すると、各日付が適切に返されることがわかりますが、たとえば、最初の日付のみが保存されます。
ただし、selectを実行した場合の結果は次のようになります。
返されたすべての日付を開始'配列'に入れますが、私は持っているでしょうか?
誰かがこれが可能であるかどうかに光を当てることができますか?
乾杯!
jdbc - Solr DataImporter 構成例外
JDBC SQLServerDriver を使用して SQL Server に接続するように Solr DataImportHandler を構成した後、Apache Solr Admin (Win7) を起動すると、次のエラーが発生します。MS Sql JDBC Connector sqljdbc4.jar は、Solr の bin と lib フォルダに配置されます。
solrconfig.xml には次のものがあります。
data-config.xml は次のとおりです。
アドバイスをいただければ幸いです。
solr - Solr: 多言語インデックスと multiValued フィールドの DIH?
私はMySQLテーブルを持っています:
Solr DIH について 2 つの質問があります。
1)langauge_code
フィールドは、フィールドの言語を示します。また、言語に応じて、さまざまな Solr フィールドtext
にインデックスを付けたいと考えています。text
DIH はこのようなユースケースを処理できますか? そのように構成するにはどうすればよいですか?
2)tags
フィールドは、Solr フィールドに索引付けする必要がありますmultiValued
。複数の値は、コンマで区切られた文字列に格納されます。たとえばtags
、文字列が含まれている場合"blue, green, yellow"
、3 つの値"blue"
、"green"
を"yellow"
Solr multiValued フィールドにインデックス付けします。
DIHでそれを行うにはどうすればよいですか?
ありがとう。
lucene - solrDIHを使用する場合のOOM
こんにちはすべて:DIHを使用して完全なインポートコマンドを実行するとOOMエラーが発生します。データベースはSQL Server 2008であり、データベースには30k行のデータしかありません。どうすれば修正できますか?助けてくれてありがとう:)
lucene - DataImportHandlerを使用して物理的に削除されたドキュメントを削除する方法を解決する
solr wikiを読みましたが、deletedPkQueryを使用して論理的に削除されたドキュメントを削除できることはわかっていますが、DataImportHandlerを使用して物理的に削除されたドキュメントを削除するにはどうすればよいですか?
apache - SOLRDataImportHandlerは式を評価しません
SOLRDataImportHandlerを使用してデータをフィードしようとしています。ルートエンティティからフィールドを1つだけインポートした場合、構成は単純で簡単で、すべてが正常に機能しました。
しかし、ネストされたエンティティからフィールドをインポートしようとすると、機能せず、本当に戸惑い、行き詰まります。
これが私のdataconfigからの関連スニペットです:
詳細をオンにしてDIH開発コンソールを使用してインポートをデバッグしようとすると、次のように表示されます。
興味深い点は、idフィールドが空であるエンティティbの3つのクエリだと思います。$ {a.b_id}が評価されていないように思えますが、理由がわかりません。
誰か助けてもらえますか?前もって感謝します。