0

ウィキペディアの xml ファイルを Solr にインデックス付けしたいと考えています。

しかし、エラーが発生し、インデックスを作成できません。Solr には、xml ファイル用の特定の形式があります。schema.xmlウィキペディア ファイルのタグに合わせてとdata-config.xmlファイル を変更しました。

それでも、ファイルのインデックスを作成できません。私の実際の意図は、30 GB の xml ファイルであるウィキペディアのインデックスを作成することです。

すべてのウィキペディア ファイルを Solr にインデックス化するにはどうすればよいですか?

4

1 に答える 1

1

ドキュメントには、まさにこれに関するセクションの例がありDataImportHandlerます。ウィキペディアのインデックス作成です。

基本的に、DataImportHandlerといくつかのXPathを使用して、気になるメタデータをWikipedia XMLから引き出し、フラットなSolrフィールドリストに配置します。

于 2012-04-03T20:27:14.163 に答える