1

PySolrを使用して検索を実行しています。RSSフィードのインデックスを作成したいのですが、PySolrを使用してこれが可能かどうか疑問に思っていました。可能であれば、どのように実行しますか。

Solrでこれを行う方法の説明をhttp://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Exampleで見つけました。

しかし、PySolrで同等のことを行う方法については何も見つかりません

ありがとう

4

1 に答える 1

2

おそらく、PySolrで同等のことをする必要はありません。例のように、すでにSolrがフィードにインデックスを付けている場合は、PySolrを使用してそのインデックスをクエリします。何かのようなもの:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

本当にPython側から実行したい場合は、そこでRSSをフェッチして解析する必要があります(Universal Feed Parserなどの他のライブラリを使用)。PySolrは、Solrとの対話をラップするだけで、データソースを「実行」しません。

PySolrを使用し(他のエンジンを使用できる)Haystackをチェックして、検索インデックスエントリを作成し、インデックス作成のためにSolrに送信する作業をきちんと抽象化することをお勧めします。

于 2010-01-28T22:33:30.823 に答える