PySolrを使用して検索を実行しています。RSSフィードのインデックスを作成したいのですが、PySolrを使用してこれが可能かどうか疑問に思っていました。可能であれば、どのように実行しますか。
Solrでこれを行う方法の説明をhttp://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Exampleで見つけました。
しかし、PySolrで同等のことを行う方法については何も見つかりません
ありがとう
PySolrを使用して検索を実行しています。RSSフィードのインデックスを作成したいのですが、PySolrを使用してこれが可能かどうか疑問に思っていました。可能であれば、どのように実行しますか。
Solrでこれを行う方法の説明をhttp://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Exampleで見つけました。
しかし、PySolrで同等のことを行う方法については何も見つかりません
ありがとう
おそらく、PySolrで同等のことをする必要はありません。例のように、すでにSolrがフィードにインデックスを付けている場合は、PySolrを使用してそのインデックスをクエリします。何かのようなもの:
from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
do_stuff_with(result)
本当にPython側から実行したい場合は、そこでRSSをフェッチして解析する必要があります(Universal Feed Parserなどの他のライブラリを使用)。PySolrは、Solrとの対話をラップするだけで、データソースを「実行」しません。
PySolrを使用し(他のエンジンを使用できる)Haystackをチェックして、検索インデックスエントリを作成し、インデックス作成のためにSolrに送信する作業をきちんと抽象化することをお勧めします。