1

Whoosh を使用して、複数語のクエリを含むドキュメントを検索できません。http://packages.python.org/Whoosh/quickstart.html#the-searcher-objectに示されているように And 演算子を使用しました が、エラーが表示されます。単一単語検索が機能します。

from whoosh.index import create_in
from whoosh.fields import *
from whoosh.qparser import QueryParser
from whoosh.fields import Schema, TEXT, KEYWORD, ID, STORED
from whoosh.analysis import StemmingAnalyzer
from whoosh.query import *
import os.path

##Schema

schema = Schema(title=TEXT(stored=True), path=ID(stored=True), content=TEXT)

##Indexing

if not os.path.exists("index"):
    os.mkdir("index")

ix = create_in("index", schema)

writer = ix.writer()
writer.add_document(title=u"First document", path=u"/a", content=u"Michael Jackson")
writer.add_document(title=u"Second document", path=u"/b", content=u"Roger Federer")
writer.add_document(title=u"Third document", path=u"/c", content=u"Michael Jordan")
writer.add_document(title=u"Fifth document", path=u"/d", content=u"Michael Phelps")
writer.add_document(title=u"Sixth document", path=u"/e", content=u"Michael Schumacher")
writer.add_document(title=u"Seventh document", path=u"/f", content=u"Michael Dell")
writer.add_document(title=u"Eigth document", path=u"/g", content=u"Michael Akerfeldt")
writer.commit()


##Searching

searcher = ix.searcher()

#Single Word Search:
#myquery = u'Michael'

#Multiword Search:
myquery = And([Term("content", u'Roger'), Term("content", u'Michael')])

#query = QueryParser("content", schema=ix.schema).parse(myquery)

parser = QueryParser("content", ix.schema)
query = parser.parse(myquery)

#with ix.searcher() as searcher:

results = searcher.search(query, limit=None)

print "Length of Results :", len(results)
print "\nResults : "
for i in range (0,len(results)):
    print results[i]
4

1 に答える 1

0

クエリパーサーの機能について混乱していると思います。クエリ パーサーは、次の呼び出しによって明示的に作成したクエリを作成します。And

query = parser.parse("Roger and Michael")

または、本当にクエリ構造を自分で作成したい場合は、 の代わりに にmyquery直接渡すだけです。searcher.searchquery

詳細はこちら: http://packages.python.org/Whoosh/parsing.html

于 2012-09-09T12:13:56.297 に答える