シンプルなスキーマで whoosh インデックスを作成し、150 万件のレコードにインデックスを付けた後、15 秒で 1000 件近くの検索結果を取得しています。
schema = Schema(tax_id=STORED, name=TEXT(stored=True))
MAIN*.seg ファイルのサイズは約 190 Mb です。
私が探している方法は次のとおりです
ix=open_dir("index")
with ix.searcher() as searcher:
query = QueryParser("name", ix.schema).parse(u'putrefaciens')
results = searcher.search(query)
このパフォーマンスが、インデックス サイズを考慮して、whoosh を使用してより高速に全文検索を行うことができるかどうかの期待どおりかどうか疑問に思っています。