これは、異なる属性セットを持つインデックス付きドキュメントを持つことは可能ですか?
例:
attr1、attr2、attr3 を持つドキュメントがいくらかあり、attr4、attr5、attr6 を持つドキュメントがある程度ありますか?
両方のタイプから可能なすべての属性を事前に定義せずに、このすべてのドキュメントを 1 つのインデックスに含めることはできますか?
はい、この目的のために動的フィールドを使用できます。
Sphinx では、key:value を保存する json フィールド (sql_attr_json) を使用できます。私たちも同じ状況で、どのデータを Sphinx/Solr に保存するかは顧客によって異なります。
残念ながら、現在のバージョンの sphinx (テスト済み 2.2.3 ベータ版) では、json に 4 GB を超えるデータが含まれていない可能性があります: http://sphinxsearch.com/forum/view.html?id=12550 - データの量によって異なります。json には 15 個のキーと値のペアがあり、4GB に収まるレコードは 6M のみでした。
Sphinx では、事前にすべての属性を sphinx.conf ファイルに設定する必要があると思います。Solr の動的フィールドに相当するものはありません。