sphinx-0.9.9-rc2 のドキュメントには次のように記載されています。
通常、インデックスを作成するデータは、SQL データベース、プレーン テキスト ファイル、HTML ファイル、メールボックスなど、さまざまなソースから取得できます。
ただし、SQL 以外のソースのセットアップに関するドキュメントは見つかりません。構成ファイルは、ソースがデータベース以外のものであることを示していないようです。HTML ソースを使用してスフィンクスをセットアップするための役立つリンクはありますか?
sphinx-0.9.9-rc2 のドキュメントには次のように記載されています。
通常、インデックスを作成するデータは、SQL データベース、プレーン テキスト ファイル、HTML ファイル、メールボックスなど、さまざまなソースから取得できます。
ただし、SQL 以外のソースのセットアップに関するドキュメントは見つかりません。構成ファイルは、ソースがデータベース以外のものであることを示していないようです。HTML ソースを使用してスフィンクスをセットアップするための役立つリンクはありますか?
Sphinxでxmlpipe(現在はxmlpipe2と呼ばれています)機能をお探しですか?XMLファイルで試してみましたが、SQLの場合と同じように機能します。
私はバニラHTMLファイルでSphinxを試したことがないので、HTMLファイルを解析し、インデックスを作成する属性/フィールドを使用してXMLファイルを作成し、xmlpipeを使用してSphinxにフィードする必要があると思います。
詳細については、こことここを参照してください。
HTH