0

プロジェクトの 1 つに全文検索エンジンを作成することを考えています。Mysql、Tokyo Tyrant、インデックス作成が必要なファイル ドキュメントがあります。

現在 Sphinx を検討していますが、それを使用してすべてのドキュメントのインデックスを作成できるかどうかわかりません。

Sphinx に Mysql を使用させることが可能であることはわかっていますが、Sphinx にインデックスを作成させ、Tokyo Tyrant にクエリを実行させ、ファイル ドキュメントのインデックスを作成させる方法を検討しています。

Sphinx、Xapian、または別のものである可能性がありますが、JAVA ではなく (Lucene はリリースされていません)、PHP で使用でき、Linux で実行できるものです。

ソースとしてMysql以上を受け入れることができる検索エンジンのアイデアはありますか?

ありがとう

4

2 に答える 2

3

xmlpipe2を使用して、任意のソースから sphinx にデータを送信できます。

Tokyo Tyrant から読み取るためのコード (おそらく PHP で) を記述し (それが何であるかわからないので、自分で作業する必要があります)、ファイルシステムを記述し、すべてを XML としてパッケージ化するだけです。次に、カスタム コードを実行するコマンドを実行するように sphinx ソースを設定するだけで、あとは sphinx が処理します。

于 2009-09-24T12:57:02.167 に答える
0

ドキュメントがあまり多くなく、PHP のみを使用したい場合は、以下を参照してくださいZend_Search_Lucene

Zend_Search_Lucene は、完全に PHP 5 で記述された汎用テキスト検索エンジンです。インデックスをファイル システムに保存し、データベース サーバーを必要としないため、ほぼすべての PHP 駆動型 Web サイトに検索機能を追加できます。

それでも、独自のサーバーを使用している場合は、おそらくソフトウェアをインストールできます。つまり、PHP のみで記述されていなくても、Sphinx の Lucence/SolR をデプロイできます。多くのコンテンツをインデックス化します。

于 2009-09-24T03:29:18.960 に答える