membaseの (または、現在は cupbase と言うべきでしょうか?) TAP出力プロトコルをsphinx (オープンソースの全文検索エンジン)にリンクしようとした人がいるかどうか疑問に思っていました。
どのようにしましたか?そしてそれはどのくらいうまくいきましたか?ウェブ上の良い参考文献(何も見つからないようです)
ありがとう!
よろしく、ldx
実際にこれを行ったことはありませんが、sphinx には xml パイピング メカニズムがあるようです。彼らはこれを導入したので、人々は新しいデータ ソース ドライバーを自分で作成する必要がなくなりました。
xmlpipe の詳細: http://sphinxsearch.com/docs/2.0.1/xmlpipe.html
できることは、Java タップの実装の 1 つを取得することです。1つはタッププロジェクトのみです。
https://github.com/mikewied/jtap
もう 1 つは spymemcached の最新バージョンです (現時点では、タップをサポートするプレリリースです)。
Couchbase の Web サイトで見つけることができます。
http://files.couchbase.com/maven2/spy/spymemcached/2.7/
ただし、トポロジの変更を追跡し、jtap を使用すると、ノードごとに個別のタップ ストリームを開始する必要があるため、spymemcached を使用します。どちらも非常に似ていますが。
最善の方法は、おそらく、タップ ストリームを開始してから、上記でリンクしたスフィンクス ページの例のように小さな xml スニペットを作成することです。次に、インデックス作成のために xml を sphinx パイプに送信できます。
また、タップ クライアントに問題がある場合は、Couchbase フォーラムに投稿してください。彼らは質問に答えるのがとても速いです。