問題タブ [xapian]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xapian - Xapianをプロジェクトで使用したいのですが、一生の間、WindowsにXapianをインストールする方法がわかりません。
これがLinuxボックスにあった場合、私は設定されますが、ドキュメントが明らかに不足しています!
これをC#とオメガインデックスアプリで使用したいと思います。
Windows上でxapianとomegaを実際に構築する方法(または、正常に動作するコンパイル済みのバイナリ)に関するドキュメントはないようです。
mysql - django の全文検索: Mysql はそれほど悪くない? (対スフィンクス、ザピアン)
私はdjangoの全文検索エンジンを研究しています。インストールが簡単で、インデックス作成が高速で、インデックス更新が高速で、インデックス作成中にブロックされず、検索が高速でなければなりません。
多くの Web ページを読んだ後、短いリストを作成しました。フィールドの重み付けなど)。
次に、いくつかのベンチマークを作成しました。そのために、ネット上で多くの無料の書籍を収集して、1 485 000 レコード (id、タイトル、本文) を持つデータベース テーブルを生成しました。各レコードの長さは約 600 バイトです。データベースから、既存の 100,000 語のリストも生成し、それらをシャッフルして検索リストを作成しました。テストのために、私は自分のラップトップ (4Go RAM、デュアル コア 2.0Ghz) で 2 回実行しました。 . 「自家製」のベンチマーク結果は次のとおりです。
ご覧のとおり、Mysql は全文検索に関してそれほど悪くはありません。さらに、そのクエリ キャッシュは非常に効率的です。
インストールするものは何もなく (Innodb プロダクション テーブルを MyISAM 検索テーブルに同期するための小さなスクリプトを書くだけでよい)、ステミングなどの高度な検索機能は本当に必要ないので、Mysql は私には良い選択のように思えます...
質問は次のとおりです。Mysql 全文検索エンジンと sphinx および xapian についてどう思いますか?
python - ライブデータベースからdjangoテストフレームワークを読み取る方法は?
ここに同様の質問があることに気付きましたが、これには別のアプローチがあります。このアプリの検索コンポーネントの単体テストを作成したいと思います。明らかに、django 設定モジュールとデータベースとのすべての接続が必要なので、django が提供するテスト ランナーは理想的です。ただし、django テスト フレームワークはダミーのデータベースを作成するため、すべてのデータをフィクスチャにダンプしてからインデックスを作成するのは嫌です (テストには永遠に時間がかかります!)。
テストはデータベースからのみ読み取るため、データが危険にさらされることはありません。-私はこのユニットテスト全体に不慣れなので、その同様の質問で読んだ新しいテストランナーを作成する解決策は、少なくとも詳細がなければ、少しは啓発しません
python - xapian を macports 経由でインストールしたのに、なぜこの python アプリが xapian をインストールする必要があると教えてくれるのでしょうか?
システムで Python アプリケーションを実行しようとしています。実行しようとすると、Xapian をインストールする必要があるというメッセージで終わるトレースバックが表示されます。そこで、macports を使用して xapian-core と xapian-bindings をインストールしました。その後、再度 Python アプリケーションを実行しようとしましたが、同じトレースバックが返されました。次に何をすべきかについてのアイデアはありますか?インストールする必要がある追加の xapian-python のようなものはありますか? この種のことは、私にとってまったく新しいことです。
Mac OS 10.6.3、Python 2.6.5、および Django 1.2.1 を使用しています
取得したトレースバックの最後の数行を次に示します。
django - Django+Haystackこの検索の方法
私はHaystackと検索の世界に慣れていないので、この質問をする方法がわかりませんでした。
私が達成したいのは次のとおりです。
次のような検索クエリを使用する:1つ2つ
次のようなコンテンツを返品したいのですが。
- これです
- 1
- 2
- 2つ1つ
- ここに何か
これはHaystack+solr / xapianで可能ですか?結果に関連性を持たせることも可能ですか?両方の単語がヒットした場合、それは私により多くの関連性を与えるでしょう。
現在、ビューでSearchQuerySetを使用していますが、それを実現できません。
乾杯
autocomplete - xapian オートコンプリート
オートコンプリート/オートサジェスト機能を実装するために Xapian を使用したことのある人はいますか? つまり、ユーザーが入力すると、考えられる一連の提案を提供します。これは、別名 Google の Auto-Suggest です。
Xapian を検索フレームワークとして使用することを検討している約 200 万のフレーズがあります。私が理解しているように、このフレームワークはこの種の機能用に構築されたものではありません。だから私はこれに飛び込む前に何かを知りたい -
- 誰かがこれを突き刺した場合、遭遇した問題は何ですか?
- これは、このようなものを構築するための適切なフレームワークですか?
- 完全に間違ったアプローチまたは間違ったフレームワークを採用している場合は、代替案を提案してください。
mysql - Solrなどを使用して短いフィールドを検索するか、ストレートフォワードDBインデックスを使用します
私のウェブサイトには数百万のエンティティが保存されています。訪問者は、タイトルにのみ含まれる単語を入力してエンティティを検索します。タイトルの長さは最大100文字です。
これは、ユーザーが大きなブロブ内を検索する従来のドキュメント検索の場合ではありません。フィールドは非常に短いです。また、ここでの主な問題は、エンティティが「入力時に」(自動提案)提供されるため、パフォーマンス(関連性ではない)です。
よりスマートなルートは何でしょうか?
- MySqlテーブル[word、entity_id]を作成し、'word'にインデックスを付けて
から、search_indexからselectentity_id
を使用してクエリを実行します。語。 - Solrまたは同様の検索エンジンを使用してください。私の読書では、全文検索をより重視しています。
また、将来スペルの提案を紹介したい場合、これはどのように影響しますか。
ありがとうございました!
python - xapian-bindings python 互換性
開発サーバーで Python を使用して期待どおりに xapian を動作させることができますが、Web サーバーに問題があります。
私はこのエラーに遭遇し続けます:
import xapian Traceback (最新の呼び出しが最後): ファイル ""、1 行目、ファイル "/home/x/lib/python2.6/xapian/ init .py"、28 行目、_xapian = swig_import_helper() ファイル "/ home/x/lib/python2.6/xapian/ init .py"、27 行目、swig_import_helper return _mod UnboundLocalError: local variable '_mod' referenced before assignment
swig の最新コピーをインストールし、xapian コアと xapian-bindings の両方を再インストールしましたが、エラーは解決しません。
どんなアイデアでも大歓迎です。
python - djapianを使用してint値の範囲を検索します
検索バックエンドとしてdjapianを使用しており、値の範囲を検索しようとしています。例えば:
コメントが0から10の投稿を検索します。私はこの問題を見つけましたが、djapianでこれを行う方法を見つけることができず、ある種の日付範囲検索を実装するためのパッチを適用します。また、ある種の範囲クエリについて説明しているxapianの公式ドキュメントからこのページを見つけました。ただし、自分の生のxapianクエリを作成したり、生のxapianクエリをdjapianにフィードしたりするための知識が不足しています。だから私を助けてください、int値の範囲についてdjapianインデックスをクエリするにはどうすればよいですか?
ありがとう、
ローリー
django - Django-rebuild_indexコマンドを使用したhaystackでエラーが発生します:
このエラーが発生します:
xapian.WritableDatabase_swiginit(self、_xapian.new_WritableDatabase(* args))xapian.DatabaseOpeningError:/ home / xapian / mysite_index:データベースがリストされていません
「./manage.pyrebuild_index」を実行して、初めてインデックスにデータを入力できるようにする場合。再構築インデックスへの警告メッセージと確認が表示され、最後の行が前述の情報のリストが表示されます。
どんな助けでも大歓迎です。ありがとう