問題タブ [xapian]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - xapian php 例外の処理方法
xapian php ラッパーの使用を支援します。
さまざまなカテゴリのエラー用にいくつかのカスタム例外ハンドラーがあります (それらをさらに分離することを考えています)。
Xapian は、標準の Exception オブジェクトをスローすることによってエラーを処理します。ただし、これらにはカスタム例外ハンドラーを使用したいと思います。すでにスローされた標準例外に対してカスタム例外を使用するにはどうすればよいですか? または、他のアイデア、おそらくXapianに他の例外タイプをスローさせる方法はありますか?
solr - Xapian のクローラー/パーサー
一連の Web サイトをクロールし、ページから特定の情報を抽出し、その特定の情報の全文索引を作成する検索エンジンを実装したいと考えています。
Xapian は、検索エンジン ライブラリに適しているように思えます。
Xapian と統合するためのクローラー/パーサーのオプションは何ですか?
Solr は、オープンソースのクローラー/パーサーと統合するために、Xapian よりも優れた選択肢でしょうか?
ruby-on-rails - act_as_xapian ジョブ テーブル
誰かがacts_as_xapian_jobsテーブルの内部の仕組みを説明できますか?
最近、プラグインで問題がacts_as_xapian
発生しました。xapian インデックス付きフィールドを使用してオブジェクトを作成すると、次のエラーが発生し続けました。
model_id
2147483647 の最大 int 値を超えていることが判明しました。回避策は、 model_id
bigint を使用するように更新することでした。なぜmodel_id
そんなに巨大になるのでしょうか?のコンテンツを見るとacts_as_xapian_jobs
、インデックスが作成されているすべてのフィールドに対して行が作成されているようです。テーブルでジョブが作成される方法を理解すると、非常に役立ちます。
テーブルのサンプルは次のとおりです。
前もって感謝します、
アミエ
django - djapian ベースの検索がフリーズする
djapian ベースの検索を実行しようとすると、アプリケーションがフリーズし、サーバーから応答がありません。mod_wsgi を使用してサイトをデプロイしています。Pythonシェルまたはdjango devサーバーで実行すると、検索は正常に実行されます。この問題は、自分のサイトを apache にデプロイした場合にのみ発生するようです。この問題を回避する方法を知っている人はいますか?
search - ストップワードを使用した Xapian 多言語検索?
私は 2 つの Xapian データベースを持っています。一方を「EN」と呼び、もう一方を「DE」と呼びましょう。前者には英語のドキュメントが含まれており、後者にはドイツ語のドキュメントが含まれているとします。
ユーザーが両方を同時に検索できるようにするには、両方のデータベースを簡単にロードできます。しかし、1 つのステマーとストップ ワードのセットしか使用できないようです。
英語のステマーをインスタンス化して、"EN" データベースからの結果だけに適用する方法はありませんか? 英単語でストッパーを作成する方法はなく、「EN」データベースからの結果のみに適用されますか?
これは正しいでしょうか?
php - スフィンクス + 東京暴君 + mysql
プロジェクトの 1 つに全文検索エンジンを作成することを考えています。Mysql、Tokyo Tyrant、インデックス作成が必要なファイル ドキュメントがあります。
現在 Sphinx を検討していますが、それを使用してすべてのドキュメントのインデックスを作成できるかどうかわかりません。
Sphinx に Mysql を使用させることが可能であることはわかっていますが、Sphinx にインデックスを作成させ、Tokyo Tyrant にクエリを実行させ、ファイル ドキュメントのインデックスを作成させる方法を検討しています。
Sphinx、Xapian、または別のものである可能性がありますが、JAVA ではなく (Lucene はリリースされていません)、PHP で使用でき、Linux で実行できるものです。
ソースとしてMysql以上を受け入れることができる検索エンジンのアイデアはありますか?
ありがとう
python - Djapian - 結果のフィルタリング
Djapian を使用してキーワードでオブジェクトを検索していますが、結果をフィルタリングできるようにしたいと考えています。これには、Django の QuerySet API を使用すると便利です。たとえば、次のようになります。
しかし、Djapian は、オブジェクトではなくResultSet
、オブジェクトの を返します。もちろん、Pythonでオブジェクトを「手動で」フィルタリングできますが、すべてのオブジェクトをフィルタリングする場合(クエリが空の場合)は現実的ではありません-データベースからテーブル全体を取得する必要があります。Hit
Model
これにDjapianを使用するのは不運ですか?
django - Djapian によって Django 用に作成されたインデクサーはありません
私は Djapian をセットアップするためのチュートリアルに取り組んでおり、indexshell を使用しようとしています (このステップで示されているように)。コマンド「リスト」を実行すると、次の出力が得られます。
したがって、クエリを実行できません。
これにより、次のことを試みます。
私の index.py は次のとおりです。
更新: djapian フォルダーを site-packages からプロジェクト フォルダー内に移動し、index.py をプロジェクト ルートから djapian フォルダー内に移動しました。indexshell で 'list' を実行すると、以下が返されるようになりました。
インデックスを選択しようとすると、まだ次のエラーが表示されるため、何もできません。
更新 2: DJAPIAN_DATABASE_PATH の設定に問題がありましたが、現在は修正されています。コマンド「use 0.0.0」を使用してインデクサーを選択できますが、クエリを実行しようとすると、「空のスライス」という ValueError が発生します。
django - Django、Xapian、HaystackでのDataBaseLockエラー
xapian/haystackを使用してモデルのインデックスを作成しています。ローカルマシンでテストすると、すべてが正常に機能しますが、サーバーにモデルを保存しようとすると、XapianはDatabaseLockErrorをスローします
待ち行列について、公式のdjangohaystackサイトで何かを読みました。これは進むべき道ですか?はいの場合、どのように実装しますか?
python - Djapianを使用したDjangoテンプレートの「許可が拒否されました」
私はDjapianチュートリアルに従い、Djapianが提供するインデックスシェルコマンドラインが成功したクエリを表示するように、すべてを「本によって」セットアップしました。
ただし、Djapianチュートリアルのサンプル検索を統合すると、次のナンセンスエラーが発生します。
/search/のTemplateSyntaxError
レンダリング中に例外が発生しました:(13、'許可が拒否されました')
これは次の行を指しています。
{%if結果%}
行を変更または省略すると、「結果」からフィールドを参照する行で次の(同じ)エラーが発生します。
スタックトレースはこの例外を示しています。
OSError(13、'許可が拒否されました')
の:
render_nodeの/usr/local/lib/python2.6/dist-packages/django/template/debug.py
django-debug-toolbarは結果を表示します:
<djapian.resultset.ResultSetオブジェクト(0x7f7142affcd0)>
これはDjapianの問題ですか?いずれにせよ、なぜ「許可が拒否されました」というエラーが発生するのでしょうか。