問題タブ [xapian]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
533 参照

php - xapian php 例外の処理方法

xapian php ラッパーの使用を支援します。

さまざまなカテゴリのエラー用にいくつかのカスタム例外ハンドラーがあります (それらをさらに分離することを考えています)。
Xapian は、標準の Exception オブジェクトをスローすることによってエラーを処理します。ただし、これらにはカスタム例外ハンドラーを使用したいと思います。すでにスローされた標準例外に対してカスタム例外を使用するにはどうすればよいですか? または、他のアイデア、おそらくXapianに他の例外タイプをスローさせる方法はありますか?

0 投票する
2 に答える
1557 参照

solr - Xapian のクローラー/パーサー

一連の Web サイトをクロールし、ページから特定の情報を抽出し、その特定の情報の全文索引を作成する検索エンジンを実装したいと考えています。

Xapian は、検索エンジン ライブラリに適しているように思えます。

Xapian と統合するためのクローラー/パーサーのオプションは何ですか?

Solr は、オープンソースのクローラー/パーサーと統合するために、Xapian よりも優れた選択肢でしょうか?

0 投票する
1 に答える
260 参照

ruby-on-rails - act_as_xapian ジョブ テーブル

誰かがacts_as_xapian_jobsテーブルの内部の仕組みを説明できますか?

最近、プラグインで問題がacts_as_xapian発生しました。xapian インデックス付きフィールドを使用してオブジェクトを作成すると、次のエラーが発生し続けました。

model_id2147483647 の最大 int 値を超えていることが判明しました。回避策は、 model_idbigint を使用するように更新することでした。なぜmodel_idそんなに巨大になるのでしょうか?のコンテンツを見るとacts_as_xapian_jobs、インデックスが作成されているすべてのフィールドに対して行が作成されているようです。テーブルでジョブが作成される方法を理解すると、非常に役立ちます。

テーブルのサンプルは次のとおりです。

前もって感謝します、

アミエ

0 投票する
1 に答える
180 参照

django - djapian ベースの検索がフリーズする

djapian ベースの検索を実行しようとすると、アプリケーションがフリーズし、サーバーから応答がありません。mod_wsgi を使用してサイトをデプロイしています。Pythonシェルまたはdjango devサーバーで実行すると、検索は正常に実行されます。この問題は、自分のサイトを apache にデプロイした場合にのみ発生するようです。この問題を回避する方法を知っている人はいますか?

0 投票する
1 に答える
652 参照

search - ストップワードを使用した Xapian 多言語検索?

私は 2 つの Xapian データベースを持っています。一方を「EN」と呼び、もう一方を「DE」と呼びましょう。前者には英語のドキュメントが含まれており、後者にはドイツ語のドキュメントが含まれているとします。

ユーザーが両方を同時に検索できるようにするには、両方のデータベースを簡単にロードできます。しかし、1 つのステマーとストップ ワードのセットしか使用できないようです。

英語のステマーをインスタンス化して、"EN" データベースからの結果だけに適用する方法はありませんか? 英単語でストッパーを作成する方法はなく、「EN」データベースからの結果のみに適用されますか?

これは正しいでしょうか?

0 投票する
2 に答える
825 参照

php - スフィンクス + 東京暴君 + mysql

プロジェクトの 1 つに全文検索エンジンを作成することを考えています。Mysql、Tokyo Tyrant、インデックス作成が必要なファイル ドキュメントがあります。

現在 Sphinx を検討していますが、それを使用してすべてのドキュメントのインデックスを作成できるかどうかわかりません。

Sphinx に Mysql を使用させることが可能であることはわかっていますが、Sphinx にインデックスを作成させ、Tokyo Tyrant にクエリを実行させ、ファイル ドキュメントのインデックスを作成させる方法を検討しています。

Sphinx、Xapian、または別のものである可能性がありますが、JAVA ではなく (Lucene はリリースされていません)、PHP で使用でき、Linux で実行できるものです。

ソースとしてMysql以上を受け入れることができる検索エンジンのアイデアはありますか?

ありがとう

0 投票する
2 に答える
860 参照

python - Djapian - 結果のフィルタリング

Djapian を使用してキーワードでオブジェクトを検索していますが、結果をフィルタリングできるようにしたいと考えています。これには、Django の QuerySet API を使用すると便利です。たとえば、次のようになります。

しかし、Djapian は、オブジェクトではなくResultSet、オブジェクトの を返します。もちろん、Pythonでオブジェクトを「手動で」フィルタリングできますが、すべてのオブジェクトをフィルタリングする場合(クエリが空の場合)は現実的ではありません-データベースからテーブル全体を取得する必要があります。HitModel

これにDjapianを使用するのは不運ですか?

0 投票する
2 に答える
416 参照

django - Djapian によって Django 用に作成されたインデクサーはありません

私は Djapian をセットアップするためのチュートリアルに取り組んでおり、indexshell を使用しようとしています (このステップで示されているように)。コマンド「リスト」を実行すると、次の出力が得られます。

したがって、クエリを実行できません。

これにより、次のことを試みます。

私の index.py は次のとおりです。

更新: djapian フォルダーを site-packages からプロジェクト フォルダー内に移動し、index.py をプロジェクト ルートから djapian フォルダー内に移動しました。indexshell で 'list' を実行すると、以下が返されるようになりました。

インデックスを選択しようとすると、まだ次のエラーが表示されるため、何もできません。

更新 2: DJAPIAN_DATABASE_PATH の設定に問題がありましたが、現在は修正されています。コマンド「use 0.0.0」を使用してインデクサーを選択できますが、クエリを実行しようとすると、「空のスライス」という ValueError が発生します。

0 投票する
1 に答える
266 参照

django - Django、Xapian、HaystackでのDataBaseLockエラー

xapian/haystackを使用してモデルのインデックスを作成しています。ローカルマシンでテストすると、すべてが正常に機能しますが、サーバーにモデルを保存しようとすると、XapianはDatabaseLockErrorをスローします

待ち行列について、公式のdjangohaystackサイトで何かを読みました。これは進むべき道ですか?はいの場合、どのように実装しますか?

0 投票する
1 に答える
2597 参照

python - Djapianを使用したDjangoテンプレートの「許可が拒否されました」

私はDjapianチュートリアルに従い、Djapianが提供するインデックスシェルコマンドラインが成功したクエリを表示するように、すべてを「本によって」セットアップしました。

ただし、Djapianチュートリアルのサンプル検索を統合すると、次のナンセンスエラーが発生します。

/search/のTemplateSyntaxError

レンダリング中に例外が発生しました:(13、'許可が拒否されました')

これは次の行を指しています。

{%if結果%}

行を変更または省略すると、「結果」からフィールドを参照する行で次の(同じ)エラーが発生します。

スタックトレースはこの例外を示しています。

OSError(13、'許可が拒否されました')

の:

render_nodeの/usr/local/lib/python2.6/dist-packages/django/template/debug.py

django-debug-toolbarは結果を表示します:

<djapian.resultset.ResultSetオブジェクト(0x7f7142affcd0)>

これはDjapianの問題ですか?いずれにせよ、なぜ「許可が拒否されました」というエラーが発生するのでしょうか。