問題タブ [zend-lucene]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
symfony1 - Lucene検索の良い代替手段は何ですか?
私は何千もの Cv を持っており、「コンピューター サイエンス」をバックグラウンドとして持つ CV を検索したいと考えています。
それで、私はググって、Lucene がこの仕事をしていることを知りました。データを Lucene にフィードする必要があり、Lucene はすべてのドキュメントをインデックス化します。
特定のテキスト (「Compuet science」など) を検索すると、結果に一致する CV が返されます。
このためには、MSword-93/MSword-2007/PDF をテキストに変換して Lucene をフィードする必要があります。
MSword2007 文書からはテキストを取得できますが、MSword 2003 からは取得できません。
多くのPDFライターがありますが、これを行うことができるPDFリーダーライブラリを入手できませんでした.
PDFリーダーライブラリとms93ドキュメントをテキストに変換することに光を当ててください。または、Lucene検索の代替手段があれば教えてください。
ありがとう、多くの回答ありがとう
php - php foreachが2回繰り返される
私はこの問題に対してさまざまな解決策を試してきましたが、成功しませんでした。問題はこれです:
Zend_Search_Lucene からいくつかの結果が得られ、ID が 2、3、4 の 3 つの結果が得られました。
次に、Doctrine で作成された無関係なクエリからいくつかのレコードがあり、id ID: 2 と 3 を持つ 2 つのレコードが得られます。
Search Lucene の結果は、合計 3 つのレコードとしてページに表示されます。これらのうち、ID が Docrine クエリの別の ID と等しいかどうかを確認する必要があります。つまり、一致がある場合: 2=2 、 3=3 は何かを表示し、そうでない場合: 2=3 は別のものを表示します。
FOREACH を 2 回と IF ELSE ステートメントでこれを実行しようとしていますが、ページで 2 つの結果が得られます。
...等。
レコードが 2 回繰り返される理由は理解できますが、正しい結果を得る正しい方法はわかりません。誰か助けてくれませんか?私がしている愚かなことがあれば、私の謝罪。:)
zend-framework - 1 つの単語ではなくフレーズでの Lucene Zend ファジー マッチ
クエリ フレーズの照合に Zend Lucene を使用しようとしていますが、あいまい一致が必要です。
現時点では、PhraseQuery を使用して「valentin rossi」を検索すると (DB には「valentino rossi」があります)、結果がありません。PhraseQuery は文字列「valentin rossi」を正確に検索するため、言葉。
実用的な解決策を探す必要がある場所を教えてください。前もって感謝します!
zend-lucene - ZendLuceneドキュメントの削除の問題
zendluceneを使用してドキュメントを削除しようとしています。以下は私のコードです
これを実行してインデックスフォルダを確認すると、この_f4t5_1.delのように作成された新しいファイルがあります。
しかし、検索を行うと、削除されたドキュメントが検索で利用可能になり、
$ index-> numDocs();
このメソッドも、削除の前後で同じカウントを返します。
どんな助けでも大歓迎です。
php - ネイティブ PHP プロジェクトでの Zend 検索の統合
Zend 検索をネイティブ PHP プロジェクトに統合したいと考えています。あらゆる種類のインクルード エラーが発生しています。
いくつかの調査を行ったところ、zf2 より前に書かれた古い記事がたくさんあるようです。zf1 では、以前は簡単でした。lucene.php をインクルードすれば完了です。
ただし、zf2 のリリース以降、検索コンポーネントは zf2 のスケルトンの一部ではなくなり、個別にダウンロードできるようになりました。Lucene.php をインクルードすると、スクリプト スターがクラスの欠落について不平を言います。(問題を含む)
すべてのファイルをインクルードする必要がありますか、それともある種のオートローダーを使用する必要がありますか?
php - zend lucene での逆句検索
基本的に、 Locationとcityの 2 つのテーブルがあり、都市には city_name と country_code があります。ロケーション テーブルの location_name フィールドにはロケーションがあります。所在地の国を知りたい。
私のテーブル構造。
シティテーブル
ロケーションテーブル
そこで、Zend Lucene 検索を使用して、city テーブルの 2 つのフィールド (country_code と city_name) にインデックスを付けました。テーブルの場所から場所の名前を取得し、キーワード クエリを使用して Lucene インデックスを検索します。
「都市」という用語のために、一致するものがたくさん見つかりました。そこで、フレーズ検索を変更することにしました。"Kansas city, mo" this のようなフレーズ検索をしましたが、結果は見つかりませんでした。それで、キーワード「カンザスシティ、モ」に対して「カンザスシティ」を検索したいことに気づきました。逆検索を行うことは可能ですか、とにかく場所テーブルのインデックスとの関係を作成して国コードを見つけることは可能ですか。
zend-framework - Zend Lucene でのエンコードの問題
Zend_Lucene、特に文字エンコーディングに問題があります。
私はフランス人なので、たくさんの特殊文字を保存する必要があります...
そこで、zend_lucene エンジンをセットアップして、テキストを保存しようとしました。
残念ながら、Zend_Lucene がそれらの文字を読み取ることができなかったかのように、テキストは不適切な文字で保存されます (確認のために cfs ファイルを開きました)。
しかし、デフォルトのエンコーディングを UTF-8 に設定しました。入力は UTF-8 です...
私が得たアイデアは、Windows を使用しており、Zend_Lucene によって作成されたファイルが UTF-8 ではないためです。しかし、UTF-8 を作成する方法、またはこれを構成する方法がわかりません。
何か考えはありますか?
zend-framework - Zend Lucene はドキュメントを削除します
インデックス ファイルのドキュメントの削除について質問があります。
私はこれを持っています:
そして、私はLukeを使用します(インデックスファイルを開くことができます)
したがって、削除する前に、インデックスエントリに表示されます。そして、このエントリを削除した後もインデックス ファイルに存在しますが、フォルダーには _c0_del などのファイルが表示されます。これが正常な場合、削除後にインデックス ファイルに自分のエントリが表示されますか? または、私のコードにエラーがありますか? 作ってみます
ZendSearch /library/ZendSearch/Lucene/Index.phpの delete メソッドで。そして、それは私にヌルを与えます。それは正常ですか?delete メソッドがインデックスからドキュメントを物理的に削除する場合、またはこのドキュメントが削除されたことを示すフラグを設定するだけですか? 私は lucene をおそらく 2 年前に使用しており、インデックス ファイルからドキュメントを物理的に削除します。そのため、削除後、Luke を介してインデックスに自分のエントリが表示されません。