問題タブ [open-search-server]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - Open Search Server で RESTFul API を使用しながらファセットを使用してフィルタリングする
RESTFul API を使用して、Open Search Server でファセットを使用して検索結果をフィルタリングするにはどうすればよいですか?
次の URL を使用しています (検索フィールド テンプレート、テンプレートの名前は「検索」で、/search を Apache から Tomcat にプロキシしています):
http://domain.com:8080/search/services/rest/index/intranet/search/field/search
次の JSON が機能します。
lang
値"en"
に 450 個のドキュメントがあることを示すという名前のファセットがあります。だから、私はこれを試しました(レンダラー機能に基づいて):
文字列内のすべての用語が解析され、代わりにクエリに追加されたことがわかります。
私は Open Search Server を使用しています1.53
。
web-crawler - Web クローラーを使用して関連する URL を取得する
opensearchserver を使用して Web サイトをクロールしています。今、特定の URL に関連するすべての URL を取得したいと考えています。アイデアは、誰かが Web サイトで記事を読むと、ページの下部に関連記事のオプションが表示されるというものです。opensearchserver を使用してこれを行うにはどうすればよいですか? これは可能ですか?そうでない場合、そのようなことを行うことができる他の Web クローラーはありますか?
ありがとう
web-crawler - Open Search Server の設定タイムアウト
OpenSearchServer で Web クローラーを使用していますが、クロール中にExtracting url list
アクション中にスタックしてしまいます。また、セッションを終了するときにスタックすることもあります。何かの実行に時間がかかりすぎる場合に中止するように、時間制限またはタイムアウトを設定する方法はありますか?
regex - OpenSearchServer MSG パーサー
v OpenSearchServer 1.5.13 を使用しており、ネットワーク共有上の MSG ファイルを解析し、MSG パーサーを使用するためのインデックスをセットアップしようとしています。
MSG パラメーターを構成して、email_display_from、email_display_to、creation_date をインデックス フィールドから、To、Date にインデックス付けします
基本的に、JSON API を使用して電子メール フィールドの Date、From、および To を使用しようとしていますが、結果が常に空になることがわかります。
また、email_display_to の正規表現は次のようになり\bTo.*\.com\b
ます。設定が間違っていたら教えてください。
上記のインデックスを MSG ファイルで機能させるための正規表現は何ですか?
これらのフィールドをデフォルトのレンダラー ビューと JSON API の結果に表示したいと考えています。
search - OpenSearchServer の検索結果でサムネイルを取得する
私が管理している Web サイトの Google カスタム検索に代わるものが必要です。それは、Web サイトをクロールし、インデックスを作成し、優先順位を調整し、REST または類似のものを介して検索クエリを許可し、XML または JSON などを返すものでなければなりません。 . Windows Server インスタンスで実行する必要があります。
それで、私はhttp://www.opensearchserver.com/を起動して実行していますが、それはうまくいくようですが、私の人生では、結果にサムネイル画像を取得する方法を見つけることはできませんか? 私はドキュメントを検索し、できる限りすべてを読みましたが、これを行う方法 (またはそれを理解する方法) を見つけることができません。
私は標準的な Web ページをクロールしていますが、それらにはすべてサムネイル メタ データが含まれています。これは何らかの形で結果を解析し、JSON の結果に含めることができると思いますか?
どんなポインタでも非常に役に立ちます、ありがとう!