問題タブ [relevance]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - Solr - スコアは常に 0 になります
私はSolrが初めてです。Web ページのインデックス作成と検索結果の取得を行いました。しかし、すべての結果は
「スコア」= 0 「ブースト」= 0
その結果、検索結果が正しくソートされません。現在、私の結果は Web ページの URL に基づいて辞書順にソートされています。クエリで fl=*,score を指定しています。
Webページの「コンテンツ」フィールドをインデックス化するために、次のパラメーターを指定しました
フィールド名="コンテンツ" タイプ="テキスト" 格納された="true" インデックス付き="true" termVectors="true" termPositions="true" termOffsets="true" omitNorms = "false
助けてください...
mysql - MySQLクエリの順序は1ですか?
クエリ:
戻り値:
スーパーマリオルイージ:インサイドストーリーはスーパーマリオルイージの前に来ることになっています。私は何が間違っているのですか?
ありがとう!
nltk - NLTK を使用した固有表現認識。抽出したキーワードの関連性
NLTK の Named Entity Recognition 機能を調べていました。抽出されたキーワードのうち、原文と最も関連性が高いキーワードを特定することはできますか? また、抽出したキーワードの種類(人・組織)を知ることは可能ですか?
php - 「関連性に基づく」検索を設計していますか?
私のアプリケーション (PHP/MySQL/JS) には、検索機能が組み込まれています。検索基準の 1 つには、さまざまなオプションのチェックボックスが含まれています。各オプション。
つまり、オプションは A と B であり、オプション A と B の両方を検索すると、オプション A のみを含む結果 1 は 50% の関連性があり、オプション A と B の両方を含む結果 2 は 100% の関連性があります。
以前は、フォーム入力に基づいて単純な SQL クエリを実行していましたが、これはデータのように "%query%" のように単純ではないため、少し難しくなりますが、一部の結果は一部の検索クエリにとってより価値があります。そうでないものもあります。
どこから始めればいいのかまったくわかりません...関連する(はっ!)読み物を教えてくれる人はいますか?
編集:熟考した後、SQLスクリプトを使用して生データを取得し、その後に何度も何度も解析を行う必要があると考えています...
しかし、キャッシュ可能なものはありませんか?:(
sql - SQL には、文字列内のテーブルとキーワードの位置が含まれます
全文検索について質問です。
機能するクエリがありますが、それを改善したいと考えています。たとえば、「最善の解決策」を探しているとします。私の結果 (FTS,CONTAINSTABLE,NEAR,ISABOUT,* を使用) には、rank、id、stringという列があります。
したがって、このクエリは私にとって 100% 正しいものであり、すべてRANK
正しいですが、このクエリをより関連性の高いものにしたいと考えています。
文字列内のキーワードの位置がより左側にある場合は、結果の前に表示されます。例えば:
これは可能ですか?もしそうなら、どうすればこの結果を得ることができますか?
sql-server - 全文検索:関連性で並べ替える方法は?
私は全文検索を使用していますが、私のWebサイトでは、ユーザーが数語、著者名(1〜2語)、タイトル(1〜3語)で検索するのが一般的です。
関連性検索のようなものが必要で、すでにランクでcontainstableを使用しようとしましたが、結果は非常に悪かったです。
また、ISABOUT
適切な重み付けを使用して、考えられるすべての組み合わせで使用しようとしています。結果は問題ありませんが、速度は非常に遅くなります。4語以内で検索すると、約30Kの行に10〜20秒かかります。
私の質問は:
何か案は?
php - PHP と MySQL - クリック数と時間に基づく人気のリンク
現在、人気のあるリンクを総クリック数で並べ替えています。しかし、各訪問のタイムスタンプもあります。総クリック数だけでなく、時間も考慮してリンクを並べ替え、最も関連性の高いものだけが一番上に表示されるようにするにはどうすればよいですか?
algorithm - 関連性/値の一致ツリーのアルゴリズム
以下で説明しようとしているパターン/アルゴリズムの名前はありますか?...
次のような関連データのツリーがあるとします。
- IDE
- ビジュアルスタジオ
- ビジュアル スタジオ 2008
- ビジュアル スタジオ 2010
- エクリプス
次に、「Visual Studio 2010」への参照を含むオブジェクトがあります。
次に、このオブジェクトで「Visual Studio」の関連性検索を行い、この一致の関連性を知りたいと考えています。
これは、ノード間に特定の値を個別に設定してツリーを構築するときに最適な方法ですか、それとも、たとえば、1 レベル離れた場所に 10 ポイント、2 レベル離れた場所に 5 ポイントなどを設定できますか?
複数のノードが他の複数のノードにリンクされる可能性があります。それともこれは悪い考えですか?Visual Studio も「Microsoft ソフトウェア」などです。
これも2Wayにすることはできますか?ツリーの上と下の両方にポイントがあります。
これは、何らかの関連エンジンをテストして構築するための私の最初の考えです。ある種の軌道に乗せるのを手伝ってください。
solr - Solrは、ランダムなフィールド値が変更されると、ドキュメントのスコアを変更します
スコア表示ドキュメントを1つずつ並べ替えたSolr結果セットを前後に移動する必要があります。これを視覚化するには、最初にドキュメントタイトルのリストがユーザーに表示されます。次に、ユーザーはタイトルの1つをクリックして詳細を表示し、元のリストの次のドキュメントに戻ることなく移動する機会が必要です。別のタイトルをクリックします。
ドキュメントの表示中に変更されます:ドキュメントがすでに表示されている(他の検索で使用されている)ことを示すために、動的フィールドが変更されます(または作成されたものはまだ存在しません)。
私が直面している問題は、これらの変更を保持するためにドキュメントが変更され、インデックスが再作成されると、同じクエリの変更(つまり、スコアの変更)の結果セットでの位置が変わる場合があります(常にではありませんが、非常に厄介です)。ドキュメントのフィールドの1つでソートされた結果を参照する場合は発生しません)。そのため、「前へ」/「次へ」のナビゲーションが正しく機能しません。
スコア計算のフィールドにカスタムの重み付けやブースターを使用していません。また、参照中に変更された動的フィールドは、レコードセットを参照するために使用されるクエリには参加しません。
したがって、質問は次のとおりです。クエリに含まれていないドキュメントのフィールドを変更すると、関連性スコアが変更される可能性がありますか?そして、可能であれば、どうすればそれを制御できますか?
アップデート
私はいくつかのテストを行い、以下を追加できます:
フィールドが修正されていない場合でも、ドキュメントは結果セット内の場所を変更します。ドキュメントをリクエストし、フィールドを変更せずにインデックスを再作成すると、次に同じインデックスに対して同じクエリが実行されたときに別の場所になります。
これは、結果セットが明示的にソートされている場合でも発生するため( "first_name DESC")、スコア(更新日によって異なります)は関係しません。ドキュメントは同じままで、フィールド結果セットの並べ替えは同じですが、位置が変わります。
それを回避する方法はまだわかりません。