問題タブ [hit-highlighting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - SQLServerフルテキストクエリの結果をヒットハイライト表示する方法
SQLServer2008をデータベースとして使用するWebアプリケーションがあります。ユーザーは、データベース内の特定の列に対して全文検索を行うことができます。SQL Serverのフルテキスト機能は、ヒットの強調表示をサポートしていないようです。これを自分で構築する必要がありますか、それともこれを行う方法に関するライブラリや知識がありますか?
ところで、アプリケーションはC#で記述されているため、.Netソリューションが理想的ですが、翻訳できるので必要ありません。
java - lucene でヒット ハイライターを使用する
Apache Lucene で提供されるヒット ハイライターに関して 2 つの質問があります。
この関数を参照してください。トークン ストリーム パラメータの使用について説明していただけますか。
多くのフィールドを含むいくつかの大きな lucene ドキュメントがあり、各フィールドにはいくつかの文字列が含まれています。これで、特定のクエリに最も関連するドキュメントが見つかりました。クエリ内のいくつかの単語がドキュメント内の単語と一致した可能性があるため、このドキュメントが見つかりました。クエリ内のどの単語がこれを引き起こしたのかを知りたいです。そのため、Lucene Hit Highlighter を使用する予定です。例: クエリが「skin doctor delhi」で、「dermatologist」というタイトルのドキュメントに「skin」と「doctor」という単語が含まれている場合、ヒットを強調表示した後、クエリから「skin」と「doctor」を分離できるはずです。私はこの数週間、このためのコードを書こうとしてきました。欲しいものを手に入れることができません。私を手伝ってくれますか?
前もって感謝します。
アップデート:
現在のアプローチ: ドキュメント内のすべての単語を含むクエリを作成します。
小さな文書には機能しますが、大きな文書には機能しません。次のスタックトレースが取得されます。
このアプローチが大規模なドキュメントに対して不合理であることは明らかです。これを修正するにはどうすればよいですか?
ところで、私は FuzzyQuery マッチングを使用しています。
dtsearch - dtSearch で、フレーズごとに 1 つのヒットを強調表示するのではなく、フレーズごとに 1 つのヒットを強調表示するようにする
dtSearch を使用して、ドキュメント内のテキスト検索の一致を強調表示しています。これを行うためのコードは、いくつかの詳細とクリーンアップを除いて、おおよそ次の行に沿っています。
dtSearch に次のような引用句クエリを指定すると、
"監査証跡"
次に、dtSearch は次のようにヒットの強調表示を行います。
<a name="HH_0"/><b>監査</b> <a name="HH_1"/><b>トレイル</b>は、<a name="HH_2"/ ><b>監査</b> <a name="HH_last"/><b>トレイル</b>について!
フレーズの各単語が個別に強調表示されていることに注意してください。代わりに、次のようにフレーズをユニット全体として強調表示したいと思います。
<a name="HH_0"/><b>監査証跡</b>は、<a name="HH_last"/><b>監査証跡</b>を持つと楽しいものです!
これにより、A) ハイライトの見栄えが良くなり、B) ユーザーがヒットからヒットへと移動するのに役立つ JavaScript の動作が改善され、C) 合計ヒット数のより正確なカウントが得られます。
このように dtSearch でフレーズを強調表示する良い方法はありますか?
java - luceneはクエリで一致する用語を取得します
Luceneでヒットとして返された特定のドキュメントと一致するクエリ内の用語を見つけるための最良の方法は何ですか?
lucene contribのヒットハイライトパッケージを含む奇妙な方法と、クエリ内のすべての単語を最上位のドキュメントに対して検索する方法( "docId:xy AND description:each_word_in_query")を試しました。
満足のいく結果が得られませんか?ヒットの強調表示は、最初のドキュメント以外のドキュメントに一致した単語の一部を報告しません。2番目のアプローチが最良の選択肢であるかどうかはわかりません。
ruby-on-rails - 太陽黒点のハイライトが表示されない
強調表示の解決策を見つけるために、github: http://github.com/outoftime/sunspotのドキュメントを調べましたが、うまくいかないようです。
私の Job モデルには次のブロックのようなものがあります (意図的にいくつかのフィールドを省略しています):
私はこれを持っています。これは結果を返します:
ヒットをそのまま取得します:
これがクエリの結果で、名前が表示されています。
ここに私の問題があります..ハイライトを取得すると、何も返されませんでした:
これでも、ハイライト ヒットを返しません。
他のフラグや引数がありませんか?
hit-highlighting - Googleブックスはスキャンした画像のテキストをどのように強調表示しますか.
ここでキーワード検索を行うと:
http://books.google.com/ebooks/reader?id=s1gVAAAAYAAJ&printsec=frontcover&output=reader&pg=GBS.PA7
「フロー テキスト」で強調表示されたテキストは簡単に見えますが、「スキャンされたページ」を表示するように切り替えても、強調表示されたテキストが表示されますか? 彼らがこれをどのように達成したかは誰でも知っています。
sql-server-2008 - SQL Server 2012 FTS は、ヒットの強調表示をネイティブでサポートしますか?
Sql Server 2008 は、その FTS 機能でヒットの強調表示をネイティブにサポートしていません。現在、さまざまな手法を使用して独自に実装する必要があります。Microsoft は、将来の SQL Server リリースにこれを含めることについて、あいまいな発言をしています。
SQL Server 2012 FTS がヒットの強調表示をネイティブでサポートするかどうか知っている人はいますか?
sql-server - SQL Server の全文検索から一致したデータのみを返す方法は?
そのため、「ヒットの強調表示」に関してSOを調査しましたが、私が望むものに近いようです。しかし、FTS検索から一致したデータだけを単純に返す明確な方法は誰も持っていないようです。
だから私は具体的に尋ねています - それについて私が見つけた他のすべての投稿は少し不安定であるか、単に機能していないからです.
ありがとう...
solr - Solrと単語を一致させる方法は?
Solrを使用して単語一致ヒットリストを作成します。これにより、特定の単語のすべての出現箇所がコンテキストとともに表示されます。
英語の例:
コンテキストのサイズをカスタマイズできることが重要です。(1文以上の場合もあります。)
私の質問:Solrでこれを行うにはどうすればよいですか?
Lucene 4.1は、たとえばFastVectorHighlighterを使用してこれを行うことができます。
しかし、どうすればSolrに同じことをするように依頼できますか?
私の試用版はこれ(solrconfig.xml)でした:
しかし、それは常に(ドキュメントごとに)1つの大きなフラグメントを提供しますが、すべてのオカレンスを提供するわけではありません。
ありがとう、スティーブ
sql-server - SQL Server 2005 BLOB データ ヒットの強調表示
、およびファイルVARBINARY(MAX)
を格納している列を持つテーブルがあります。Microsoft Office 2010 と Adobe の両方に iFilter をインストールしています。これらは SQL Server 2005 に登録されており、ドキュメント タイプは次のクエリに表示されます。.docx
.xlsx
.pdf
CLR プロシージャなどを使用して BLOB データのヒット ハイライトを実装する方法があるかどうか疑問に思っています。どこから始めればよいかわかりません。
SQL Server 2005 がヒットの強調表示をネイティブにサポートしていないことは知っています。それを可能にするプラグインがあることも知っています: http://www.interactivethoughts.com/products/thinkhighlight/、しかし、サードパーティのソフトウェアを使用することはできません。それはカスタム実装でなければなりません。