問題タブ [freetext]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - SQL 全文検索と LIKE 検索のパフォーマンスの比較
インターネットで検索してみたところ、通常は全文検索の方がパフォーマンスが優れていることがわかりました。
この投稿の指示に従って、シソーラス テーブルを自分のマシンにセットアップし、それをいじって全文検索に慣れることができるようにしました。
Microsoft SQL Server Management Studio 2008 ですべてを表示しています。
クエリを実行すると。私の検索は、ほとんどの wiki サイト/ページで見つけたものと矛盾する検索LIKE
よりも高速であることに気付きました。FREETEXT
以下は、私が実行したクエリです。
LIKE
検索には 0 秒かかりましたが、検索FREETEXT
には 6 秒かかりました。
LIKE
検索では 70 行が返されますが、FREETEXT
検索では 94 行が返されるため、FREETEXT
検索の精度と結果が向上します。
FREETEXT
LIKE 検索よりも検索が非常に遅くなる原因となる何かが欠けていますか?
FREETEXT
より多くのヒットを返す (より多くのデータを収集する) ため、プログラムで検索を使用したいと思っていますが、速度が重大な問題でした。
助けてくれてありがとう!
sql - SQL FREETEXT 検索のエスケープ スペース
データベースにシソーラス テーブルがあり、FREETEXT を使用してデータを収集したいと考えています。ただし、検索している文字列にはスペースが含まれています。
たとえば、コード「AB 001」を検索したい
このコードは "AB" と "001" の両方を検索するため、より多くのジャンク結果が得られます。文字列を二重引用符で囲んでみましたが、うまくいきません。
完全な「AB 001」文字列を検索するにはどうすればよいですか??
LIKE を使用したところ、目的の結果が得られましたが、私の場合ははるかに高速で正確な結果が得られるため、全文検索を試してみたいと思います。
ありがとう!
編集
を使用してみCONTAINS
ましたが、追加の結果が得られたので、なぜ返されたのか理解できませんでした。このCONTAINS
機能は私にとっても機能しません:/
sql - 全文検索が機能しない (FREETEXT - CONTAINS)
フリーテキストはテーブルからすべての単語を返しません。そして含まれていません
mycolumn="Life of a King" に含まれる行が 1 つあります。
私は2つの方法を試しました。最初の「含む」
それは何も返しません
2番:
237 行が返されます。これは;
「ライフ オブ パイ」「イッツ ア ワンダフル ライフ」「ライオン キング」「キング アーサー」「ライフ ストーリー」「ライフ オブ ア キング」など…
「Life」+「of」+「a」+「King」の単語のみを含む行を返したいです。
返信ありがとうございます。
sql-server-2008 - フリーテキストでの null の処理
を使おうとしていますFREETEXT
。@name フィールドには null が含まれることがよくありますが、これはプログラムのエラーではありません。これは、他の検索アプローチが使用されていることを意味します。
もともと持っていた
私は試した
しかし、私はまだ得る
メッセージ 7645、レベル 15、状態 2、行 3 Null または空の全文述語。
これを回避するための良いアプローチは何ですか?
追記
また、スローとエラー
hive - HBase で Hive を使用すると、応答時間が短縮され、Web アプリケーションに適していますか?
このビデオでは、Hive が遅い応答時間でデータをレンダリングすることが示されました。
Hive と HBase の統合が Web ベースのライブ実行アプリケーション (CRUD) に適しているかどうか、また、フリーテキスト検索 (LIKE を使用するだけでなく) が可能かどうかを知りたいです。
ビデオでは、読み取りベースであることを示していますが、常に更新があります:)。
ありがとう。
awk - フリー テキスト キーワードの重複をパーセンテージ マッチで特定する
私のデータベースには、小さな変更を加えて頻繁に作成および再作成される名前のタイトルがいくつかあります。手動で目で確認すると、スペルがわずかに変更された重複として簡単に識別できます。例えば
々。私が探しているのは、重複として検索しているキーワードのパーセンテージ一致を提供するソリューションです。ソースセットは十分に大きくないかもしれませんが、参照セットは何百万ものデータになる可能性があります. したがって、潜在的な mysql の「一致」はスケーラブルではありません。また、リファレンス セットは mysql と sphinx にインデックスが付けられています。現在の複製ロジックは、すべての複製を完全にキャプチャするわけではありません。例えば私によると、これらはすべて重複しています。しかし、4番目はまったく捕らえられていません。私はそれらが同じように見えることを理解していますが、母音やその他のものを排除することで比較した後のいくつかのパーセンテージが役立つでしょう. ほとんどの場合、推奨される解決策は「php-sphinx」を使用することです。これは、そのほとんどが既に準備ができているか awk であるためです (可能であれば、適度に快適でもあります)。そうでない場合は、オープン ソース (python/perl など) のロジックで十分です。
java - iText FreeText 注釈の自動サイズ変更長方形
このコードを使用してフリー テキスト注釈を作成します
できます。私の問題は、Acrobat で表示すると、Word3 のテキストが幅で切り取られ、Word1 と Word2 のみが表示されることです。フリー テキストの注釈をクリックすると (テキストを変更するため)、3 つの単語が表示され、長方形の境界が正しく展開されます。
PdfAnnotation.createFreeText() の自動サイズ変更機能はありますか? BaseFont の getWidthPoint() を使用して、フォント サイズとフォントに基づいて文字列の幅を取得しようとしましたが、うまくいきませんでした。このコードは、昇順と降順、および左右にいくつかのパディングを含むフリーテキスト注釈を作成します。これは、注釈の表示が 3 番目の単語で途切れる原因と考えられます。
どんなアドバイスでも大歓迎です