問題タブ [text-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - Google の「もしかして?」アルゴリズムの仕事?
ポートフォリオ管理ツールの社内 Web サイトを開発しています。多くのテキスト データ、会社名などがあります。「もしかして: xxxx」というクエリに非常に迅速に応答するいくつかの検索エンジンの機能に、私は本当に感銘を受けました。
ユーザーのクエリをインテリジェントに取得し、生の検索結果だけでなく、「もしかして?」で応答できる必要があります。可能性の高い代替回答がある場合の応答など
[私はASP.NETで開発しています(VB - 私に反対しないでください!)]
更新: OK、何百万もの「無料ユーザー」なしでこれをどのように模倣できますか?
- 「既知」または「正しい」用語ごとにタイプミスを生成し、ルックアップを実行しますか?
- 他のよりエレガントな方法はありますか?
eclipse - Zend Studio for Eclipse でファイルを見つける最も簡単な方法は何ですか?
Zend Studio for Eclipse で、数十のフォルダーと数百のファイルのツリー ビューをルーティングすることなく、ファイルをすばやく検索できるようにしたいと考えています。
私が本当に求めているのは、入力時にファイル名をフィルタリングするものです。Mac のスポットライト、または Vista のスタート メニューのフィルターを考えてみてください。
.net - Programmatically search for text in a PDF file and tell the page number?
There are some tools which allow to extract the whole text portion of a PDF file in order to full text index the PDF.
What I need is a way to search for certain strings and, if thery were found in the PDF file, return the page number?
c# - プログラムで本の単語を検索する方法は?
本を検索して、特定のキーワードを含むすべてのページと行を一覧表示できるアプリケーションを開発する必要があります。
章と節ごとに分割されている聖書など、他の方法で分割されている本の場合。特定のキーワードを含むすべての節を検索できます。または、特定の章や節内でキーワードを検索します。
本はどのような形式で保存すればよいですか? SQL データベースに格納する必要がありますか?
保存するのに最も簡単な形式とは対照的に、検索するのに最も簡単な形式はどれですか?
java - 数十の JAR ファイル内のどこかにクラスを見つけますか?
大量の jar ファイル内で特定のクラス名を見つけるにはどうすればよいでしょうか?
(それを参照するクラスではなく、実際のクラス名を探します。)
wpf - WPF コンボボックスのハイライト
WPF では、コンボ ボックスにテキストを入力すると、入力したテキストから始まるアイテムが強調表示されます。この強調表示は、コンボ ボックスに入力したテキスト全体を検索します。しかし、代わりに、テキスト検索で最初の文字のみに一致するようにします。これを行う方法?
実は、TextSearch.Text を常に最初の文字にしたいのです。
c++ - 「w」を含む文の最初の単語を見つける方法
「w」文字を含む文の最初の単語を見つけるにはどうすればよいですか.この文字は単語のどこにでも存在する可能性があります.文の例「こんにちは xyzwy! ここで何をしていますか?」したがって、結果は「xyzwy」になるはずです。
php - IPアドレスの高速ファイル検索アルゴリズム
質問
次のようにソートされたIPアドレスを含むファイルにIPアドレスが存在するかどうかを確認する最も速い方法は何ですか。
制約
- データベースなし(例:MySQL、PostgreSQL、Oracleなど)
- まれな前処理が許可されます(可能性のセクションを参照)
- クエリごとにファイルをロードする必要がないのはいいことです(131Kb)
- 5メガバイト未満のディスクスペースを使用
- 追加のPHPモジュールはありません
ファイルの詳細
- 1行に1つのIPアドレス
- 9500行以上
可能な解決策
- ディレクトリ階層(基数木?)を作成してから使用します
is_dir()
(残念ながら、これは87メガバイトを使用します)
python - Python - テキスト検索の関連性スコアを計算するライブラリ
私の考えは、MySQL MATCH / AGAINST キーワードと同様の実行を実現することです。
テキスト検索の関連性スコアを計算する Python ライブラリを知っていますか?
満足のいく答えが得られない場合は、MySQL への Python コネクタを使用します。
c++ - テキスト内のいくつかの文字列の 1 つを検索するための効率的なアルゴリズム?
受信したそれほど長くないテキストを検索して、特定の文字列が出現するかどうかを調べる必要があります。文字列はセッション全体で一定であり、多くはありません (~10)。さらに単純化すると、どの文字列も他の文字列には含まれません。
現在、とのブースト正規表現マッチングを使用していstr1 | str2 | ...
ます。このタスクのパフォーマンスは重要なので、改善できないかと考えています。ブースト担当者よりも優れたプログラミングができるわけではありませんが、専用の実装は一般的な実装よりも効率的です。
文字列は長期間にわたって一定のままであるため、状態遷移表のようなデータ構造を事前に構築する余裕があります。
たとえば、文字列がabcx
、 、bcy
およびcz
であり、これまで読んだabc
ことがある場合、 を意味する結合状態にあるはずyou're either 3 chars into string 1, 2 chars into string 2 or 1 char into string 1
です。x
次に、次を読み取るとstring 1 matched
状態などに移動し、以外の文字xyz
は初期状態に移動し、に戻る必要はありませんb
。
どんなアイデアや参考文献も大歓迎です。