問題タブ [text-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 特定の文字列を含むすべての配列エントリを取得します。これは、互いに隣り合っており、最初の行の前の行です
次のようなPHP配列があります。
項目 6 から 9 を取得して、それらを新しい配列に入れたいと思います。
これを行うには、次のようにする必要があります: 星と同じ文字数を持つ限り、任意のコンテンツが存在できる星を使用することに注意してください。文字数に関係なく、任意の入力が可能なハッシュタグを使用します。
- 次の構文を使用して、配列内の最後のエントリを見つけます。
"****-**-** **:**:** [INFO] Showing # objective(s) on scoreboard"
- 次の構文を使用して、直接続くエントリをすべて取得します。
"****-**-** **:**:** [INFO] - #: displays as '#' and is type '#'"
- それらを配列に入れます
私は本当にこれに基づいています。正規表現が役立つことは間違いありませんが、理解できませんでした。
前もって感謝します
**編集: **非常に重要なことを完全に忘れていました。このコメントを読んでください。
python - 索引付けされていないテキストファイルで単語を検索する最速の方法 - Python
150 万行、1 行あたり約 50 ~ 100 語のテキスト ファイルを考えてみます。
単語を含む行を見つけるには、使用os.popen('grep -w word infile')
するよりも高速なようです
Pythonでテキストファイル内の単語を検索するには、他にどのようにすればよいでしょうか? その大きな unindex テキストファイルを検索する最速の方法は何ですか?
jena - テキスト検索を実装するための既存の Apache Jena TDB の Lucene インデックスの作成
大規模な Apache Jena TDB があります。新しいテキスト検索機能で使用するために、Apache Jena 2.10.2 を使用して Lucene インデックスを構築したいと考えています。ドキュメントに従うのは難しいと思います。
最初にコードで構成を使用しようとしましたが、依存関係に問題がありました。lecene-core と solr-solrj を組み合わせると、特定の「classNotFound」エラーまたは「StandardAnalyzer overrides final method tokenStream」エラーが発生します。コードの例:
唯一の解決策は Text Dataset Assembler を作成することだと思いますが、これをコードで作成することについてアドバイスがある場合は、その方法で行うことをお勧めします。
php - 数字のパターンを検索
全文から電話番号を検索したい。(122) 221-2172 または 122-221-2172 または (122)-221-2172 のようなパターンの任意の数字にすることができます PHP の助けを借りて、その数字が文のどの部分に存在するかわかりません。 substr を使用できます。
java - Lucene サンプル クエリ
「ph1 ph2」というフレーズで検索すると、「ph1」または「ph2」を含むテキストが見つかります。
1) フレーズ ("ph1 ph2") で検索する方法は誰でも知っています。例: これは文 ph1 ph2 です。2) 距離が最大のフレーズ ("ph1 ph2 ~3")。例 この ph1 は文 ph2 です。
PS 標準の Lucene Indexer を使用してファイルのインデックスを作成しました。この例が明確でない場合は、http://www.lucenetutorial.com/lucene-query-syntax.htmlを参照してください。
完全なコードは次のとおりです。
oracle - Oracleテキスト検索の単項NOT演算子
あるセクションに特定の値を含み、別のセクションに特定の値を含まないレコードを返すテキスト検索クエリを作成しようとしています。
そんな感じ:
NOT 演算子には 2 つのオペランドが必要なため、このクエリの構文は正しくありません。また、最初のオペランドとして % を使用してみました:
それもうまくいきません。
テキスト検索で必要なものを達成する方法はありますか?
ありがとうございました。
scrollbar - Vb.net の Web ブラウザー コントロールでテキスト/フレーズを検索する
Web ブラウザ コントロールを使用して、Windows アプリケーションに HTML テキストを表示しています。ここで、HTML テキスト内のテキストまたはフレーズを検索できる機能が必要です。
それで、誰でもこれを行う方法を見つけるのを手伝ってもらえますか? コントロールにスクロール バーがある場合は、テキストが長すぎてスクロール バーが原因で検索されたテキストが表示されない場合、テキスト/フレーズの検索後にフォーカスが検索されたテキスト/フレーズに移動し、それに応じてスクロールが下がる必要があります。
また、ユーザーが「take」という単語を選択して検索をクリックすると、コントロールから正確な単語/フレーズが検索されます。大文字と小文字を区別した検索はしたくありません。ユーザーが「take」と入力すると、「Take」または「TAKE」または「take」を検索する必要があります。したがって、大文字と小文字を区別する検索も必要ありません。
問題を解決するために私を助けてください。
前もって感謝します。
node.js - MongoDB/Node.js での全文検索-mongoose-text-search
mongoose-text-search プラグインを使用して、MongoDB と Node.js で全文検索を実行しようとしています。https://github.com/aheckmann/mongoose-text-searchのサンプル コードに従っています。コードを以下に示します。「Error: text search not enabled. undefined」というエラーが表示され続けます。Installing plugins for mongoose - Getting errorの指示に従って、MongoDB サイトに移動しました: http://docs.mongodb.org/manual/チュートリアル/テキスト検索を有効にします。ただし、次のコマンドを入力してテキスト検索を有効にした後:
mongod --setParameter textSearchEnabled=true
ターミナルでアプリケーションを起動すると、追加のエラーが発生します。「MongoError: E11000 duplicate key error index: meddb.tweets.$id_1 dup key: { : null } This is error: Error: text search not enabled undefined」
このエラーに遭遇し、その回避策を見つけた方がいらっしゃいましたら、不足しているものや変更が必要なものをお知らせください。
grep - テキスト ファイルから複数のキーワードを検索し、出力をフォーマットする
次の問題で困っています。
複数のテキスト ファイルから検索したい単語のリストがあるとします。たとえば、keywords.txt には次のものがあります。
他の多くのテキスト ファイルで個々のキーワードを検索したいと思います。うまくいけば、検索の出力は次のようにフォーマットできます。
つまり、キーワードに基づいて出力をソートしたいと考えています。
grep を使用して少し進歩しましたが、よくわかりません。1) キーワードに基づいて grep の出力をソートする方法。2) キーワードを含む行だけではなく、文全体を出力する方法 (grep のデフォルトの動作)。
どんな提案でも大歓迎です。