問題タブ [overlapping-matches]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - C# 複数文字列一致
パターンの複数回の出現に一致できる C# 文字列検索アルゴリズムが必要です。たとえば、パターンが「AA」で文字列が「BAAABBB」の場合、正規表現は一致結果のインデックス = 1 を生成しますが、結果のインデックス = 1,2 が必要です。正規表現にそのような結果を強制することはできますか?
mysql - MySQL で日付範囲の重複を確認する
このテーブルは、セッション (イベント) を格納するために使用されます。
範囲間で競合が発生することは望ましくありません。2010-01-05から2010-01-25へ
の新しいセッションを挿入する必要があるとしましょう。
競合するセッションを知りたいです。
これが私のクエリです:
結果は次のとおりです。
それを取得するより良い方法はありますか?
python - Pythonのfinditer()との重複一致
テキスト内の聖書の一節の参照と一致させるために正規表現を使用しています。現在の正規表現は
これは、次の式とうまく一致します。
しかし、それは解析に失敗します:
(None, 'in', '2', None, None, None, None)代わりに戻るからです。
重複している場合でも、finditer()にすべての一致を返すようにする方法はありますか、またはこの最後のビットに適切に一致するように正規表現を改善する方法はありますか?
ありがとう。
php - 連続する整数を見つけるための正規表現
PHP で正規表現コードを正しく動作させるのに苦労しています。これが私のコードです:
このコードを実行すると、次のように出力されます。
123、234、345、456 と一致するようにするにはどうすればよいですか?
前もって感謝します!
algorithm - 重複範囲の比較
質問は実際には言語に依存しませんが、Scala 構文を使用してこの質問をします。
2つのリストがあるとします
testresultそして、 の一部の要素と重なっているのすべての要素を見つけたいと思いますgroundtruth。
私は次のようにこれを行うことができます:
しかし、これはO(testresult.size * groundtruth.size)実行に時間がかかります。
この結果を計算するためのより高速なアルゴリズム、またはexistsテストをより効率的にできるデータ構造はありますか?
PSアルゴリズムは、次のような式で動作しgroundtruth、testresult生成されるはずです。つまり、リスト内の範囲間の関係について保証はなく、Rangeの平均サイズは 100 以上です。
haskell - 重複パターン一致
次のコードがあります。
それを GHCi (7.0.3) にロードすると、次のようになります。
これはバグですか、それとも何か不足していますか?
以下が成立します。
アップデート:
を使用して{-# LANGUAGE OverloadedStrings #-}います。
perl - 複数の配列で重複する二量体をカウントするにはどうすればよいですか?
Perl を使用して、複数のシーケンスで重複するダイマー (AA、AG、AC、AT、GA、GG、GC、GT、CC、CG、CA、CT、TT、TA、TG、TC) の数をカウントする必要があります。次のコードを書きましたが、1 つのシーケンスでしか機能しません。複数のシーケンスに拡張するにはどうすればよいですか?
私は欲しい:
- 各シーケンスのカウントと
- 合計数
入力例:sample.txt
python - 範囲タプルのリストを重複する範囲に折りたたむ
この問題を解決するための最もメモリ効率の良い方法を探しています。
文の部分的な文字列の一致を表すタプルのリストがあります。
各タプルの最初の値はマッチの開始位置で、2 番目の値は長さです。
アイデアは、リストを折りたたんで、最長の継続文字列の一致のみが報告されるようにすることです。この場合、次のようになります。
最長の重複しないシーケンスを見つけるアルゴリズムのように、最長の範囲だけは必要ありませんが、すべての範囲を最長のもので折りたたむ必要があります。
ご参考までに、私は Aho-Corasick の純粋な Python 実装を使用して、静的辞書内の用語を特定のテキスト スニペットに一致させています。
編集: これらのタプル リストの性質上、重複しているが自己完結型ではない範囲は個別に出力する必要があります。たとえば、betazandという単語zetaが辞書にある場合、 の一致betazetaは[(0,5),(4,8)]です。これらの範囲は重複していますが、他の範囲には何も含まれていないため、答えは になります[(0,5),(4,8)]。このケースがカバーされるように、上記の入力データセットも変更しました。
ありがとう!
r - 2 つのファイル間で重複する値を探す
Start、End、および Chromosome 列名をそれぞれ含む 2 つのデータ セットがあります。2 つのファイルの値を比較し、(開始、終了、クロムの位置を考慮して) 重複していない領域があるかどうかを確認し、R を使用してそれらをリストに含めたいと考えています。両方のファイルからデータ ポイントを取得し、それらを比較します
ファイル例 1:
ファイル例 2:
ありがとう