大量のテキスト内で文字列の出現箇所を見つける必要があるプロジェクトがあります。検索文字列はより大きなテキストに存在することが知られていますが、私の制御の及ばない理由により、いくつかの単語の間にスペースがないため、空白が正しくありません。
たとえば、検索する文字列は ( brownとfoxの間のスペースの不足ではありません:
quick brownfox jumps
そして、私はこれを見つける必要があります:
The quick brown fox jumps over the lazy dog.
干し草の山を変更して、見つかった用語を識別タグでラップできるようにする必要があるため、最終的には次のようになります。
The <span class="found">quick brown fox jumps</span> over the lazy dog.
検索用語からすべての空白を取り除き、各文字の間に\s*を追加することを検討しましたが、これはパフォーマンスに恐ろしい影響を与える可能性があると考えました(正規表現の専門家はそれを確認または拒否できますか?)。
調べるべき非正規表現の解決策はありますか。
ありがとう