オプションで、単語内の不明な位置でハイフンでつながれ、連続する行に分割されている特定の単語をテキスト ファイルで検索したいと考えています。
例えば。次の範囲内の「ハイフン付き」に一致:
This sentence contains a hyphena-
ted word.
最も近い (魅力的でない) 解決策:
"h\(-\s*\n\s*\)\?y\(-\s*\n\s*\)\?p\(-\s*\n\s*\)\?h\(-\s*\n\s*\)\?e\(-\s*\n\s*\)\?n\(-\s*\n\s*\)\?a\(-\s*\n\s*\)\?t\(-\s*\n\s*\)\?e\(-\s*\n\s*\)\?d"
私よりも強力な regex-foo が、検索対象の単語を明確に含む正規表現を考え出すことができることを願っています。そこに「ハイフネーション」を表示したいと思います。次のようなものをエンコードする方法が見つかりませんでした(「hy-ted」と一致するため、とにかくバグがあります):
"{prefix-of:hyphenated}{hyphen/linebreak}{suffix-of:hyphenated}"
ドキュメントを前処理してそのような単語を折りたたむと検索が簡単になることはわかっていますが、関連するツールのためにこれが不可能なコンテキストで使用できる正規表現を探しています。