Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
正規表現パターンのリストと「\ n」を含む文字列、つまり別々の行の文字列を含むファイルがあります...次のようなことができるように、行全体を正規表現ファイルのパターンと一致させることができる汎用正規表現が必要です
re.compile(r'generic_regex%s') %regex_pattern をファイルから取得すると、grep のように行全体が自動的に一致します。
何か案は??
境界などを調整します...
import re import mmap def find_re(fname, rx): # rx is a compiled re object with open(fname) as fin: mm = mmap.mmap(fin.fileno(), 0, access=mmap.ACCESS_READ) return rx.findall(mm)
シーケンシャルアクセスだけでも高速である必要があります...複数行にまたがる必要がある場合は、正規表現を作り直してください...