私は、Python で Oracle ソース コード ファイルを検索するための「grep のような」ユーティリティに取り組んでいます。コーディング標準は時間の経過とともに変化したため、「テーブル a.foo からのすべての削除」のようなものを見つけようとすると、そのコードの経過時間に応じて、複数の行にまたがる場合とそうでない場合があります。
s = """-- multiline DDL statement
DELETE
    a.foo f
WHERE
    f.bar = 'XYZ';
DELETE a.foo f
WHERE f.bar = 'ABC';
DELETE a.foo WHERE bar = 'PDQ';
"""
import re
p = re.compile( r'\bDELETE\b.+?a\.foo', re.MULTILINE | re.DOTALL )
for m in re.finditer( p, s ):
    print s[ m.start() : m.end() ]
これは以下を出力します:
DELETE
    a.foo
DELETE a.foo
DELETE a.foo
私が欲しいもの:
[2] DELETE
[3]     a.foo
[7] DELETE a.foo
[10] DELETE a.foo
文字列インデックスを行番号にマップするための迅速/簡単/組み込みの方法はありますか?