私は、Python で Oracle ソース コード ファイルを検索するための「grep のような」ユーティリティに取り組んでいます。コーディング標準は時間の経過とともに変化したため、「テーブル a.foo からのすべての削除」のようなものを見つけようとすると、そのコードの経過時間に応じて、複数の行にまたがる場合とそうでない場合があります。
s = """-- multiline DDL statement
DELETE
a.foo f
WHERE
f.bar = 'XYZ';
DELETE a.foo f
WHERE f.bar = 'ABC';
DELETE a.foo WHERE bar = 'PDQ';
"""
import re
p = re.compile( r'\bDELETE\b.+?a\.foo', re.MULTILINE | re.DOTALL )
for m in re.finditer( p, s ):
print s[ m.start() : m.end() ]
これは以下を出力します:
DELETE
a.foo
DELETE a.foo
DELETE a.foo
私が欲しいもの:
[2] DELETE
[3] a.foo
[7] DELETE a.foo
[10] DELETE a.foo
文字列インデックスを行番号にマップするための迅速/簡単/組み込みの方法はありますか?