正規表現のリストを解析して、それぞれが特定のテキスト/文字列で一致する可能性を計算したいと思います...
例えば。長さ 1 の文字列で' ' を見つける[AB]
と、約 1/13 になるはずです (大文字のみを考慮して)。
個々の位置/代替を返す汎用正規表現パーサーはありますか? リターンとして位置のリストを取得することを考えています (' ' は ' [AB].A{2}
' を生成し[['A','B'],'.',['AA']
ます)
問題は、pyparsing による正規表現の解析です。単純な正規表現は問題ありませんが、「代替」と繰り返しになると途方に暮れます。「 」のようなネストされた式を解析するのは難しいと思います((A[AB])|(AB))
。
何かご意見は?