私はアルファベット{A, B, C}
とこのアルファベットの上に(大きな)数の単語を持っています:(
AAABBCABBCCCCAA, ABBBCCC, BBBBCACAC, ...
異なる長さ、異なる組み合わせ)
これらの単語を説明できる正規表現のセット(小さいほど良い)を探しています。(BC)+
私はコンパクト(より)が好きBCBC
です。宿題ではありません。
- これを行うための良い方法は何ですか?
- すでにこれを行っているPythonパッケージはありますか?
この質問は関連していることがわかりました。
更新:私はよりも好き(BC)+
だと言ったときに急いでいたかもしれませんBCBC
。私はできるだけ少ない表現を使用することを好みます(最悪の場合、文字列ごとに1つの正規表現があります)。したがって、、、または説明のいずれか(たとえば)の優先度はA+
、AA
他AA+
のAA
文字列が示すパターンに依存する必要があります。