私はアルファベット{A, B, C}とこのアルファベットの上に(大きな)数の単語を持っています:(
AAABBCABBCCCCAA, ABBBCCC, BBBBCACAC, ...異なる長さ、異なる組み合わせ)
これらの単語を説明できる正規表現のセット(小さいほど良い)を探しています。(BC)+私はコンパクト(より)が好きBCBCです。宿題ではありません。
- これを行うための良い方法は何ですか?
- すでにこれを行っているPythonパッケージはありますか?
この質問は関連していることがわかりました。
更新:私はよりも好き(BC)+だと言ったときに急いでいたかもしれませんBCBC。私はできるだけ少ない表現を使用することを好みます(最悪の場合、文字列ごとに1つの正規表現があります)。したがって、、、または説明のいずれか(たとえば)の優先度はA+、AA他AA+のAA文字列が示すパターンに依存する必要があります。